APP下载

基于随机森林的雨天车辆跟驰风险行为研究*

2020-06-17黄兆国过秀成

交通信息与安全 2020年1期
关键词:降雨条件车辆

黄兆国 过秀成 贾 亮

(1.东南大学城市智能交通江苏省重点实验室 南京 211189;2.兰州理工大学土木工程学院 兰州 730050,3.东南大学现代城市交通技术江苏高校协同创新中心 南京 211189;4.东南大学交通学院 南京 211189)

0 引 言

降雨天气给道路交通安全带来的威胁日益凸显。据中国道路交通事故年报统计,2017年有12%的交通事故起数和致死人数与降雨天气有关[1];美国国家公路交通安全管理局的数据显示,近10年内与降雨因素有关的交通事故起数和致死人数分别为11%和8%[2]。研究表明,危险跟驰行为是降雨天气下车辆行驶过程中发生交通安全事故的主要安全隐患之一[3]。因此,对降雨天气下的车辆跟驰的风险识别和控制进行研究具有重要意义[4]。

车辆跟驰模型是一类重要的交通流微观模型,目前国内外学者对降雨等不利天气下的车辆跟驰模型研究主要集中在模型建立和参数标定方面[5-6]。李长城等[7]考虑降雨和车辆类型、车道位置、不同时间段的车速等多因素,采用非线性回归方法,建立了雨天车辆跟驰速度的综合预测模型。颜冉等[8]建立了考虑降雨影响的全速度差跟驰模型,并利用美国加州道路上的实际数据对模型进行标定。龚节坤[9]通过引入雨天路面附着率和滑移率建立了考虑路面实时附着条件的跟驰模型。Yang等[10]在跟驰模型中引入最大减速度,并对干燥路面和湿滑路面条件下的跟驰行为进行对比。利用实测的交通和天气数据对雨天车辆跟驰模型进行标定取得了一定成果,但由于实测数据采集手段的局限性,所得模型的适用性也存在一定限制。随着车辆驾驶模拟器在道路交通安全研究领域的广泛应用,国内外学者也逐渐倾向于利用模拟器对车辆跟驰行为进行仿真研究,通过改变仿真实验中相关参数而获取更加全面的数据以提高模型的适用性。柴琳果等[3]对Paramics微观交通仿真软件进行二次开发,实现对危险跟驰的模拟场景建立,并基于车辆最小安全距离跟驰模型提出了危险跟驰预警方法。张存保等[11]在Vissim仿真软件中模拟雾天环境下高速公路交通流运行状态,分析最小安全间距与实时交通安全状态之间的关系。

综上所述,已有研究对雨天等不利天气下的车辆跟驰行为研究主要集中在跟驰模型方面,但对跟驰行为风险性的量化研究还不充分。因此,有必要引入风险控制理论分析降雨条件下的车辆跟驰特征与交通安全之间的潜在关系[12]。目前学者们对于车辆跟驰风险的研究主要集中在正常天气条件下[13]、高速公路施工区[14]、低照度环境[15]及城市快速路[16]等方面,对雨天条件下的车辆跟驰风险研究还较少。因此,笔者结合驾驶模拟软件,采集降雨条件下车辆运行数据,构建了雨天车辆跟驰风险水平的量化判定模型,并基于随机森林算法对该判定模型进行训练和测试,进而对雨天车辆跟驰的风险水平进行准确的量化分析和判定,从而实现降雨条件下可靠、快速的车辆跟驰风险水平判定过程。

1 仿真实验

1.1 仿真场景设置及模拟驾驶员选择

目前,虚拟现实技术(virtual reality,VR)广泛应用于交通安全的微观仿真领域中,能够对交通环境、天气条件、道路线性及驾驶环境等进行较为真实的模拟[17-18]。本文利用UC-winRoad三维虚拟现实软件进行仿真驾驶,模拟降雨条件下城市道路中车辆跟驰行为,进而分析其风险水平。

将兰州市七里河区兰工坪路作为实验道路,在UC-winRoad仿真环境中依据实际道路条件进行驾驶环境的搭建。兰工坪路是双向6车道的城市主干路,全长1.5 km,道路基础设施情况见表1。对实验路段进行交通参数调查用于UC-winRoad中交通运行环境的设置。选取2018年7月23日—26日为调查时间,期间历经晴天、小雨、中雨到大雨天气,设置4个调查点,采用人工和视频调查结合的方法,对经过断面的交通量、车速进行统计。经过数据整理,得到晴天和降雨天气下的交通流参数结果见表2。

在UC-winRoad中搭建得到的仿真路段场景见图1。根据实地调查结果,不同降雨等级下的基本交通量及车速设置如下:小雨2 200 veh/h,45 km/h;中雨2 000veh/h,41km/h;大雨1 800veh/h,37 km/h,各自驾驶场景见图2。选择46名模拟驾驶员,身心状态良好,驾龄均在2年以上,职业包括教师、学生、出租车司机、企事业单位工作人员等,平均年龄33.5岁,其中男性24人,女性22人。每位模拟驾驶员按照要求完成小雨、中雨及大雨条件下的驾驶过程各1次。

表1 实验路段道路基础设施Tab.1 Experimental road section road infrastructure

图1 仿真路段场景Fig.1 Simulation section scene

1.2 仿真数据输出

模拟驾驶的输出数据包括:①驾驶员编号及基本信息;②降雨等级、路面附着系数等雨天条件信息;③驾驶过程中时间戳、距离、速度和加速度等车辆运行信息;④车辆燃料消费量及CO2排放量,此类数据不作为下文中模型输入数据。图3为驾驶员编号为id-10(女性、教师)在大雨条件下的其中1段模拟驾驶输出的速度和加速度变化情况。

2 雨天车辆跟驰风险水平判定模型建立

2.1 改进的安全距离模型

雨天车辆跟驰过程中,前导车与跟驰车需要保持一定的安全距离。当2车距离小于安全距离时,跟驰风险上升,跟驰行为过程见图4。

传统安全距离模型的前提条件是前导车突然原地停止,此时安全距离模型为

式中:S为安全距离,m;v0为跟驰车制动前的初速度,m/s;td为制动迟滞时间,取1.2~2.0 s;amax为跟驰车制动最大减速度,正常天气及良好路面情况下取7~8 m/s2;d为跟驰车辆制动后与前导车之间的安全距离,取2~5 m。

从模型建立的前提和适用条件来看,传统安全距离模型未考虑降雨天气下跟驰车的制动最大减速度变化,且前导车突然原地停止降低这一前提条件与道路交通运行的实际情况不相符,因此基于传统安全距离模型,构建一种考虑以上2类因素的安全距离改进模型,重新标定雨天过程中的停车过程和反应等造成的和常规不同的参数变化。

1)降雨条件下路面积水形成水膜,改变了路面附着系数。不考虑坡度阻力和空气阻力对车辆运行的影响,则跟驰车在降雨条件下的最大制动减速度为

式中:为降雨条件下最大制动减速度,m/s2;φ为路面附着系数;g为重力加速度,9.8 m/s2。

2)引入减速度的增长过程以避免前导车突然原地停止的问题,增加驾驶员对雨天驾驶环境的反应时间,则改进的车辆安全距离模型为

图2 雨天驾驶场景Fig.2 Rainy driving scene

图3 UC-winRoad输出数据举例Fig.3 UC-winRoad output data example

图4 单车道车辆跟驰行为示意图Fig.4 Schematic diagram of the following behavior of single lane vehicles

式中:tr为驾驶员反应时间,根据已有研究,小、中、大雨时分别取1.0 s,1.5 s,2.0 s;ti为减速度的增长时间,取0.1~0.2 s。

2.2 雨天车辆跟驰风险的影响因素

雨天车辆跟驰发生风险的主要原因是降雨条件和跟驰车辆运行状态的变化,结合2.1中安全距离的计算以及UC-winRoad仿真实验的场景设置、输出数据,筛选得到风险水平判定模型的影响因素见表3。

表3 风险水平判定模型的影响因素描述Tab.3 Model influence factor description

将车辆跟驰风险的影响因素用矩阵形式表示,设降雨条件p下的第k个样本的车辆运行状态向量为upk,则upk可以表示为

式中:p为降雨条件,p=1,2,3分别对应小、中、大雨条件下不同的水膜厚度和附着系数参数;k为样本数量,总计138个;upk1,upk2,…,upk6为上述车辆运行状态的6个参变量。

2.3 风险水平判定模型

雨天车辆跟驰行为中的风险因素彼此相互联系,跟驰风险也表现出非线性、复杂性特点。当以上因素的影响结果超过一定阈值时,综合作用下跟驰车辆所处的环境会从平衡状态跃迁到不平稳状态,这种系统紊乱的程度可以用风险熵来衡量。风险熵越高,车辆跟驰行为越危险,反之熵值越低,车辆跟驰越安全。

综合2.2中影响因素分析,降雨条件p下的第k个样本车辆在跟驰时间段T内的风险熵可以表示为

式中:Hpk为风险熵;upk为降雨条件p下的第k个样本的车辆运行状态向量;t为发生跟驰行为的时刻;T为跟驰行为的总时间。

结合风险等级定理表,对风险熵所属的风险水平进行定义,根据计算出的风险熵值的大小判定该跟驰状态所属的风险水平,确定风险熵值对应的风险水平见表4。

表4 风险水平判定Tab.4 Risk level discrimination

由此可得降雨条件下车辆跟驰风险水平判定的流程见图5。

图5 雨天车辆跟驰风险水平判定流程Fig.5 Process of car-following risk level on rainy day

3 基于随机森林的雨天车辆跟驰风险水平判定模型

3.1 RF提取风险特征

随机森林(random forest,RF)是一种机器学习模型,其实质是用随机的方法建立1个由多棵决策树组成的森林,且森林内部每一棵决策树之间不存在任何关联。此算法能够在运算量没有显著提高的前提下提高预测精度,且对多元共线性和非平衡的数据比较稳健,因此能够用于非线性函数关系的训练和学习。

RF在模型中的首要作用在于对UC-winRoad中的仿真数据进行学习,输入矩阵为降雨条件下的车辆运行状态影响因素数据集,输出结果为RF提取到的车辆跟驰过程中的风险特征。由2.2已知降雨条件p下的第k个样本的车辆运行状态影响因素向量为upk,定义经过RF提取到的风险特征矩阵为Gpk,表示降雨条件p下的第k个样本在跟驰过程中由于降雨、速度或加速度等因素而造成的风险特征,则Gpk可表示为

RF提取风险特征的过程可以表示为

式中:p,v,a为降雨、速度和加速度因素;gs为风险特征;s为特征数量;f为RF中运算的非线性函数关系。

3.2 RF输出分类结果

基于RF算法对UC-winRoad中仿真数据进行学习后,还需输出雨天车辆跟驰风险水平的判定结果,由2.3节可知,输出结果为英文字母A,B,C,D和E,分别代表不同的风险水平。RF中的每1棵分类树均为二叉树,其生成遵循自顶向下的递归分类原则。按照节点纯度最小原则,1棵二叉树分裂成左节点和右节点,且分别包含训练学习后数据的1个子集,依次分裂后直到满足分支停止规则而停止生长。

1)构建j棵分类树,应用bootstrap法有放回地从风险特征矩阵Gpk中随机抽取j个新的自主样本集。

2)设有θ个变量,则在每1棵树的每个节点处随机抽取θ个变量,然后在θ中选择1个最具有分类能力的变量,变量分类的阈值通过检查每1个分类点来确定。

3)使每棵树最大限度地生长,即不做任何修剪。

4)将生成的多棵分类树组成随机森林,并利用每一颗树被选择的概率大小p(y=j|θ|) 来判定风险水平 j。

因此,基于随机森林的雨天车辆跟驰风险水平判定模型的运算过程分为3个阶段:①输入UC-winRoad中的仿真数据,包括驾驶员信息、降雨条件及车辆运行状况相关数据;②RF提取风险特征矩阵Gpk;③RF对风险特征进行判定,对每1个样本的风险水平进行分类,最终获取风险水平判定结果。

4 实验结果分析

4.1 实验数据描述

采用UC-WinRoad仿真软件和RF算法对雨天车辆跟驰风险水平进行判定,实验数据包括3个部分:①UC-winRoad模拟驾驶中的降雨、速度和加速度信息;②通过安全距离模型计算所得的前导车辆与跟驰车辆之间的距离;③根据风险熵公式计算所得的跟驰车辆的风险熵及由此判定的风险水平。通过核算,46名驾驶员在小、中、大雨条件下的3次模拟驾驶中,最多跟驰次数为11次,最少跟驰次数为7次,平均9次,共计1 242次,由此获取了1 242条风险水平判定结果,即实验中数据量也为1 242条。将138次模拟驾驶中前7次跟驰行为的数据作为训练集,后2次的数据作为测试集;经核查,有9条数据的跟驰次数为7次,取前5次跟驰行为的数据作为训练集,后2次的数据作为测试集,最终所得训练集、测试集数据量分别为957条、285条。实验在Matlab R2016a平台上通过编程完成。

4.2 性能指标选取

为了衡量此模型对风险水平判定结果的优劣,选取平均绝对误差(MAE)和平均相对误差(MRE)这2个常见指标进行分析,这2个指标的计算方法见式(8)~(9)。

4.3 RF参数确定

1)确定决策树的个数。根据2.3节中风险水平判定分析,确定决策树的个数为5。

2)确定特征参数类别的个数。特征参数类别的个数与雨天车辆跟驰风险影响因素的类别有关,根据2.2分析可知,影响因素包括降雨条件和车辆运行状态2个大类9个特征参数,为避免遗漏其他影响因素,再加入1个随机特征参数,共计10个特征参数。

3)调试决策树的深度。决策树的深度即递归次数影响RF预测的精度,经测试,当递归次数小于30次时,运算时间在10 s之内,满足时效要求;当递归次数超过30次时,训练速度明显变慢,且MAE和MRE变化并不明显,因此将递归次数确定为30次。

4.4 结果分析与验证

RF算法中对每1次模拟驾驶中的前7条跟驰行为数据进行训练,后2条跟驰风险水平数据进行测试,得到图6中的结果,图中横坐标为测试样本编号,纵坐标为风险水平判定结果。从图6可以看出,经调试后的RF对雨天车辆跟驰风险水平的判定结果准确率较高,绝大多数判定结果的预测值都落在了实际值所在的风险水平散点上;为方便分析,将风险水平判定结果按照由A到E的顺序重新排列得到图7,能够看出预测结果的偏差也较小,大部分在1级以内,说明本文中的雨天车辆跟驰风险水平判定模型在RF算法中得到了良好的运用。

图6 RF算法测试结果Fig.6 Test results of RF algorithm

图7 重新排列的RF算法测试结果Fig.7 Rearranged test results of RF algorithm

对每类风险水平判定结果的预测值误差进行汇总,得到MAE和MRE的平均值分别为0.69和8.35%,符合精度要求,各风险水平判定结果的误差值见表5。

表5 5种风险水平的测试误差Tab.5 Test error of five risk levels

为验证RF算法在风险水平判定方面的优越性,选择传统机器学习中的2种经典算法对本文中雨天车辆跟驰风险行为的数据进行测试,分别为人工神经网络(artificial neural network,BP-ANN)[19]和支持向量机(support vector machine,SVM)[20],并对测试结果的误差进行对比分析。

对BP-ANN和SVM中的参数进行设置。BP-ANN是1个包含输入层、隐含层和输出层的3层神经网络结构,输入层与影响因素类型相关,设置为9层;输出层与风险水平类别相关,设置为5层,隐含层与模拟驾驶行为次数相关,故设置为140次;激活函数选择ReLU函数。对SVM中参数进行设置,核函数选取高斯径向基函数。

经测试得到3种模型的性能指标结果,见表6。从表6可以看出:①BP-ANN模型的判定结果较差,这是因为BP-ANN网络结构只有3层,隐含层的深度不够,与输入层和输出层之间的神经元连接过于简单,因此在风险特征的训练方面有所欠缺;且由于隐含层神经元数量过多,运算时间明显高于其他2种算法;②SVM的判定结果较优,风险水平判定偏差稍大于1级,误差率相比RF较高,这是因为SVM模型对于判定分类问题的处理方式是直接给类别打分并作为输出,而RF算法则是由随机森林中的决策树对样本进行反复判断,通过比较决策树被选择的次数来确定判定结果,因此说明RF中的递归算法在判定风险水平问题中有更优的结果;③RF算法的准确性均高于另外2种算法,平均相对误差比BP-ANN和SVM分别降低了10.36%和4.54%,特别是MAE小于1表现出本文中模型对风险水平判定的优越性,这是因为RF中对决策树个数设置的标准较低,且本文中确定特征参数类别时增加了1个随机参数,这就避免了运用RF进行人工提取特征因素时容易出现的漏提现象,进而降低了预测误差。

表6 3种机器学习算法的测试性能指标对比Tab.6 Comparison of predictive performance indicators of three machine learning models

5 结束语

笔者对传统安全距离模型进行改进,并结合UC-winRoad模拟驾驶所得数据,引入风险熵,构建了基于随机森林的雨天车辆跟驰风险水平判定模型,通过调试算法参数对风险水平进行预测。经实验表明,当决策树个数为5,深度为30,特征参数中增加1个随机参数,即总计为10时,预测性能最佳。本文仅考虑了降雨条件和车辆运行状态两方面的影响因素,下一步将增加驾驶员特性,并从模型自变量的量化分析中得到驾驶员行为对车辆跟驰风险产生的影响,并将基于实车测试数据开展相关研究。

猜你喜欢

降雨条件车辆
排除多余的条件
Veejet80150喷头特性及其在降雨机中的应用
选择合适的条件
龙王降雨
车辆
泥石流
冬天路滑 远离车辆
为什么夏天的雨最多
提高车辆响应的转向辅助控制系统
认同或对抗——论执政条件下的党群关系互动