APP下载

基于改进LSTM-NN 的安全性自动驾驶换道轨迹规划模型

2021-12-22熊明强

汽车工程学报 2021年6期
关键词:轨迹神经网络曲线

熊明强,谯 杰,夏 芹

(1.汽车噪声振动和安全技术国家重点实验室,重庆 401122;2.中国汽车工程研究院股份有限公司 重庆 401122)

自动驾驶近年受到全世界广泛关注[1-10],普遍认为该技术可以有效解决交通拥堵,提高交通安全性[1,6,11]。目前一些自动驾驶厂商已经进行了大规模的道路测试,比如谷歌自动驾驶汽车和苹果自动驾驶汽车。然而,由于交通系统的复杂性,现在的自动驾驶或多或少都存在着一些安全性问题,导致这些自动驾驶车辆在进行测试时发生了一系列事故,其主要原因是自动驾驶车辆内部的自动驾驶算法不足以应对动态变化的交通环境。据研究[12],目前近三分之一的交通事故是由不安全的换道操作导致的。

利用机器学习进行人类换道执行模型属于数据驱动模型,其模型参数需要经过大量换道执行数据的训练而确定。目前,利用机器学习进行人类换道轨迹规划的研究还很少[13-15],YAO Wen 等[13]将k最近邻算法应用到换道轨迹规划中,然而该模型用到的数据量非常有限;考虑到已有的机器学习算法只能预测换道车辆的位置,DING Chenxi 等[14]构建了两层BP 神经网络对车辆换道进行实时预测,该模型对NGSIM 数据[16]进行学习,在已有研究的基础上扩大了数据量。但是,换道数据是一种时间序列,以上两种机器学习方法只是单一的复制车辆在某个状态下的位置,并没有考虑到换道时每个规划步长之间的换道数据存在联系[17]。在此基础上,XIE Dongfan 等[15]构建了LSTM 神经网络对车辆换道轨迹进行预测,对于人类换道轨迹学习取得了99%以上的精度。尽管都是在对人类换道行为进行学习,但这些研究没有考虑到换道过程中产生的安全性问题,而基于规则的换道模型对于换道轨迹的数学描述不统一,产生了大量的轨迹曲线方程,比如极坐标多项式轨迹和五次多项式的轨迹等[18-27]。此外,对何种方程可以最佳地描述换道轨迹曲线尚无定论,当前对换道过程的运动学模型描述也有较大的误差,考虑到现有方法存在的不足,本文对LSTM 神经网络进行了改造,提出了一种新的基于安全性敏感的改进长短期记忆网络的自动驾驶换道轨迹规划模型。

1 改进LSTM 神经网络换道模型

1.1 改进LSTM 神经网络结构

用传统运动学描述自动驾驶换道轨迹规划的方式存在着误差大、无法发现隐形因素之间的关系、不能充分利用真实数据等方面的不足。LSTM[28]神经网络可以弥补以上不足,且相对其他深度学习方法可以更好地处理时间序列数据,但经典LSTM 神经网络无法对换道数据的安全性进行判别和校验,因此选择LSTM 神经网络进行改进。传统LSTM 神经网络主要由“遗忘门、输入门、输出门、状态”组成,这些“门”结构实际上是全连接神经网络构成的,如图1 所示。

图1 经典LSTM 神经网络结构

LSTM 神经网络有着高效的学习优势,这种神经网络被认为是研究和预测时间序列极佳的方法,但由于神经网络中隐层神经元的物理作用不明确,训练过程不可控,这样建立的换道轨迹规划模型可能隐含着人类不良驾驶习惯,最终无法满足安全性和舒适性的换道要求,所以在传统LSTM 神经网络中引入“安全门”,在训练过程中对数据进行安全性监控和校验,有目的地提高模型安全性,“安全门”输入的运动学轨迹包括最优轨迹约束和安全性约束数据,从而提出安全性敏感的自动驾驶换道轨迹规划LSTM 神经网络模型,嵌入结构如图2虚线框所示。

图2 改进LSTM 神经网络结构

在这个结构中,神经网络的输入数据xt包括换道车辆以及周边车辆的轨迹数据,xt将会同时被传递给各个“门”结构以及嵌入的运动学模型结构,进行神经网络的迭代训练。改进之后的LSTM 神经网络如图3 所示。

图3 改进LSTM 神经网络结构

1.1.1 神经网络各个部分的计算方式

当前时刻数据传入长短期记忆网络时要决定哪些历史数据需要从细胞状态ht-1中删除。这是由遗忘门决定的:

式中:Wf为遗忘门的权重;ht-1为上一时刻神经网络的状态;xt为NGSIM 数据中换道轨迹规划数据;bf为遗忘门的偏置项;σ为一个sigmoid 函数,用于增强神经网络的非线性拟合能力,其表达式为:

神经元删除历史数据后还需决定哪些新的信息需要被存储进细胞状态:输入门中包括一个类似于遗忘门的结构,用于在训练过程中决定需要更新的数据,然后一个tanh 函数会从当前时刻的输入数据中确定更新的向量,从而更新到神经元状态中:

式中:Wi为输入门中决定遗忘的数据权重;bi为对应的偏置项;~Ct为准备更新的数据矩阵;Wc为更新数据的权重矩阵;bc为更新数据的偏执项。tanh 为双曲正切函数,同样用于增强神经网络的非线性拟合能力,其函数表达式为:

最后决定将要输出的部分。输出通过一个sigmoid 函数层来决定Ct中哪些部分需要被更新,然后将Ct经过一个tanh 函数处理(归一化),并将遗忘门里sigmoid 层的输出相乘,从而决定输出,如式(8)所示。

式中:Ot为神经元的预测输出值;Wo为输出门的输出权重;bo为输出门偏置项。

改进后更安全的原因如下,改进前细胞状态为:

这样,更新的数据值很有可能等于遗忘的数据值,如初始状态[ht-1, 0.5xt]经过遗忘门之后细胞状态变为[ht-1, 0.5xt],而输入门更新的数据又恰是0.5xt,那么经过输入门以后,细胞状态变回为[ht-1,0.5xt]。显然,这对于自动驾驶换道的安全性是无法保证的,所以提出的改进LSTM 神经网络模型弥补了经典LSTM 神经网络在自动驾驶车辆换道轨迹规划安全性方面的不足,使训练过程变得部分可控,改进后的细胞状态为:

输出为:

式中:Pt为车辆在运动学模型经过归一化处理后的动力学输出值。

经过多次试验,该模型将改进的LSTM 神经网络的层数设置为两层,隐层神经元个数为8 个。输入变量确定为纵向位置x0,横向位置y1和速度v0,输出变量为下一时刻规划的速度,采取的神经网络学习率是0.01。

1.2 换道轨迹规划运动学模型

由于车辆行驶过程中要求加速度连续变化,所以自动驾驶换道轨迹所采用的多项式曲线不应少于3次,为了避免多项式曲线次数太高造成的参数求解过于复杂,将多项式曲线确定为三次多项式曲线。其表达式为:

式中:a0、a1、a2、a3为需要后期确定的参数;xn为换道车辆纵向位置;yn为换道车辆横向位置。

确定各项参数有:

式中:θi为规划步长起点的航向角。

1.3 避撞算法

Gipps 模型[29]是领域内经典的车辆安全距离模型,可以较好地拟合两辆跟驰车辆之间的行驶状态,但其将车辆视作质点,没有考虑车辆的车身长度,所以在经典Gipps 模型的基础上加入车身长度进行改进,作为三次轨迹曲线的约束条件。

车辆换道过程中受到周围车辆实时的影响,为了保证换道过程的安全性,需要实时检测周围车辆的行驶状态,并对周围车辆的行驶状态进行预测。

式中:j为车辆n-1;xj(t0)和vj分别为当前状态各个车辆的纵向位置坐标和速度;xj(t)为t时刻车辆j的纵向位置坐标。

Gipps 模型求解的是当前车辆紧急停车时,后车在经过反应时间τ后也采取紧急停车动作,从而不和前车发生碰撞的速度。在经典的Gipps 模型中,车身的长度没有被考虑到,也没有考虑到实际跟驰过程中前后两车的时变速度,针对此情况,对经典Gipps 模型进行改进,如图4 所示。

图4 安全距离示意图

后车紧急制动距离如式(17)和式(18)所示:

2 模型验证

2.1 训练数据和测试数据

使用的是美国联邦高速公路公布的NGSIM[16]数据。作为高精度且高可靠性实车数据,其被广泛应用于车辆研究[30-32]。NGSIM 数据包括车辆位置、速度等,非常符合仿真研究的要求。更多详细的介绍参见相关文献。数据采集选用的两段高速公路路段,如图5 所示。

图5 NGSIM 高速公路路段示意图

2.2 训练结果

对于基于LSTM 神经网络的换道轨迹规划模型训练和测试,同样基于Python 通过深度学习的Tensorflow 框架搭建所需的LSTM 神经网络。

在迭代过程中,训练误差随着迭代次数的增加而变化的情况如图6 所示。在迭代次数小于20 次时,训练误差下降较快,随着迭代次数的增加,训练误差下降缓慢。迭代次数达到25 次左右时,训练误差趋于收敛。因此,将基于LSTM 神经网络的换道轨迹规划模型的迭代次数设为30 次。

图6 迭代次数设为30 次

2.3 不同训练结果对比

如图7 所示,蓝色曲线是理想的安全性换道轨迹曲线,黄色曲线是本模型预测的换道轨迹曲线,绿色曲线是真实换道轨迹曲线。由图可知,经过本模型的训练和预测,输出的轨迹曲线更靠近安全性换道轨迹曲线,又保留了一些人类原始换道轨迹曲线的特征且比人类更早地完成了换道。

图7 神经网络学习效果

2.4 误差统计

拟用平均绝对误差(Mean Absolute Error,MAE)以及平均绝对相对误差(Root Mean Squared Error,MARE)这两个统计学中常用的统计量对模型进行误差统计:

式中:N为测试数据样本数;dr,i为第i辆车的真实值;ds,i为第i辆车的预测值。

针对实际情况,定义如下:MAEreal和MAREreal分别表示预测值与真实值的平均绝对误差和平均绝对相对误差,这两个统计量可以表征实际值和预测值的误差。

本节对改进LSTM 神经网络的输出轨迹和真实轨迹进行误差统计,结果显示,两个统计量数值都比较小,见表1。

表1 误差对比表

2.5 基于CarSim 的仿真验证

CarSim 是用于车辆动力学的专用仿真软件,该软件可以对驾驶员、路面条件以及空气动力等方面进行仿真输入,对车辆制动性、稳定性参数等进行输出。CarSim可以方便灵活地定义试验环境和试验过程[33]。

将提出的深度学习模型输出的车辆轨迹数据作为CarSim 输入,拟用该软件对模型轨迹进行可跟踪性、平稳性等参数的评估。

图8 显示了CarSim 在车辆换道成功场景下的换道轨迹、加速度输出结果的对比。CarSim 对真实换道轨迹跟踪情况如图8a 所示,其中红色曲线为CarSim 仿真软件对于原始数据的跟踪结果,蓝色曲线为原始轨迹曲线,可以看出CarSim 跟踪的换道轨迹曲线和真实换道轨迹曲线相对存在较大误差。CarSim 对本模型预测的换道轨迹曲线的跟踪情况如图8b 所示,可以看出CarSim 能较完美地跟踪本模型输出的换道轨迹,且轨迹很平滑。CarSim 对真实轨迹的加速度仿真结果如图8c 所示,可以看出真实轨迹的加速度变化较为剧烈,乘客舒适性体验不高。CarSim 对本模型输出轨迹的加速度仿真结果如图8d 所示,可见相对真实轨迹的加速度变化而言,CarSim 对于本模型轨迹曲线加速度仿真结果更均匀,乘客的舒适性体验较好。

图8 CarSim 仿真结果

3 结论

以研究自动驾驶的车辆换道技术为目的,在自动驾驶领域提出一种改进LSTM 神经网络的换道轨迹规划算法。从安全性和效率两个角度入手建立深度学习换道轨迹规划模型,改进LSTM 神经网络模型在一定程度上提高了车辆换道过程的安全性,使车辆一边学习一边利用基于规则算法对轨迹进行安全性监督和修正。另外还验证了改进LSTM 神经网络模型的舒适性和效率比真实轨迹更高,并通过Python 仿真结果分析了换道车辆和周围环境车辆对车辆换道过程的影响。虽然常规换道轨迹规划模型在换道执行过程中对目标轨迹学习精度很高,但是忽略了车辆周围环境的变化,换道车辆无法对突发情况做出反应,因此在安全性方面还存在不足。得到以下主要结论:

(1)利用本模型可以规划出一条合适的自动驾驶换道轨迹,且能保证换道车辆更安全、更舒适地完成换道。

(2)在规划过程中,LSTM-NN 模型可能比人更早完成换道,主要是因为该模型不仅考虑了安全性还考虑了效率。

(3)CarSim 的仿真显示,提出的模型所规划出的换道轨迹和速度能够很好地被自动驾驶跟踪,车辆行驶稳定性良好。

猜你喜欢

轨迹神经网络曲线
未来访谈:出版的第二增长曲线在哪里?
基于神经网络的船舶电力系统故障诊断方法
解析几何中的轨迹方程的常用求法
基于人工智能LSTM循环神经网络的学习成绩预测
MIV-PSO-BP神经网络用户热负荷预测
轨迹
轨迹
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
梦寐以求的S曲线
曲线的华丽赞美诗