APP下载

自动驾驶预测算法简介

2022-03-01邱昱陈彩霞

科学家 2022年1期
关键词:自动驾驶卷积神经网络

邱昱 陈彩霞

摘要:自动驾驶汽车的预测模块基于历史及当前环境状态,预测附近交通参与者的未来状态,以降低风险,减小伤害。本文简要介绍了自动驾驶领域预测算法的重要性、问题定义与各种类型。对于预测算法的两个大类:基于模型的方法和数据驱动的方法,本文对各类具体算法的意义、相关参数、区别与优缺点等进行了简要介绍。

关键词:自动驾驶,预测算法,卷积神经网络,循环神经网络,变形器,图神经网络

引言

近年来,智能驾驶技术发展迅速,安全是重中之重。一方面,安全性是智能驾驶和自动驾驶技术的基石;另一方面,人们期望未来自动驾驶汽车的应用可以降低道路事故发生率,提高道路安全【1】。安全,也就意味着事前尽量降低相关交通参与者遭受伤害的可能性与严重度。要实现这一点,对交通参与者的预测就极为必要。

问题定义

要执行自动驾驶预测任务,前提条件是能够得到安装在自动驾驶汽车上激光雷达、雷达或摄像头等传感器的实时数据流并且存在实时检测和跟踪交通参与者信息的系统。这些交通参与者的信息可以是边界框、位置、速度、加速度、朝向角和朝向角变化率等。此外还需包括自车所行驶区域的地图信息,如道路和人行横道的位置,车道方向。这些地图信息可以用特定方式建模描述:如道路多边形用来描述可通行区域、人行横道多边形描述用于行人横穿的道路区域、车道信息描述行驶路径。

未来轨迹是过去轨迹的后续,那么预测就是基于对过去轨迹的观测提供未来轨迹合理的可能输出【2】。如果对于第 个交通参与者在观测时刻 的历史轨迹,我们用 来表示,其中 , 表示观测序列中的当前时间,则第 个交通参与者的历史轨迹是一个序列 。所有交通参与者的未来轨迹则可以表示为 。

算法介绍

目前,对于轨迹预测的方法,主要分为基于模型和数据驱动的方法两大类【3】。

基于模型的方法

基于模型的方法假设交通参与者按照某种预先定义好的模式运动,根据观测到的历史信息计算模型参数,并进一步预测交通参与者未来的轨迹。基于模型的方法又可以细分为:基于物理特征的模型、基于序列动作的模型和基于交互觉察的模型【4】。

基于物理特征的模型

基于物理特征的模型将车辆视作遵守物理规则的运动实体,基于控制输入、车辆参数与外部状态等对其未来运动进行预测。又可分为基于动力学的模型和基于运动学的模型【5】。

基于动力学的模型要考虑车辆的动力学特征,模型复杂且必要性不高,较少应用。

基于运动学的模型不考虑影响运动的力,基于运动参数(如位置、速度和加速度)间的数学关系描述车辆的运动。包含恒速模型、恒加速度模型、定转弯速率恒速模型和定转弯速率恒加速模型等。

基于物理特征的模型可通过不同方法用于轨迹预测:如单轨迹模拟、高斯噪声模拟和蒙特卡罗模拟。

单轨迹模拟方法直接将模型应用于车辆的当前状态,计算未来轨迹。其优点是计算效率高。缺点是没有考虑不确定情况及模型缺点,因此不适合做长期预测。

高斯噪声模拟方法将車辆的不确定性描述为高斯模型,通过卡尔曼滤波器对车的状态进行预测。较之单轨迹模拟方法,高斯噪声模拟方法能表达预测轨迹的不确定性。

蒙特卡洛模拟方法,对模型输入如速度、方向盘转角进行随机采样,生成预测路径,既可用于当前状态完全确定的情况,也可用于当前状态有不确定性的情况。

基于物理特征的模型依赖于运动的低层级特征,因此仅能用于短于1s的预测。特别是其缺乏对交通规则的理解,没有和其它车辆的交互,无法预测车辆任何运动状态的变化。

基于序列动作的模型

基于序列动作的模型将车辆视作独立的动作实体。基于序列动作模型的轨迹预测基于对驾驶员倾向执行的动作的先期识别,预估与其匹配的车辆其未来运动。较之基于物理特征的模型,基于序列动作模型预测的轨迹更准确可靠。

基于序列动作的模型有两种轨迹预测方法:原型轨迹和动作意图估计。

原型轨迹方法中,车的轨迹可以划分为一系列的簇,每一簇对应一个典型的运动模式。运动模式采用训练阶段学习而来的原型轨迹进行表达。在预测阶段,将车辆实际的待完成的部分轨迹与原型轨迹进行比较,取最相似的原型轨迹用于预测未来的运动。其缺点是对不同道路布局适应性不强。

基于意图的模型主要是分为2部分,一是对意图进行评估,然后再执行。其首先估计驾驶员的动作意图,如停止线等待、跟车和左转等,然后预测后续的相匹配的物理状态。与原型轨迹相比,它不需要将部分轨迹与原型轨迹匹配,而只需要抽取高级特征用于识别动作,从而更容易在任意类型道路布局生成学习模型。

动作执行阶段按匹配的动作将轨迹预测出来,其输入为车辆状态、道路信息和驾驶员行为等。常用方法有多层感知机、逻辑回归、相关向量机、支持向量机和隐马尔科夫模型等。它的输出可以是判定式预测的一条轨迹,也可以是生成式提供的多条轨迹及其概率。

基于动作序列的模型假设车辆之间相互独立运动,没考虑车间交互的影响。而实际车辆是与其它车辆共享道路,一辆车的动作会影响其它车的动作。这种假设会导致对环境信息理解的错误,并影响风险评估。

基于交互觉察的模型

基于交互察觉的模型仍然采用动作序列实体,但将车间交互也进行建模。这使得其对车辆的行为有了更好的解释,对情况有更好的理解并对风险有更可靠的评估。交互察觉模型通常是基于轨迹原型与动态贝叶斯网络。

基于轨迹原型的交互察觉模型在训练阶段并不能将车间影响纳入,但在匹配阶段可通过假设驾驶员有避免碰撞的倾向纳入车间的相互影响。

大多数交互察觉动作模型是基于动态贝叶斯网络。多物体间的两两依赖关系可用耦合隐马尔科夫模型建模。

基于交互觉察的模型比物理模型预测的时间更久,比基于意图的预测更加稳定,计算多个汽车之间的关系计算量比较大,不适用实时风险评估。

数据驱动方法

这类方法通常指的就是深度学习方法,其使用大量数据训练一个黑盒子模型(通常是一个神经网络)。之后将训练好的模型应用于观测到的数据进行预测。模型训练过程通常是离线计算,要消耗较多计算资源。而模型应用于预测时,则非常快速。

深度学习方法应用于自动驾驶的预测时,通常是以多帧相关环境信息为输入,目标交通参与者的未来行为、轨迹、轨迹概率等为输出。主要有四大类方法:卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)、变形器(Transformer)及图神经网络模型(Graph Neural Network,GNN)。

卷积神经网络

卷积神经网络被广泛应用于提取图片数据特征,并在计算机视觉领域取得了成功,也被应用于自动驾驶预测方面。有不同的卷积神经网络模型应用于预测环境车辆的意图、提取相关性特征、输出图形上未来时刻的占据情况和预测车辆轨迹等。但卷积神经网络受限于其卷积核感受野,长距离特征提取能力一般,影响了其应用于预测的效果。

循环神经网络

较之卷积神经网络,循环神经网络具有较好的长距离特征捕获能力。基本的循环神经网络能逼近任何序列对的映射【6】。但由于梯度消失或爆炸,难以学习到长序列。门控循环神经网络被引进用于解决这个问题【7】。长短期记忆网络(Long short-term memory,LSTM)和门控循环单元 (Gated recurrent unit, GRU)是最常用的门控循环神经网络。在车辆行为预测方面,长短期记忆网络是常用的深度模型。循环神经网络擅长处理序列输入,但并行计算能力较差,限制了其在预测领域的应用。

变形器

与卷积神经网络及循环神经网络相比,变形器 (Transformer)并行计算能力与卷积神经网络差不多强,长距离特征捕获能力与循环神经网络差不多强,而语义特征提取能力和任务综合特征抽取能力显著强于卷积神经网络与循环神经网络。其基于注意力(attention)机制,采用编码器-解码器(Encoder-Decoder)框架。最近,其在自动驾驶预测领域的应用较之卷积神经网络、循环神经网络有明显的性能提升,取得了较好的成果。

图神经网络

图神经网络的基本思想是基于节点的局部邻近信息通过神经网络来聚合每个节点及其周围节点的信息。常用的图神经网络有图卷积神经网络(Graph Convolutional Network, GCN)与图注意力神经网络(Graph Attention Network, GAT),分别是将图模型与卷积神经网络及注意力模型相结合。图神经网络可以用节点表示汽车,节点间的连线(边)表示车辆间的关系,适合于包含车间交互信息的预测。近两年,图神经网络发展迅速,其应用于自动驾驶预测领域也取得了较好的效果。

总结

整体来看,自动驾驶预测算法中,数据驱动方法性能优于基于模型的方法。但目前,自动驾驶预测领域还没有形成统一的评估指标、接口定义和框架结构,各个方向都有相关探索,其中,变形器(transformer)和图神经网络(Graph Neural Network)近期性能表现较好。

参考文献:

[1] “Research on the impacts of connected and autonomousvehicles(cavs) on traffic flow: Summary report,” UK Departmentfor Transport, Tech. Rep., May 2016. [Online].

Available:https://assets:publishing:service:gov:uk/government/uploads/system/uploads/attachment data/file/530091/impacts-of-connected-andautonomous-vehicles-on-traffic-flow-summary-report:pdf

[2] LEE, N., CHOI, W., VERNAZA, P., CHOY, C. B., TORR, P. H. S., AND CHANDRAKER,M. K. DESIRE: distant future prediction in dynamic scenes with interacting agents. CoRRabs/1704.04394 (2017).

[3] SINGH, A. Prediction in autonomous vehicle - all you need to know, 2018.

[4] LEFÈVRE, S., VASQUEZ, D., AND LAUGIER, C. A survey on motion prediction and risk assessment for intelligent vehicles. Robomech Journal (2014).

[5] Lefèvre, S., Vasquez, D. & Laugier, C. A survey on motion prediction and risk assessment for intelligent vehicles. Robomech J 1, 1 (2014). https://doi.org/10.1186/s40648-014-0001-z

[6] B. Hammer, “On the approximation capability of recurrent neuralnetworks,” Neurocomputing, vol. 31, no. 1-4, pp. 107–123, 2000.

[7] A. Graves, Long Short-Term Memory. Berlin, Heidelberg: SpringerBerlin Heidelberg, 2012, pp. 37–45. [Online]. Available: https://doi:org/10:1007/978-3-642-24797-2 4

基金項目:国家重点研发计划资助(2018YFB1802405)

猜你喜欢

自动驾驶卷积神经网络
“自动驾驶”热潮背后的担心和疑虑
汽车自动驾驶的发展
基于卷积神经网络温室智能大棚监控系统的研究
基于深度卷积神经网络的物体识别算法
特斯拉默默更改了官网上“自动驾驶”的说明
特斯拉中国官网不再提“自动驾驶”
基于卷积神经网络的树叶识别的算法的研究