APP下载

基于平稳化长短期记忆网络模型的交叉口交通流量预测

2022-05-19吕心钰

关键词:交通流量交通流交叉口

吕心钰,施 佺

(南通大学 交通与土木工程学院,江苏 南通 226019)

道路交叉口是城市道路中最为常见的交通组织形式。相较于高速公路交通流量预测,道路交叉口交通流量预测的准确度受到交叉口相位设计、车流冲突等多种不确定因素影响,其结果对交通管理与控制有着极为重要的意义。道路交叉口交通状况虽复杂多变,但也呈现出明显的时间、空间特性。时间特性主要体现在交通数据随着时间的推移呈季节性变化;空间特性则体现在相邻交叉口存在着交通流的相互影响。在现有车辆检测器基础上,结合交叉口交通流的时空特性和历史交通流量数据预测未来时段的交通流量,是保障交叉口的交通安全、充分发挥其通行能力的有效途径之一。

近年来,许多学者在提高短时交通流量预测精度上进行了大量研究,主要工作包括两方面:一方面是通过优化调整模型提高预测准确度,主要有梯度提升回归树模型[1]、深度信念网络模型与支持向量回归分类器相结合的模型[2]、门限神经网络模型[3]、季节性支持向量回归器结合卡尔曼滤波的SARIMA(seasonal autoregressive integrated moving average)模型[4]、基于小波分析和季节性时间序列变量模型[5],以及利用堆叠式自动编码器来提取隐藏在交通流数据中的隐式关系的模型[6]等;另一方面则是通过对原始数据进行降噪、归一化的预处理等[7-8]。

以上对于交叉口短时交通流预测均采用较为复杂的算法模型以提高预测的准确性,很少通过对特征值的处理来改善预测效果。因此,为提高交通控制系统对交叉口交通流变化的自适应能力,本文改变了以往学者研究交叉口数据的思维,采用数据自相关性分析的方法将数据序列进行预处理,提出了基于平稳化长短期记忆网络(long short-term memory,LSTM)的交通量预测模型,并利用南通市钟秀中路—北濠桥路正向雷达采集的数据进行实验与分析。通过将大量的实验结果与传统的算法[9-19]进行对比与分析,发现该模型在短时交通流量的预测领域具有计算量小、实时性好的优点,同时该模型对基础数据准确性的容忍度更高,不仅能有效地提高预测准确性,对比其他算法也更加的简单、高效。

1 基于LSTM 时间序列的交叉口短时交通流量预测

1.1 LSTM 网络

LSTM 网络是循环神经网络(recurrent neural networks,RNN)算法[20]的改进,在原算法基础上加入了一个cell,增加了长期记忆功能,让信息不再衰减,从而达到克服RNN 网络梯度消失问题。

LSTM 网络中,增加的cell 通常由遗忘门、输入门和输出门3 个门限结构和1 个状态向量传输线组成。其中,状态向量传输线负责长程记忆;3 个门限负责短期记忆的选择,遗忘门决定如何保留当前时刻该记忆模块的历史信息,输入门决定输入层信息向隐藏层记忆模块的传递,输出门决定记忆模块信息的输出。当信息进入LSTM 网络时,根据设定的规则来判断是否有用,被判断为有用的信息被留下;其余的信息则通过遗忘门被遗忘。LSTM 网络模型原理图如图1 所示,其中,矩形框表示神经网络层,圆形框表示逐点操作。

图1 LSTM 模型原理图Fig.1 Schematic diagram of the LSTM model

信息在网络中的前向传播过程具体如下:

步骤1更新遗忘门。通过Sigmoid 神经层选择允许通过cell 的信息。将输入值ht-1和xt输入到Sigmoid 函数,输出一个数值为0~1 的向量ft,表示各部分信息通过的比重,其中:1 表示所有信息全部通过;0 表示所有信息全部舍弃。

输出向量ft与输入值ht-1、xt的函数关系为

式中:Wf和bf分别表示遗忘门的权重和偏向;σ 表示Sigmoid 函数。

步骤2更新cell 状态值。该过程决定有哪些信息需要更新,并用tanh 层生成一个备选值来替换初始状态值。

中间向量it和与输入向量ht-1、xt分别为

式中:Wi和bi分别为输入门的权重和偏向;WC和bC分别是tanh 层创建的新候选值的权重和偏向。

接着,将状态Ct-1更新为状态Ct,即将Ct-1与信息通过的比重ft相乘,然后按比重舍弃信息。其中,状态Ct的更新方程为

步骤3确定输出值。先通过Sigmoid 层确定输出哪一部分的信息,再将通过tanh 层的状态向量进行处理,并将其和Sigmoid 层的输出权重相乘,得到最后结果。中间向量Ot和输入向量ht-1、xt,输出值ht与Ot函数表达式分为

式中,WO和bO分别为输出门的权重和偏向。

LSTM 网络还包括后向传播过程,从当前时刻t开始,计算每个时刻的误差项并向上一层传播。根据相应的误差项来计算每个权重的梯度,并通过梯度下降法迭代更新参数。

1.2 平稳化LSTM 模型预测交通流

由于交通流具有随时间动态变化的特性,因此LSTM 适用于对交通流数据的分析与预测。交通流数据时间序列是随机时间序列,通常会表现出非平稳特征,因此,需要对原始交通流观测序列{Xt,t=1,2,3,…}的平稳性进行评估。这里采用样本自相关函数(auto correlation function,ACF)获得估计值通过估计值绘制ACF 图判断时间序列状态并确认周期,当自相关函数值超过95%置信区间,且存在明显的拖尾效应时,该序列可判定为非平稳化序列;反之,该序列为平稳化序列。

当交通流序列为非平稳化序列时,可以基于原始交通流序列计算其周期性差分ΔTXt,从而获得平稳化差分序列{ΔTXt,t=1,2,3,…}。这里将平稳化差分序列作为样本集的输出字段重新构建样本集,利用LSTM 预测结果,并将结果还原为原始交通流量。

图2 为LSTM 算法实现的一般流程,可见,该算法分为前向传播与后向传播两个过程。前向传播主要是对输入训练样本训练结果的计算,后向传播则是对网络权重、偏向的反向更新。本文实现的平稳化LSTM 算法在上述流程基础上在前向传播过程之前添加数据平稳化过程,同时在输出预测结果后添加数据序列还原过程。

图2 LSTM 算法实现流程图Fig.2 Flow chart of LSTM algorithm

2 实验与结果分析

2.1 数据来源

本文采用的实验数据为南通市2018 年8 月21日—9 月20 日钟秀中路—北濠桥路交叉口正向雷达车辆检测器采集到的实际数据,总记录数为795万条。当车辆经过检测断面,随即触发检测器对车辆信息进行记录,即利用检测器对每一辆通过车辆进行信息采集,采集字段为通过时间、路口编号、断面编号、车道号、车辆类型,以及平均车速、发生时间、进口道出口道等,具体如表1 所示。

表1 过车数据主要字段Tab.1 Main fields of passing data

通过表1 车道号LANENO 字段对记录进行基本的统计分析,根据车道划分规则按车道号将不同方向不同相位的数据分开。同时根据正向雷达的扫描范围,车道检测器设定3 个不同检测断面对通过路口的车辆信息进行采集,并将采集到的车辆信息数据以不同的SECNO 字段形式保存在数据库中。本文选择最靠近断面的断面号1 数据确保车辆行驶方向的准确性。

由于数据量大,并且有少量无效、异常数据存在,因此本文根据城市道路通行车辆的限定速度,将平均行驶速度超过80 km/h 的数据记录作为异常数据进行剔除。经过统计筛选可以发现,异常数据占数据总量的0.2%,在数据量上进行删除后对整体数据集的影响不大。

一般情况下,对交叉口车流量的统计按照5、10、15、30 min 及1 h 进行。将5、10 min 作为时间间隔,其时间过短,车流量也相对较少,不能明显反映出车流量随时间的变化;将30 min、1 h 作为时间间隔,虽然车流量随时间变化季节性更为明显,但缺少车流量的变化细节,不能准确地反映高峰时段。因此,本文选择采用15 min 的时间间隔对数据进行统计,并将统计结果以时间段开始时刻、平均车速、车辆平均占有时间、车辆数的字段形式呈现,统计字段见表2。

表2 交通流量统计字段(时间间隔为15 min)Tab.2 Statistical fields of traffic flow (time interval is 15 min)

经统计后的数据集还存在少量缺失数据,为此,本文采取对相邻数据取平均值的方法进行填补,从而使样本数据具有连贯性。

由于道路交叉口具有明显的潮汐特性,通常情况下其交通量的小时变化图形为马鞍形状,在上、下午各存在一个出行高峰。根据统计数据(15 min时间间隔),将第t -2 天、第t -1 天、第t 天某时刻的交通流量作为输入字段,同时将天气、时间段、平均速度、平均占有时间作为输入的影响因素,第t +1 天同一时刻的交通流量作为输出字段构造样本集,具体如表3 所示。

表3 预测算法使用字段Tab.3 Fields used in prediction algorithms

2.2 实验过程

本文将根据2018 年8 月24 日至9 月19 日交叉口数据处理后得到的2 592 条数据作为训练样本;再加入在此基础上9 月20 日96 条数据,共计2 688 条数据作为测试样本。采用基于平稳化长短期记忆网络的交通流量预测模型对钟秀中路—北濠桥路交叉口的东出口道直行方向的交通流量进行训练和预测。

首先,对原始交通流观测序列{Xt,t=1,2,3,…,2 688}采用样本自相关函数法获得ACF 估计值,根据ACF 估计值确认周期为96,具体如图3 所示。

由图3 可知,该序列有明显的拖尾效应,即在较长的样本滞后时间范围内样本的自相关系数超过95%置信度区间,证明其为非平稳序列。

图3 原始交通时间序列的自相关性Fig.3 Autocorrelation of the original traffic time series

基于原始交通流序列,采用季节性差分计算其周期性差分ΔTXt,从而获得平稳化差分序列{ΔTXt,t=1,2,3,…},并验证其自相关系数估计值。一次差分后的ACF 估计值如图4 所示。

图4 一次差分后交通时间序列的自相关性Fig.4 Autocorrelation of traffic time series after one difference

由图4 可知,经过一次差分后,样本的拖尾效应得到明显改善,在较长的样本滞后时间范围内样本的自相关系数位于95%置信度区间内,交通序列近似为平稳化序列。将平稳化差分序列作为样本的输出字段更新样本数据集,利用LSTM 预测结果,并将结果还原为原始交通流量数据。

LSTM 模型的训练步骤如下:

1)模型参数选取。初始学习率为0.006,隐藏层单元数为10,训练数据集的Batch_size 为80,迭代次数为1 000 次,time_step 为10;测试集的time_step为12。

2)模型训练。选取前29 天的数据作为训练集,第30 天的数据为验证集检验模型训练结果。图5给出了损失值的下降曲线,当迭代超过400 次时,损失率变化趋向稳定,模型训练效果良好。

图5 损失值下降曲线Fig.5 Decline graph of loss value

2.3 实验结果分析

采用LSTM 模型进行预测的结果如图6 所示,其中坐标点为方格的折线代表预测值,坐标点为三角的折线代表实际值。图7 为采用平稳化的LSTM模型预测交通流量变化量,并将预测结果还原为交通流数据后预测值与实际值的对比曲线图。

图6 LSTM 模型预测结果Fig.6 Diagram of LSTM prediction results

图7 平稳化LSTM 模型预测结果Fig.7 Prediction results of smooth LSTM

为了比较算法拟合度,采用

来衡量预测值与实际值的拟合度。为了综合评价算法的预测性能,引入均方根误差(root mean square error,RMSE)和平均绝对百分误差(mean absolute percentage error,MAPE)来判断预测的准确度。

均方根误差是指观测值与真实值偏差的平方和观测次数n 比值的平方根,计算公式为

平均绝对百分比误差,是指预测值与真实值的差值占实测百分比的算术平均数,计算公式为

通过上述指标对预测结果进行分析,并与采用相同数据集进行预测的线性回归模型、支持向量回归模型、BP 神经网络模型等简单模型及BP-ARIMA、GRU 模型等复合模型的预测结果对比,预测误差如表4 所示。

表4 预测结果对比Tab.4 Comparative analysis of prediction results

通过比较可知,在均方根误差及拟合度R2上,LSTM 模型比其他模型均有较大优势,误差值降到17.08,拟合度提升至92.69%,但平均绝对百分比误差相较于其他方法仍无明显的降低;采用平稳化LSTM 模型进行预测的结果优势则更为明显,均方根误差降低为11.94,平均绝对百分比误差降至12.18%,拟合度R2达到95.78%。此外,针对交通流数据的时间间隔进行相应的调整,其预测准确性也会产生相应的变化。时间间隔越长,预测的准确性相对越高,误差也越小。

3 结论

本文建立了基于平稳化LSTM 的交叉口交通流量预测模型,结合天气、平均速度、平均占有时间以及时段等因素对道路交叉口车流量进行预测。通过对真实数据的分析验证表明,该模型能对车流量进行有效预测。将本文提出的模型与线性回归、GRU模型、LSTM 模型等主流模型相比,结果表明,本文模型的拟合度更高、误差更小,预测更准确,存在着一定的优势。但该模型还有待完善的空间,如未考虑道路事故、交通管制、交通流空间因素等的影响,在后续的研究中,需多维度考虑相关交通流影响因素,从而更好地适应道路的实际情况。

猜你喜欢

交通流量交通流交叉口
基于LSTM的沪渝高速公路短时交通流预测研究
城市道路平面交叉口的渠化设计
基于GM跟驰模型的内河限制性航道船舶交通流基本图
基于Web的城市交叉口虚拟仿真实验教学系统
基于VISSIM的光侨路与圳园路交叉口改善分析
城市道路平面交叉口设计研究与实践
燕山路与曹雪芹西道交叉口运行有轨电车可行性研究
无人车对交通流的影响分析
广州港大濠水道定线制引航要领
交通流量增长下的空管安全预警系统研究