APP下载

基于极限学习神经网络的短时交通流预测

2020-09-10周海川宁丹

交通科技与管理 2020年15期
关键词:神经网络

周海川 宁丹

摘 要:针对短时交通流预测,本文介绍了一种基于极限学习的神经网络预测模型,把极限学习理论应用于最简单的单隐含层前馈神经网络中,以实现提高训练效率的目的。通过具体的实例分析,与其他常用的BP神经网络、径向基神经网络、广义神经网络和Elman神经网络进行比较,结果表明基于极限学习神经网络的预测精度与常规神经网络的预测精度相当,并且其模型的训练耗时远远低于常规的神经网络模型,这对短时交通流预测在实际中的应用,具有重要实践意义。

关键词:短时交通流;神经网络;极限学习

中图分类号:U491 文献标识码:A

0 引言

短时交通流预测是智能交通系统(Intelligent Transportation

System, ITS)[1]中的一个关键技术,通过分析当前交通流的变化规律,提前感知交通系统状态的变化情况,为主动式交通管理和控制提供支撐。为此,准确、快速和可靠是实施短时交通流预测的基本要求。

短时交通流预测的研究至今已有近60年的研究历程,国内外专家学者已经提出了众多的预测模型和方法。传统的预测方法如历史平均[2]和指数平滑[3],基于参数的预测方法如随机时间序列[4]、卡尔曼滤波[5];基于非参数的预测方法如神经网络[6]、支持向量机[7]、非参数回归[8]、小波理论[9]等;基于组合预测的方法如多个神经网络预测结果的组合[10]、神经网络与卡尔曼滤波的组合[11]。这些预测方法基本上都是数据驱动,利用历史的交通流数据进行预测模型标定或训练,以获得高精度的预测结果。对于基于非参数的预测方法来说,特别是广泛应用的神经网络,主要存在三个方面的问题,训练速度慢、容易陷入局部极小点和学习效率选择的敏感性。

为此,本文研究一个针对单隐含层前馈网络的算法,即极限学习。该算法随机产生输入层与隐含层的连接权值及隐含层神经元的阈值,且在训练过程中无需调整,只需要设置隐含层神经元个数,就可以获得唯一的最优解。与传统的训练方法相比,具有学习速度快、泛化性能好等优点。

1 基于极限学习的前馈神经网络

1.1 单隐含层前馈神经网络

典型的单隐含层前馈神经网络结构如图1所示,由输入层、隐含层和输出层组成,输入层与隐含层、隐含层与输出层神经元间全连接。其中,输入层有n个神经元,对应n个输入变量,隐含层有l个神经元,输出层有m个神经元,对应m个输出变量。

在短时交通流预测建模过程中,利用已有的交通流数据进行模型训练,假设有N个训练数据样本(Xi, Yi),Xi=[xi1, xi2, …, xin]T,Yi=[yi1, yi2, …, yim]T,i=1,2,…,N,其中Xi为神经网络的输入数据样本,Yi为神经网络的输出数据样本,有l个隐含层节点和激励函数g(x),则图1所示的神经网络数学模型可以表示为:

(1)

式中,wi=[wi1, wi2,…, wil,]T表示第i个隐含层节点和输入层节点之间的权向量,βi=[βi1, βi2,…, βim,]T表示第i个隐含层节点和输出层节点之间的权向量,bi表示第i个隐含层节点的阈值,wi·xi表示权向量wi和样本xi的内积。上式(1)可以用矩阵进行表示:

(2)

式中,H为神经网络的隐含层输出矩阵,β为权重输出,Y为输出向量。其中,H可以表示为:

(3)

1.2 基于极限学习的神经网络权值求解

根据文献[12][13][14],如果激励函数g(x)是在任意区间是无限可微的,那么当隐含层神经元个数与训练数据样本数量相同时,即N=l,隐含层输出矩阵H可逆,且满足||Hβ-Y’||=0。

当训练样本的数量较大时,为了减少计算量,隐含层神经元个数通常取较小的值,即l<N。由文献[12]可知,单隐含层前馈神经网络的训练误差可以逼近一个任意的||Hβ-Y’||<ε。因此,当激励函数g(x)无限可微时,单隐含层前馈神经网络的参数并不需要全部进行调整,输入层与隐含层之间的权值wi和隐含层阈值bi在训练前可以随机选择,且在训练过程中保持不变。而隐含层与输出层之间的连接权值βi可以通过求解下面的方程组的最小二乘得到:

(4)

上式的解为:

(5)

式中,H+表示隐含层输出矩阵H的Moore-Penrose广义逆。公式(4)和(5)的证明过程,可以参考文献[14]。

1.3 评价指标

为了定量评价单隐含层前馈神经网络的预测性能,采用计算耗时与预测精度两类指标,前者指预测模型的计算所用时间,后者是则均方差误差百分比MAPE和均方根误差(RMSE)。预测精度评价指标如下所示:

(6)

(7)

式(6)和(7)中,yt表示在t时刻实际的交通流值,表示在t时刻预测的交通流值。

2 实例分析

2.1 数据

本文使用的交通数据,来自于美国波特兰高速公路I-205,通过线圈检测器采集得到,数据的采集时间为2011年9月15日至2011年11月14日共61天,采集时段是全天24小时。线圈采集到的原始交通数据经过预处理之后,被汇集为时间间隔为5分钟的流量数据,并且对缺失的流量数据进行简单插值,以保证交通流数据的完整。本研究所使用的实验数据信息,如表1所示。

为分析预测模型的计算效率和计算精度,把表1中的实验数据,划分为四个部分,包括三个训练数据集和一个测试数据集,训练数据集的天数分别为7天、21天和54天,测试数据集的天数为7天,实验数据的划分使用情况如表2所示。

2.2 预测建模

本文实例分析应用Matlab2015b,计算机主要配置参数为16.0G内存、Intel Core i5-9600 3.00GHz处理器。为分析基于极限学习的单隐含层前馈神经网络的预测性能,依次构建BP神经网络、径向基神经网络、广义回归神经网络和Elman神经网络进行对比。有关BP神经网络、径向基神经网络、广义回归神经网络和Elman神经网络的相关内容,可以依次参考文献[15][16][17][18]。构建的预测模型如表3所示,这五个神经网络预测模型的输入层由6个神经元构成,输出层由1个神经元构成,并且都只有1个隐含层,隐含层神经元数量为20。BP神经网络、径向基神经网络、广义回归神经网络和Elman神经网络的训练算法都采用梯度下降的方法。

2.3 结果分析

基于不同训练数据集的预测精度,分别如图2和图3所示。图2展示了BP神经网络、Elman神经网络、广义回归神经网络、径向基神经网络和单隐含层前馈神经网络的预测性能指标MAPE,均在12%左右,没有明显的差异。相似的,图3展示了预测精度指标RMSE,这五个神经网络的预测精度也没有明显的差异,约为120辆/小时。总的来说,从预测精度来看,单隐含层前馈神经网络的预测性能,与其他常用的神经网络模型没有明显的差异,具备相同的预测能力。

在预测精度分析的基础之上,记录每一个神经网络模型的训练时长,以反映计算效率,具体结果如表4所示。可以看出,单隐含层前馈神经网络的训练耗时最短,三个不同训练数据集的训练耗时分别为0.003、0.005和0.012秒,远远少于其他四个神经网络的训练耗时。

3 结论

作为应用最广泛的交通流预测模型之一,神经网络具有较高的预测精度,和良好的适应性能。然而,随着交通流大数据的增长,仅仅考虑神经网络的预测精度已不能满足实际应用的需求,还必须考虑其计算效率,尤其是神经网络的训练耗时。本文主要介绍了基于极限学习的单隐含层前馈神经网络,把极限学习方法应用于最简单的三层神经网络中,其在交通流预测中精度,与常用的BP神经网络、径向基神经网络、广义神经网络和Elman神经网络相当,并且其计算效率远远高于其他神经网络。这对短时交通流预测的实际应用,具有重要的实践意义。

参考文献:

[1]赵娜,袁家斌,徐晗.智能交通系统综述[J].计算机科学,2014,41(11):7-11+45.

[2]Smith B L,Demetsky M J.Traffic flow forecasting:Comparison of modeling approaches[J].Journal of Transportation Engineering,1997,123(04):261-266.

[3]齊驰,侯忠生.自适应单指数平滑法在短期交通流预测中的应用[J].控制理论与应用,2012,29(04):465-469.

[4].Williams B M,Hoel L A.Modeling and forecasting vehicular traffic flow as a seasonal ARIMA process:theoretical basis and empirical results[J].ASCE Journal of Transportation Engineering,2003,129(06):664-672.

[5]徐天东,孙立军,郝媛.城市快速路实时交通状态估计和行程时间预测[J].同济大学学报(自然科学版),2008(10):1355-1361.

[6]Chan K Y,Dillon T S,Singh J,et al.Neural-network-based models for short-term traffic flow forecastingusing a hybrid exponential smoothing and levenberg-marquardt algorithm[J].IEEE Transactions on IntelligentTransportation Systems,2012,13(02):644-654.

[7]Castro-Neto M,Jeong Y S,Jeong M K.Online-SVR for short-term traffic flow prediction under typical and atypical traffic conditions[J].Expert Systems with Applications,2009,36(03):6164-6173.

[8]张涛,陈先,谢美萍,等.基于K近邻非参数回归的短时交通流预测方法[J].系统工程理论与实践,2010,30(02):376-384.

[9]高勇,陈锋.基于小波分析的短时交通流非参数回归预测[J].中国科学技术大学学报,2008,38(12):1427-1431.

[10]Zheng W,Lee D H,Shi Q.Short-term freeway traffic flow prediction:Bayesian combined neural network approach[J].Journal of Transportation Engineering,2006,132(02):114-121.

[11]Stathopoulos A,Dimitriou L,Tsekeris T.Fuzzy modeling approach for combined forecasting of urban traffic flow[J].Computer-aided Civil and Infrastructure Engineering,2008(23):521-535.

[12]Huang G B,Zhu Q,Siew C H,Extreme learning machine:Theory and applications[J].Neurocomputing,2006,70(1-3):489-501.

[13]Feng G,Huang G B,Lin Q,Robert G,Error Minimized Extreme Learning Machine With Growth of Hidden Nodes and Incremental Learning[J].IEEE Transactions on Neural Networks,2009,20(08):1352-1354+7.

[14]Huang G B,Chen L,Siew C K,Universal approximation using incremental constructive feedforward networks with random hidden nodes[J].IEEE Transactions on Neural Networks,2006,17(04):879-892.

[15]陈雪平,曾盛,胡刚.基于BP神经网络的短时交通流预测[J].公路交通技术,2008(03):115-117.

[16]刘秀清,王晓原,宇仁德.道路交通事故径向基神经网络预测模型研究[J].计算机工程与应用,2009,45(17):188-190.

[17]王莉静,郭洁,李建军.基于广义回归神经网络的交通流预测模型[J].天津城市建设学院学报,2007(01):25-28.

[18]董春娇,邵春福,熊志华,等.基于Elman神经网络的道路网短时交通流预测方法[J].交通运输系统工程与信息,2010,10(01):145-151.

猜你喜欢

神经网络
复杂神经网络下的多行为识别技术研究
基于人工智能LSTM循环神经网络的学习成绩预测
基于BP神经网络算法的成绩预测模型研究
基于CNN的轻量级神经网络单幅图像超分辨率研究
基于图像处理与卷积神经网络的零件识别
基于改进VGG-16神经网络的图像分类方法
基于 BP 神经网络的城市轨道交通客流预测研究
基于自适应神经网络的电网稳定性预测
基于遗传算法对广义神经网络的优化
基于遗传算法对广义神经网络的优化