APP下载

基于极限学习机的公交行程时间预测方法

2018-10-29宋现敏刘明鑫夏英集

交通运输系统工程与信息 2018年5期
关键词:学习机临界点公交

宋现敏,刘明鑫,马 林,夏英集

(吉林大学交通学院,长春130022)

0 引 言

公交行程时间是实现公交智能调度、控制的重要参数,精准、实时的公交行程时间预测是实现智能公交信息服务的关键[1-2].因此,公交行程时间的预测方法受到了国内外学者越来越多的关注,他们主要从理论模型和机器学习两种方法来进行探究.

孙喜梅和杨兆升[3]把公交行程时间分为4个部分,利用随机服务系统理论,给出了在车辆到达服从泊松分布下的实时动态公交行程时间预测模型;Patnaik等[4]和杨晓光等[5]分析影响公交车行驶的多种因素,在大量实测数据基础上运用多元回归方法预测行程时间;Zhou等[6]基于智能公交IC卡数据,考虑乘客刷卡时间分布、占有率和座位容量等因素,基于频率分布和多元回归构建预测模型;Shalaby等[7]结合自动车辆定位系统和自动乘客计数系统,构建了基于卡尔曼滤波的动态预测模型;BA Kumar等[8]基于公交GPS数据,通过灵敏度分析确定卡尔曼滤波模型参数从而建立行程时间预测模型.上述预测模型中,回归模型预测精度较低,卡尔曼滤波模型预测精度较高,但对异常观测值抗干扰性比较差.

Chien等[9]建立人工神经网络(Artificial Neural Network,ANN)模型预测公交车到达时间,通过设置调整因子,不断输入新的实时数据动态预测行程时间;Reddy等[10]利用支持向量机(Support Vector Machine,SVM)建立了基于GPS数据的SVM预测模型,在高方差条件下具有较高的预测精度;于滨等[11]采用时间段等5个影响因素通过支持向量机预测公交车行程时间,并应用大连市开发区公交车数据对其进行验证;Lin等[12]利用公交GPS和IC卡数据,对比分析了人工神经网络与卡尔曼滤波两种方法,结果表明前者预测精度均优于后者;Yu等[13]分别对支持向量机、人工神经网络、K最近邻算法((k-Nearest Neighbor,KNN)和线性回归(Linear Regression,LR)4种预测方法进行比较,系统的评价了几种方法的优劣之处.

综上,上述预测模型的精度较高,且具有良好的学习能力,能够较好地跟踪拟合非线性、非平稳时间序列数据,但是传统的前馈神经网络学习速度较慢,且容易陷入局部最优解,而支持向量机只有在小样本条件下效率较高.因此,本文建立了基于极限学习机(Extreme Learning Machine,ELM)的公交行程时间预测模型,并与BP神经网络、SVM方法和径向基神经网络(Radial Basis Function Network,RBF)方法进行对比分析.

1 公交站点间行程时间获取

理论上,当公交车的经纬度和站点的经纬度重合且速度为零时,认为公交车在站点停车.但实际上由于GPS设备误差、公交车站定位误差等影响,上述情况几乎不会出现.同时由于公交车GPS设备记录有时间间隔,所以当公交车行驶在停靠站附近时,其GPS记录点与站点之间的空间距离由大变小再变大,两者之间会存在一个最小临界距离,因此本文把拥有最小临界距离的GPS记录点定义为临界点.但是当车辆发生排队时最小临界距离会连续出现多个,此时选择第1个出现的GPS记录点作为临界点.与此同时,公交车在站点附近行驶过程如图1所示,包括匀速行驶、减速进站、停车、加速离站和匀速行驶5个阶段,临界点也存在5种情况,分别为:①临界点在站点前,匀速行驶;②临界点在站点前,减速进站;③临界点在站点中,速度为零;④临界点在站点后,加速离站;⑤临界点在站点后,匀速行驶.

图1 公交车在站点附近运行状态图Fig.1 State chart of bus running near the site

假设在T2时刻出现临界点,把(T2-Δt)及(T2+Δt)这两个时刻分别定义为T1和T3,其中Δt为GPS数据记录时间间隔,通常为10 s、20 s、30 s和60 s等,本文为30 s.计算公交车与站点之间的距离d的函数为

式中:r是地球半径(6 378.1km);φ1和φ2是点1和点2的纬度;λ1和λ2是点1和点2的经度;haversin为半正矢函数,haversin(θ)=(1-cosθ)/2.

(1)临界点在站点前,如图2(a)所示.

情况1 公交车处于匀速行驶阶段,此时v2≥v12.公交车停车时刻Ts计算公式为

式中:T2为公交车在数据点2记录的时刻;d2为公交车在数据点2时与公交车站的距离(m);v23为公交车在路段d23上的路段平均速度(m/s),v23=d23/Δt,其中,Δt为GPS记录间隔(s),d23为数据点2和数据点3之间的距离(m),d23=d2+d3,d3为公交车在数据点3时与公交车站的距离(m);v2为公交车在数据点2的速度(m/s);v12为公交车在数据点1和2之间的平均速度(m/s),v12=d12/Δt,d12为数据点1和数据点2之间的距离(m),d12=d2-d1,d1为公交车在数据点1时与公交车站的距离(m).

图2 公交车与站点空间位置图Fig.2 Distance chart between bus and stop

情况2 公交车处于减速进站过程,此时v2≤v12,因此,Ts计算公式为

(2)临界点在站点中.

情况3 公交车在站点中,此时v2=0,因此Ts=T2.

(3)临界点在站点后,如图2(b)所示.

情况4 公交车处于加速离站过程,此时v2≤v23,Ts计算公式为

情况5 公交车进入到匀速行驶阶段,此时v2≥v23,Ts计算公式为

通过对实测数据的情况分析,用Matlab软件编程估计了公交车在站点的停车时刻与站点间行程时间.

2 基于极限学习的公交行程时间预测

2.1 极限学习机算法

近年来,极限学习机算法(ELM)以其学习速度快,泛化性能好等优点,引起了国内外许多专家和学者的研究关注.ELM是一种有效的单隐层前馈神经网络学习算法,由南洋理工大学黄广斌教授发表文章提出[14].传统的神经网络是通过梯度下降法,利用反向传播的方式进行学习,需要不断地进行迭代来更新权重和阈值,与其相比,极限学习机提出了一个大胆的假设:从输入层到隐含层的权重不需要进行迭代优化,随机赋值即可,并在其论文中给出了严格的数学证明,在保证精度的前提下具有更快的学习速度.它的三层网络结构如图3所示.

图3 极限学习机算法(ELM)网络结构Fig.3 ELM algorithm network structure

如图3所示,输入层有n个输入变量,分别为(x1,x2,…,xn),对应影响公交行程时间的因素;隐含层有l个神经元;输出层为y,即公交行程时间;Wij是输入层第i个神经元与隐含层第j个神经元之间的输入权重;bj是隐含层第j个神经元的偏置;βj是隐含层第j个神经元与输出层神经元之间的输出权重.以下为ELM算法基本步骤:

Step1 输入训练集输入数据(x1,x2,…,xn),即公交行程时间影响因素.

Step2 随机确定输入权重矩阵Wij及偏置向量bj.

Step3 确定隐含层神经元个数l与激活函数g(x),其中激活函数g(x)理论上一般为sig函数、sin函数、hardlim函数等.

Step4 通过,计算得到隐含层输出矩阵H.

Step5 根据训练集输出数据y,即实际公交行程时间,通过=H+Y计算得到最优输出权值矩阵βj.

经过训练集训练得到最优输出权值矩阵βj之后,通过式(6)即可求得输出变量即公交行程时间预测值y.

2.2 数据特征确定

路段上的公交车GPS数据中涵盖了公交车行驶的内在特征,数据特征的分析对行程时间的预测精度有重要影响,经过统计分析可以发现1天之内不同时间公交车行程时间的时变特征和1周内不同日期公交行程时间的变化特征.

图4为公交车行程时间散点图,数据样本全部来自长春市88路公交车首末站点区间行程时间数据.从图4可以清晰地反映出公交车行程时间在1天之内存在早高峰和晚高峰,因此本文把其分成5个时段:早平峰(5:30-7:00),早高峰(7:00-9:30),午平峰(9:30-17:00),晚高峰(17:00-19:00)和晚平峰(19:00-21:00).

通过运用皮尔逊相关系数分析公交车行程时间数据组中数据之间的相关关系的强弱,来反映行程时间在工作日和休息日特征上的不同.计算皮尔逊相关系数的前提是样本服从正态分布,所以本文先对样本进行正态性检验.如图5所示,在Shapiro-Wilk正态性检验中,样本的显著性水平满足要求,证明本文所选样本服从正态分布.

本文根据相关系数大小对预测重要度进行了排序,选取重要度排在前10名的进行统计分析,结果如图6和图7所示.

(1)对于星期一~星期五,公交车行程时间影响程度的前10位都是工作日的数据;对星期六而言,前10位中休息日的数量也要比工作日多.

(2)虽然对于星期日,前10位中休息日的数量要比工作日少,但是对前10名平均相关性分析可以发现,星期六、星期日数据与休息日平均相关性明显高于工作日.

因此,本文在预测工作日的公交行程时间时选择工作日的行程时间数据作为模型输入,反之亦然.与此同时,为了对结论进行进一步验证,同时分析了另外两个区间“繁荣路—希望高中”“希望高中—东四马路”的行程时间数据的特征,得到的结果与上述结论相似,因此本文在此不做过多赘述.

图4 公交行程时间1天内变化图Fig.4 The change of bus travel time in one day

图5 样本数据的Shapiro-Wilk检验Fig.5 Shapiro-Wilk test of sample data

图6 影响公交行程时间的数据特性分析Fig.6 Data characteristic affecting bus travel time

图7 影响公交行程时间的数据相关系数Fig.7 Data correlation coefficient affecting bus travel time

2.3 模型参数选择

本文选取长春市88路车队10月份约100万条公交车GPS数据作为实例进行公交行程时间预测方法验证.选取前3周的公交行程时间数据为训练集.

在极限学习机算法中,我们需要确定两个输入参数的维度,分别为历史行程时间的天数n和影响当前预测车辆的公交车辆数量m.本文采用均方根误差(Root Mean Square Error,RMSE)指标来决定参数纬度,如式(7)所示.n和m参数选择流程如图8所示.

式中:y为观测值(min);y′为模型预测值(min);N为样本个数.

根据已有文献研究[8],为了能够满足反映行程时间时空规律和当前路段交通状态的要求,本文把n的上限设定为14天,m的上限设为20辆.根据图8参数获取流程,分别获取了不同纬度下预测结果的RMSE,如图9所示.结果显示:针对每一个预测对象(星期一~星期日)预测误差在总体上总是先随着输入历史行程时间天数的增加而降低,开始时降低的幅度比较大,但是当天数到达6天之后降低的速度开始变慢,甚至再继续增加天数会后出现了一定的波动现象,所以,为了不造成数据冗余,拖慢预测速度,同时又保证预测精度,本文选择n为6天.同理对m进行了分析,从图10中发现,公交车数量为6辆时最为合适,因此m为6.

图8 极限学习算法中参数选择流程Fig.8 Parameter selection process in ELM

图9 不同天数的输入对预测结果的影响分析Fig.9 Influence of different number of day on predicting bus travel time

图10 不同公交车的数输入对预测结果的影响分析Fig.10 Influence of different number of bus on predicting bus travel time

3 预测结果分析

本文应用极限学习机模型对长春市88路公交车在“繁荣路—东四马路”全天行程时间的预测结果如图11所示.从图11中可以看出,预测值及其变化趋势近似符合真实值.为了进一步验证本文提出的ELM预测方法的有效性和优越性,应用BP神经网络、SVM和RBF神经网络,选取学习速度、预测误差和模型可靠性3个指标详细比较4种方法的优劣.

图11 “繁荣路—东四马路”ELM预测结果Fig.11 Results of ELM from Fanronglu station to Dongsimalu station

单纯的平均绝对误差(MAE)和均方根误差(RMSE)只能反映出预测值与实际值之间的偏差值的大小程度,而不能与实际值联系起来.所以,本文引用MAE与平均公交行程时间的比值(本文用AMAE代表)和RMSE与平均公交行程时间的比值(本文用ARMSE代表)来判断预测误差的大小,如式(8)和式(9)所示.

式中:T为平均行程时间(min).

AMAE和ARMSE两值越小代表预测值跟实际值的误差百分比越小,越接近真实值.同时,本文选取偏差值95%置信水平下的置信区间间隔大小和位置来判定预测模型可靠性.95%置信水平下的置信区间间隔大小代表偏差大小波动范围,间隔越小说明波动范围越小,模型可靠性越高.位置越接近零、越靠近X轴代表误差越小,反之误差越大.而学习速度方面采用训练时间评价,时间越少,速度越快“.繁荣路—东四马路”行程时间的预测实验对比分析如图12所示.

从图12中可以看出:

(1)预测误差方面,ELM、RBF和SVM这3种模型在工作日与休息日的ARMSE值与AMAE值相差不大,约为11%,而BP神经网络的两种误差分别为25%、15%.表明ELM模型与其他经典模型相比,保证了预测精度,具有较好的实际应用价值.

(2)可靠性方面,ELM与SVM的置信区间间隔都要比BP和RBF小,说明偏差值波动范围小,模型更为可靠;与此同时ELM与SVM的置信区间的位置要更为贴近X轴,说明预测值与真实值更为接近.

(3)学习速度方面,BP、SVM、RBF和ELM的模型训练时间分别为619 s、2 775 s、816 s和139 s.其中ELM方法所花费的时间远远小于其他方法.

综上,实验结果表明,ELM方法在保证了预测精度的同时拥有更快的预测速度和模型可靠性.

图12 4种行程时间预测方法的评价分析Fig.12 Evaluation of four travel time prediction method

4 结 论

本文以长春市88路公交车GPS数据为基础采用极限学习机方法对站点间行程时间进行预测.根据公交车GPS记录临界点所处行驶阶段的不同估计公交车到站时刻、获取站点间行程时间;与此同时,分析路段上行程时间数据特征,确定极限学习机网络输入参数;最后对BP、ELM、RBF和SVM方法的预测结果进行对比分析.结果表明,本文所用ELM方法在满足精确度前提下拥有更快训练速度与预测可靠性,说明此方法在在线预测、实时预测上具有较高的实用价值,对于我国城市公交车辆行程时间的预测及先进的公共交通系统的实施具有一定的实用价值.

猜你喜欢

学习机临界点公交
基于临界点的杭州湾水体富营养化多年变化研究
一元公交开进太行深处
等公交
基于极限学习机参数迁移的域适应算法
基于改进极限学习机的光谱定量建模方法
分层极限学习机在滚动轴承故障诊断中的应用
超越生命的临界点
一种基于AdaBoost的极限学习机分类方法