APP下载

公交到达时间预测误差分析及模型改进

2015-12-23廖孝勇崔德冠孙棣华

科技视界 2015年34期
关键词:道路交通路段公交车

廖孝勇 崔德冠 孙棣华

(重庆大学,中国 重庆 400044)

0 引言

公交到达时间预测是智能交通领域研究的热点问题之一,而公交到达时间预测是一个持续改进的过程。目前以存在了许多公交到达时间预测的方法,如人工神经网络算法,支持向量机、自回归时间序列,卡尔曼滤波等等[1-3],这些算法均有自身的优点,但也存在一定的局限性,预测精度还有待进一步的提高。文献[1]已经建立了公交到达时间预测模型,并且经实验验证能取得较好的结果,而进一步分析,其精度还可以进一步提高。

因此,为进一步提高公交到达时间预测的精度,本文在已有模型的基础上,通过利用海量的公交车GPS 数据进行长期的测试,对分析测试结果做详细的分析,同时结合公交车GPS 数据,分析产生误差产生的原因(特别是大误差产生的原因),针对具体的问题提出相应的解决方案,对公交到达时间预测模型做进一步的改善和优化,以提高模型的精度。

1 旧模型公交到达时间预测结果分析

1.1 原有模型简介

文献[3]将公交到达时间分成了路段行程时间、车站区域停留时间和其他延误时间3 部分,提出了公交达到时间预测模型,如下所示:

1.2 评价指标介绍

公交到达时间预测精度的评价是一个相对的指标,既需要考虑到绝对误差,又要考虑到乘客的主观感受,因此,本文采用短时精度和长时精度两个指标进行评价。

(1)短时精度。实际到站时间在5 分钟内的预测数据的绝对误差在1 分钟及以内的数据个数占实际到站时间在5 分钟内的预测数据总量的比例。

(2)长时精度。实际到站时间在5 分钟及以上的预测数据的相对误差在20%及以内的数据个数占实际到站时间在5 分钟及以上的预测数据总量的比例。

1.3 旧模型测试结果分析

为了对公交到达时间预测模型的测试结果做进一步的分析,根据测试结果所反映的规律来查找公交到达时间的影响因素,利用0811线路从2012 年7 月到2013 年2 月期间约200 天的测试结果的分布情况进行分析,如图1 所示。

通过长期的测试结果可以看出,利用文献[3]所建立模型预测公交达到时间可以达到较高的精度,短时精度和长时精度整体上保持在85%-90%之间。但不可否认的是,公交到达时间预测仍会产生较大的波动,有些天的预测精度(主要是长时精度)低于80%。因此,如何进一步提高公交到达时间预测的精度(包括降低长时精度的波动性),是本文研究的主要问题。

图1 公交线路0811 长期公交到达时间预测结果分布

首先,为了检验短时精度和长时精度之间是否存在显著的差异,对两者进行T 检验,结果如表1 所示。

表1 短时精度和长时精度差异对比

由表1 可以看出,公交到达时间预测结果的短时精度和长时精度具有显著的差异,短时精度的均值为87.86%,高于长时精度(85.08%),说明将公交到达时间预测结果分为短时精度和长时精度是有必要的。同时,这两个指标考虑到乘客候车的感受,对公交到达时间预测结果的评价更加合理。

2 误差分析及模型改善

通过长期结合公交到达时间预测模型的预测结果和海量公交车GPS 数据的分析,本文总结公交到达时间预测产生误差(尤其是大误差)的影响因素有:(1)数据问题,包括数据缺失和数据错误两方面;(2)道路交通特性的差异影响;(3)司机驾驶行为差异影响;(4)异常事件影响;以下将对这些因素的情况及其对公交到达时间预测结果的影响作进一步的分析。同时,针对这些问题,提出进一步的优化方案。

2.1 误差分析

2.1.1 数据质量问题

数据质量问题主要包括两点:其一,数据缺失;其二,数据错误。具体如下:

(1)数据缺失。数据缺失是造成公交到达时间预测误差(尤其是大误差)的主要原因之一。

公交车GPS 数据分为运营数据和报站数据。所谓运营数据是记录公交运行过程的数据,而报站数据是指公交在进站或者出站的瞬间传回的数据,记录了公交进站或者出站的时刻。正常情况下每隔10 秒传回一条运营数据,即同一辆公交车相邻两条运营GPS 数据的之间的时间差为10,而报站数据之间的时间间隔不确定,因此,运营数据与相邻的报站数据之间的时间差可能小于10。

(2)数据错误。数据错误是公交车GPS 数据中较为常见的一种现象,数据错误情况如果得不到妥善处理,同样会造成较大的误差。公交车GPS 数据的属性包括站点编号、车辆IP、瞬时速度、GPS 时间、里程信息、车辆状态以及行车方向等信息,且不同属性的错误所造成的影响不同。

2.1.2 道路交通特性差异

由于道路交通上不同路段的地理条件、车道数量、车流量、人流量、与始发站的距离等方面的差异较大,不同路段的交通状态变化程度不一致,造成不同站点的公交到达时间的预测结果差异较大。在此,以886 线路下行方向的动步公园到大庙连续6 个典型站点的测试结果为例,利用方差分析检验不同站点预测结果的差异性,结果如图2所示。

图2 公交线路886 从动步公园到大庙路段划分

可以看出,动步公园和龙湖西苑两个站点的预测精度较大,而新牌坊开始预测精度逐渐降,直到大庙站其预测精度才有所上升。进一步分析其原因,造成轨道嘉州站预测精度下降的原因是:从新牌坊出站不到50 米为大转盘,大转盘处有等待周期较长的信号灯,常造成新牌坊站出站口出发生堵车。加州花园的预测结果下降是因为受到红旗河沟立交上并道(由两车道减为一车道)的影响,造成从轨道新牌坊大转盘到红旗河沟立交段经常发生严重的交通拥堵。

进一步,分析不同路段交通拥挤程度的波动情况,以2013 年6 月1 日到2013 年8 月31 日连续3 个月的数据为基础,统计出每个车次在以上6 个站点的上一路段的路段行程时间,其分布图如3 所示:

图3 公交线路886 部分路段的路段行程时间分布情况

结合以上图表可以看出,公交到达时间的预测精度与道路交通状态的波动程度有密切的关系,道路交通状态平稳,公交车保定稳定运行状态,得到的公交到站时间的预测精度则相对较高,且较为稳定,反之亦然。

2.1.3 驾驶行为差异

经分析,由于不同司机驾驶习惯不同,有的司机较为冒进,而有的则相对保守,即使在相同的道路交通状态下,不同的司机的行程时间也可能有较大的差异。利用方差分析检验不同司机在相同条件下的路段行程时间,结果表明,车辆行程时间在不同司机之间具有显著的差异。因此,考虑不同司机的驾驶行为习惯,将会有助于进一步提高公交达到时间的预测效率。

2.1.4 异常事件影响

道路交通上异常事件的发生也是产生公交到达时间预测误差的主要原因之一。一般对道路交通产生较大影响的异常事件有:车辆故障、货物散落、异常天气、交通事故、临时大型活动、交通临时管制、道路维修等。这些异常事件虽然出现概率较小,但所造成的影响很大,轻则造成交通拥堵,增大出行成本,重则可能造成生命财产损失。且道路异常事件发生的时间、地点具有高度不确定性,一般难以准确预测。较为可行的办法是根据公交车GPS 数据及时检测出异常事件,并且融合多线路多车的GPS 数据,以实现对异常事件影响程度的估计,通知交通管理部门及早采取有效措施,降低交通异常状态所造成的影响。

2.2 模型改进

以上已分析了造成公交到达时间预测结果产生较大误差的主要影响因素,接下来需要对这些问题提出进一步的改进方案。由于针对不同的问题,改进的程度不同,而且本文篇幅有限,在此仅着重介绍针对不同交通特性的优化方案,而对于其他问题的解决方案,只作简单介绍。

2.2.1 针对数据质量问题的改进

(1)数据缺失的处理。文献[3]以浮动车覆盖率作为标准,将路段分为有效数据路段和无效数据路段两种,该方法对公交车GPS 数据的缺失起到了一定的作用(尤其是无效数据路段上),但经分析发现,在有效数据路段也常见数据缺失的情况,因此,亟需一种更为有效的方法应对数据的缺失。为了为数据缺失提供一种更为有效、适用范围更广的方法,在此提出利用经过多车信息融合的方法,即考虑经过同一路段多车的数据,充分发挥其他数据的作用。具体方法如下:

第一,利用同一辆公交车的GPS 数据中序列值对数据缺失进行判别,确定是否发生数据缺失。

第二,若确定发生数据缺失,则计算数据缺失的周期。若同一公交车数据缺失周期小于一定的时间范围(如2 分钟),利用同一路段上其他车辆的信息就行修正;若同一辆车数据缺失超过预定的时间范围,则报“通讯中断”。

其中,利用同一路段其他车辆信息进行修正的具体方法是:确定在一定范围内在是否有其他公交车辆经过相同的路段,若有,则利用其他车辆离当前车辆距离最近的信息(如车辆状态、瞬时速度、里程等)来填补当前车辆的信息;若没有其他线路的车辆信息作为参考,则选择最近通过相同路段的同一线路的其他车辆的信息填补当前车辆的信息。

(2)数据错误的处理。当确定GPS 数据发生有误时,则将该数据错误部分当缺失处理,再利用上述数据缺失的处理方法修正错误的那部分的数据。

2.2.2 针对道路交通特性的改进方案

为了消除不同道路交通特性对公交运行时间的影响,首先需要根据道路交通状态的大小和波动程度对路段和时段进行准确、细致的划分。对此,可以使用模糊K-均值聚类算法对具有不同交通特性的路段进行划分,具体如文献[6]所述。在此,需要解决两个关键问题:

(1)输入参数。由于不同路段的长度、等级不同,为了消除不同路段的差异,需要定义“路段拥挤度”来表征每个路段的交通特性,具体计算方法如文献[7]所述。

(2)划分数目。为了对具有不同交通特性的路段进行更加精确、细致地划分,需要确定合理的分类数目。由于目前对于道路交通特性的划分没有统一的标准,在此利用逐步试验的方法,确定最终将具有不同交通特性的路段和时段划分为6 类得到的效果最好。

2.2.3 针对驾驶行为差异的改进方案

司机驾驶行为的差异主要表现在车辆运行过程中的差异,因此,根据司机驾驶行为对模型的改进主要是针对路段行程时间计算方式的改进。主要包括行程时间的计算和根据司机驾驶行为修正两部分。

(1)计算平均行程时间。考虑到GPS 数据的特点,可利用其中的车辆里程信息可以计算车辆与最近站点间的距离l,其平均速度可以由该路段的路段区间平均速度代替。则该车到下游目标站点的平均行程时间为:

(2)根据驾驶员驾驶行为特性对结果进行修正。为了提高估计的精度,还需要对平均行程时间加以修正,修正后的平均行程时间为:

3 实验分析

针对文献[3]中的模型,本文从数据质量、道路交通特性和驾驶行为修正等3 个方面进行了改进。为了验证模型的有效性,本文实际的公交车GPS 数据为基础,以886 线路从动步公园到大庙连续6 个站点作为研究对象,对改进的模型进行验证。

进一步,为了验证本文改进模型的稳定性,利用2014 年12 月21日到27 日共一周的公交GPS 数据进行验证,结果如表2 所示:

表2 改进模型和旧模型连续7 天预测精度对比

从表2 可以看出,针对7 个典型的站点,改进模型在每一天的预测效果在短时精度和长时精度方面都比旧模型有所提升。整体上7 天的预测效果在短时精度提高了1.51 个百分点,长时精度提高了1.88个百分点,说明了本文提出的改进方案是有效的,而且预测结果更具有稳定性。

4 结论

本文在原有模型的基础上,从数据质量、道路交通特性差异、司机驾驶行为差异等方面进行改进。实验结果表明,改进的模型的预测效果有了进一步的提高,尤其是在那些预测精度较差的站点精度提高更大,整体预测效果也更加稳定。

此外,由于交通异常事件是随机事件,且发生的概率相对较小,难以对异常事件发生的位置、时间及其影响程度进行预测,目前较为可行的方案是在异常事件发生后及时、准确地检测出来,然后再对其影响作进一步的分析。目前的对道路交通异常事件的研究主要集中于高速公路或快速路,而对城市道路交通异常事件的研究相对较少。如何及时、准确地检测城市道路交通异常状态并分析其影响程度,最终以提高公交到达时间预测的精度,是本文下一步工作的重点。

[1]孙棣华,赖云波,廖孝勇,等.公交浮动车辆到站时间实时预测模型[J].交通运输工程学报,2011(2):84-89.

[2]于滨,杨忠振,林剑艺.应用支持向量机预测公交车运行时间[J].系统工程理论与实践,2007,27(4):160-164.

[3]Jeong R,Rilett L R.Bus arrival time prediction using artificial neural network model[J].International IEEE Conference on Intelligent Transportation Systems,2004:988-993.

[4]姜桂艳,郭海锋,吴超腾.基于感应线圈数据的城市道路交通状态判别方法[J].吉林大学学报:工学版,2008.

[5]李晓丹,刘好德,杨晓光,等.城市道路网络交通状态时空演化量化分析[J].系统工程,2008(12):66-70.

猜你喜欢

道路交通路段公交车
冬奥车道都有哪些相关路段如何正确通行
你们认识吗
《道路交通安全法》修改公开征求意见
部、省、路段监测运维联动协同探讨
A Survey of Evolutionary Algorithms for Multi-Objective Optimization Problems With Irregular Pareto Fronts
现代道路交通文化景观探究与实践
公交车上
欢迎订阅2017年《道路交通管理》杂志
公交车奇妙日
欢迎订阅2017 年《道路交通管理》杂志