APP下载

城市道路交通流监测数据最优汇集时间间隔分析

2012-06-28陆振波夏井新焦恬恬时幸飞

关键词:交通流道路交通方差

陆振波 夏井新 焦恬恬 时幸飞 黄 卫

(东南大学智能运输系统研究中心,南京210096)

智能化城市道路交通管理与控制的最终目的是缓解城市交通拥堵、提高行车安全,最终实现城市道路交通的可持续发展.作为实时把握城市道路交通运行状况的一种重要手段,城市道路交通流运行状况监测一直是城市道路智能化交通管理与控制的核心和难点之一.其关键技术主要包括交通流数据的时间与空间汇集[1]、交通流数据预处理[2-3]以及交通流运行状态实时判别[4-6]等.目前,城市道路交通流原始数据采集间隔通常为15~30 s[7],这种原始数据呈现出的波定性影响了其在交通监测方面的应用性能.因此,需要确定一个更加合适的汇集时间间隔,以准确地反映道路交通流真实运行状况,这就是交通流数据最优汇集时间间隔问题.

交通流数据的最优汇集时间间隔是能否实时准确反映城市道路交通运行状态的重要因素,也是后续交通状况实时判别方法能否准确判别城市道路交通拥堵程度的重要基础.汇集时间间隔过小,会导致交通流数据包含较多的噪声而干扰交通状态的识别;汇集时间间隔过大,则会造成交通流变化的过程被平滑.纵观国内外现有研究成果可知,对于交通流数据最优汇集时间间隔的分析主要包括交叉验证均方差法[8-10]、基于图表的统计方法[11]、小波分析法[12-13]等.交通流数据最优汇集时间间隔问题的本质是分析不同汇集时间间隔的交通流数据序列的离散程度,刻画这种度量形式的理想统计量是方差,因此交叉验证均方差法是比较常用的方法.然而,传统交叉验证均方差法主要用于高速公路的速度数据研究,并未综合考虑交通流三参数的影响,同时也缺少对较为复杂的城市道路交通状况的研究分析.

针对上述问题,本文提出了一种基于交通状态矢量的交叉验证均方差模型,以衡量不同汇集时间间隔下交通流数据的优劣性;并采用t检验对不同汇集时间间隔所得的均方差均值进行显著性检验,以获得城市道路交通流数据的最优汇集时间间隔.

1 基于交通状态矢量的交叉验证均方差模型

1.1 传统的交叉验证均方差模型

从一组数据序列中依次取出一个数据,计算其与剩余数据均值的差值,取差值的二次方,交叉验证重复多次,得到差值的平方和即为该组数据的交叉验证方差.基于此,Gajewski等[8]提出采用交叉验证均方差模型来寻找交通流数据汇集的最优时间间隔.假设原始交通流数据间隔为20 s,按照目标汇集时间间隔,将原始交通流样本数据分成多组,分别计算各组内的交叉验证方差并进行累加,便可得到样本数据的交叉验证均方差.交叉验证均方差最小的汇集时间间隔即为最优汇集时间间隔.

基于传统的交叉验证均方差模型,可得出其在最优汇集时间间隔研究方面的适用性:① 不同汇集时间间隔主要通过交叉验证均方差模型的分组个数来体现.②根据交叉验证方差的定义,数据序列中各数据对应的交叉验证方差值体现了该数据对该组数据均值的影响程度.交叉验证方差值越小,说明该数据对该组数据均值的影响越小,即该信息的重要性越低.由于交通流数据时间汇集的本质是通过数学运算来忽略一些次要交通流数据的过程,因此通过交叉验证均方差值的分析可以量化研究最优汇集时间间隔.

在 Gajewski等[8]的研究基础上,部分学者[9-13]又发展了基于不同目标下的最优汇集时间间隔研究,如基于路段行程时间估计、路线行程时间估计的最优汇集时间间隔等.然而,这些研究同样也是对高速公路交通状况下的单一参数进行分析,对较为复杂的城市道路交通状况缺乏分析探讨.

1.2 改进的交叉验证均方差模型

在Gajewski等[8]提出的交叉验证均方差模型研究中,不同汇集时间间隔数据序列的交叉验证方差可以视为各速度数据与剩余速度数据的均值在不同汇集时间间隔坐标轴上的距离平方,并可以此作为衡量最优汇集时间间隔的标准.然而,城市道路的速度参数受外界因素影响较大,仅仅考虑速度并不能完全表征实际的道路交通状况.鉴于以上因素,交通流运行状态的表征需要综合考虑交通流三参数(即流量、时间平均速度和时间占有率)的影响,其中时间占有率由车辆检测器采集,当车型组成相对稳定时,与交通流密度成正比.基于此,本文提出了一种基于交通状态矢量的交叉验证均方差模型,即采用交通流三参数来取代传统的速度单一参数,研究交通流数据的最优汇集时间间隔问题.基于这3个交通流参数的不同汇集时间间隔的交通状态交叉验证均方差模型如下:

考虑到原始数据中平均速度与交通流量的关系(即一定时间间隔内通过检测断面的车辆数量之间的相关性),在进行速度时间汇集时可以以交通流量作为权重来进行加权平均,即

以3 600 s内采集的原始交通流数据作为样本,可以得到汇集时间间隔为T时单位小时交通流数据的交叉验证方差为

由于交通流三参数的量纲各不相同,因此在计算前需要对交通流各参数进行无量纲化.通常可采用中心化、极差化、极大化、极小化、均值化等处理方法将指标无量纲化[14].采用均值化处理时,无量纲化后各参数的均值均为1,方差为参数变异系数的平方,即可有效保留各参数变异程度的信息.基于此,本文选取均值化法对原始数据进行处理,进而采用基于交通状态矢量的交叉验证均方差模型对最优汇集时间间隔进行研究.针对车辆检测器实时采集的某一交通流参数,其均值化的具体计算公式如下:

式中,x1和x'1分别为某一交通参数的实际值和均值化后数值;¯x为均值化前某一交通参数的检测均值.

2 基于t检验的最优汇集时间间隔分析

从理论上讲,交叉验证均方差最小值所对应的汇集时间间隔即为最优汇集时间间隔.但是实践证明,随着汇集时间间隔的增大,交叉验证均方差的变化趋于平缓,从变化趋势图上难以确定其最小值.此外,汇集时间间隔的增大还会平滑交通流状态在时间轴上的局部变化.鉴于此,本文在确定最优汇集时间间隔时,考虑对不同汇集时间间隔所对应的交叉验证均方差进行显著性分析,通过确定均方差变化的拐点,来确定最优汇集时间间隔.

根据上述交叉验证均方差的特性,本文拟通过构造t检验来对不同汇集时间间隔所得的均方差进行显著性检验.t检验的基本原理是用t分布理论来推断差异发生的概率,从而判定2个平均数的差异是否显著.假设有2个正态总体X~N(μ1,)和 Y ~N(μ2),其中 μ1,μ2分别为正态总体的均值和方差,X1,X2,…,Xn1为来自总体 X的 n1个样本,Y1,Y2,…,Yn1为来自总体 Y 的 n2个样本,且总体X与Y独立.则可以构建2个正态总体均值差的假设检验,即

其中,δ为已知常数.

对于给定的显著性水平α,由t分布分位点的定义可知,存在 tα/2(n1+n2-2),使得

因此,该假设检验的拒绝域为

上述t检验方法应用的主要条件是检验数据是否符合正态分布条件.同一个时间间隔不同日期的交叉验证均方差符合正态分布,因此可以采用上述t检验方法来判断基于交通流状态矢量的交叉验证均方差均值的差异性.

3 基于城市道路交通流数据的实例分析

3.1 城市道路交通流数据的采集

鉴于城市不同等级道路交通流特征的差异性,本文基于江苏省昆山市城市道路交通状况实时监测系统,选取了昆山市3条不同等级的道路(长江路、同丰路及中山路)作为研究对象.3个不同等级道路交通状况监测选取断面的基本信息见表1.

表1 采集的断面信息

在昆山市城市道路交通状况实时监测系统中,微波车辆检测器采集的原始交通流数据间隔为30 s.考虑到工作日和周末交通流特点的差异性,本文选取2010年7月5日至7月9日以及7月12日至7月16日共10个工作日的单向行驶断面交通流数据进行分析.

3.2 交叉验证均方差

当交通流数据汇集时间间隔较小时,间隔增量的增大对交通流状态的影响较大.因此,在汇集时间间隔较小时,本文选取的汇集时间间隔增量也较小;随着汇集时间间隔的增大,相应的汇集时间间隔增量也增大.鉴于此,本文选取了 1,2,3,4,5,6,8,10,12,14,16,18,20,24,30 min 共 15 种数据作为汇集时间间隔.在此基础上,基于交通状态矢量的交叉验证均方差模型,分别计算每种汇集时间间隔下基于交通状态矢量的交叉验证均方差.

图1为选取的主干道(长江路)、次干道(同丰路)及支路(中山路)相应断面不同汇集时间间隔下的交叉验证均方差值折线图.由图可知,不同等级道路的交叉验证均方差折线走势基本相同,这与交通流数据的周期性规律相一致;交叉验证均方差值随汇集时间间隔的增大而逐渐变小,最后趋于平缓,说明汇集时间间隔的增大可以在一定程度上平滑交通流数据的波动性.就交通状况实时监测而言,当汇集时间间隔达到某一值后,其交叉验证均方差值趋于稳定,此时可认为汇集时间间隔的增大对交通流数据的波动性影响较小.

图1 不同汇集时间间隔下交叉验证均方差值折线图

3.3 最优汇集时间间隔

采用t检验法对不同汇集间隔的交叉验证均方差均值进行显著性检验的目的是寻找确定的交叉验证均方差均值在一定置信水平上变化的拐点.由t检验方法的原理可知,10个工作日内所得到的相邻间隔的交叉验证均方差均值满足自由度为18的t分布.在一定的假设检验显著性水平上,若相邻时间间隔的交叉验证均方差均值的t检验统计值大于自由度为18的t分布值,则认为相邻时间间隔的交叉验证均方差均值具有显著性差异;反之,则没有显著性差异.若前后汇集时间间隔对应的均方差均值无显著性差异,则可认为该汇集时间间隔为最优汇集时间间隔.对显著性水平α=0.1(即t(18)=1.330 4)下的主干道、次干道及支路交通流数据所得不同汇集时间间隔的交叉验证均方差均值进行t检验,结果见表2.

由表2可以看出,在显著性水平α=0.1的情况下,对于主干道而言,汇集时间间隔为2,3,4 min时交通流数据的交叉验证均方差均值均有显著性差异.此时,可以认为汇集时间间隔的变化对于交通流噪声的消除是有显著影响的.随着汇集时间间隔的进一步增大,t检验结果显示,汇集时间间隔的变化对基于交通状态矢量的交叉验证均方差均值并没有显著性影响.因此,可以认为主干道交通流数据的最优汇集时间间隔为4 min.对于次干道而言,汇集时间间隔为2和3 min时交通流数据的交叉验证均方差均值均有显著性差异;汇集时间间隔为5 min时,t统计值出现突增,这与当天交通流数据变化较大有一定的关系,尽管如此,其t值显示无显著性差异.因此,可以认为次干道的交通流数据最优汇集时间间隔为3 min.对于支路而言,随着汇集间隔的增大,t值总体呈现减小趋势.当汇集时间间隔大于4 min时,汇集时间间隔的增大并不能显著减小交通流数据的噪声,因此可以认为支路的交通流数据最优汇集时间间隔为4 min.

由此可见,不同等级道路的最优汇集时间间隔存在差异,但差异性不大,这是不同的交通流特征导致的.对于交通流变化较频繁的断面,为了保留变化特征,汇集时间间隔不宜太大;对于交通流变化相对平稳的断面,其汇集时间间隔则可以适当减小,在最大程度保留交通流原始特性的同时去除较多的噪声和无用信息.在实际工程应用中,由于整数汇集时间间隔在计算上的便利性,交通流数据的汇集时间间隔往往会取整,如5,15,60 min等.基于上述分析,本文建议将城市道路交通流数据的最优汇集时间间隔取为5 min.

表2 不同等级道路的交叉验证均方差均值的t检验表

以主干道长江路为例,7月5日时间间隔为30 s和5 min时的交通流量日变化图分别如图2(a)和(b)所示.由图可知,当交通流数据以5 min时间间隔进行汇集时,原始交通流数据(时间间隔为30 s时)中的很多噪声被消除,可以更好地反映交通流运行状况,因而可以应用于城市道路交通流实时监测中.

图2 不同间隔交通流日变化图

4 结语

本文构建了一种基于交通状态矢量的城市道路交通流数据最优汇集时间间隔的交叉验证均方差模型,并对不同等级的城市道路交通流数据最优汇集时间间隔进行了量化分析.提出了一种基于t检验方法的城市道路交通流数据最优汇集时间间隔判别方法,通过判断相邻汇集时间间隔的交叉验证均方差均值有无显著性差异,来确定交叉验证均方差均值变化的拐点,即最优汇集时间间隔.基于昆山市实测道路断面的交通流数据,对不同等级的城市道路最优汇集时间间隔进行分析研究.结果表明:城市主干道交通流和支路的交通流数据最优汇集时间间隔均为4 min;次干道的交通流最优汇集时间间隔为3 min.实际应用中,鉴于整数的汇集时间间隔在交通运行状况评价指标计算上的便利性,建议选取5 min作为城市道路交通流数据最优汇集时间间隔.本文针对每一等级城市道路类型仅选择了1个断面的交通流数据来进行分析,因此下一步的研究可针对每一类型城市道路,选取多个断面交通流数据进行分析,以提高研究结论的普适性.

References)

[1]Guo J,Williams B M,Smith B L.Data collection time intervals for stochastic short-term traffic forecasting[J].Transportation Research Record,2008,2024:18-26.

[2]朱雷雷,张韦华,聂庆慧.干线公路交通流数据有效性检验规则[J].东南大学学报:自然科学版,2011,41(1):194-198.Zhu Leilei,Zhang Weihua,Nie Qinhui.Traffic data screening rules for highways[J].Journal of Southeast University:Natural Science Edition,2011,41(1):194-198.(in Chinese)

[3]Ni D,Leonard J D,Guin A,et al.Multiple imputation scheme for overcoming the missing values and variability issues in ITS data[J].Journal of Transportation Engineering,2005,131(12):931-938.

[4]Xia J,Chen M.Defining traffic flow phases using intelligent transportation systems-generated data[J].Journal of Intelligent Transportation System:Technology,Planning,and Operations,2007,11(1):15-24.

[5]Xia J,Chen M.A nested clustering technique for freeway operating condition classification[J].Computer-Aided Civil and Infrastructure Engineering,2007,22(6):430-437.

[6]Xia J,Huang W,Qian Z D.A clustering approach to online freeway traffic state identification using ITS data[J].KSCE Journal of Civil Engineering,2012,16(3):426-432.

[7]Qiao F,Yu L,Wang X.Double-sided determination of aggregation level for ITS data[J].Transportation Research Record,2004,1879:80-88.

[8]Gajewski B J,Turner S M,Eisele W L,et al.ITS data archiving:statistical techniques for determining optimal aggregation widths for inductance loop detectors[J].Transportation Research Record,2000,1719:85-93.

[9]Park D,You S,Rho J,et al.Investigating optimal aggregation interval sizes of loop detector data for travel time estimation and prediction[C]//Proceedings of the 86th Annual Meeting of Transportation Research Board.Washington DC,2007:101-107.

[10]Park D,Rilett L R,Gajewski B J,et al.Identifying optimal data aggregation interval sizes for link and corridor travel time estimation and forecasting [J].Transportation,2009,36(1):77-95.

[11]Smith B L,Ulmer J M.Freeway traffic flow rate measurement:investigation into impact of measurement time interval[J].Journal of Transportation Engineering,2003,129(3):223-229.

[12]于雷,陈旭梅,耿彦斌,等.基于小波分解的智能交通系统数据集成方法[J].清华大学学报:自然科学版,2004,44(6):793-796.Yu Lei,Chen Xumei,Geng Yanbin,et al.Optimized aggregation level for ITS data based on wavelet decomposition[J].Journal of Tsinghua University:Science and Technology,2004,44(6):793-796.(in Chinese)

[13]刘梦涵,于雷,耿彦斌,等.基于小波变换的ITS数据双侧最优化集成方法与应用[J].交通运输系统工程与信息,2008,8(1):49-54.Liu Menghan,Yu Lei,Geng Yanbin,et al.A doublesided optimization of ITS data aggregation via wavelet transformation[J].Journal of Transportation System Engineering and Information Technology,2008,8(1):49-54.(in Chinese)

[14]张卫华,赵铭军.指标无量纲化方法对综合评价结果可靠性的影响及其实证分析[J].统计与信息论坛,2005,20(3):33-36.Zhang Weihua,Zhao Mingjun.The influence of undimensionalization on the reliability of comprehensive evaluation results and an empirical analysis[J].Statistics& Information Forum,2005,20(3):33-36.(in Chinese)

猜你喜欢

交通流道路交通方差
《道路交通安全法》修改公开征求意见
概率与统计(2)——离散型随机变量的期望与方差
方差越小越好?
计算方差用哪个公式
基于加权组合模型的短时交通流预测研究
一种平稳化短时交通流预测方法
现代道路交通文化景观探究与实践
方差生活秀
欢迎订阅2017年《道路交通管理》杂志
欢迎订阅2017 年《道路交通管理》杂志