APP下载

高速公路交通事故持续时间概率预测模型

2016-06-08夏正丰

公路与汽运 2016年3期
关键词:交通安全高速公路

夏正丰

(东南大学建筑设计研究院有限公司,江苏南京 210096)



高速公路交通事故持续时间概率预测模型

夏正丰

(东南大学建筑设计研究院有限公司,江苏南京 210096)

摘要:通过对宁通(南京—南通)高速公路事件数据的转换处理,对交通事故事件展开统计分析,得到交通事故持续时间均值等主要信息;针对不同数据,应用不同分布模型进行拟合,发现事件持续时间数据分布具有右偏、长尾的特征,交通事故数据服从对数正态分布、对数Logistic分布;应用多元回归方法建立以事件持续时间为因变量、各影响因素为自变量的多元回归方程,对回归方程进行影响分析,剔除异常数据,提高模型预测精度。

关键词:交通安全;高速公路;事件持续时间;分布分析;逐步回归

由于各国公路管理方式及经营理念不同,道路交通事件的分类国内外并没有统一的标准。根据管理流程及工作人员的工作方式,可将高速公路事件划分为六类,分别为交通事故类、车辆救助、其他突发事件、恶劣天气事件、道路施工和交通管制。在上述六类事件中,交通事故和车辆救助为典型的影响高速公路运营效率和安全的事件,对其持续时间进行分析具有实际应用价值。该文以宁通(南京—南通)高速公路事件管理数据为研究对象,选择交通事故类事件展开分析研究。

1 分布分析

采用宁通高速公路2004—2009年的205项交通事故数据,应用Minitab统计软件对持续时间进行分布分析。分别选取常用的正态分布、对数正态分布、Logistic分布、对数Logistic分布、Gamma分布、Weibull分布进行拟合,同时对各分布分析进行Anderson-Darling检验,得到各自的AD统计量(见表1)。限于篇幅,这里仅提供部分回归概率分布图(见图1~4)。

表1 交通事故的持续时间分布

图1 交通事故持续时间的正态分布概率图

图2 交通事故持续时间的对数正态分布概率图

图3 交通事故持续时间的Logistic分布概率图

图4 交通事故持续时间的对数Logistic分布概率图

通过回归分析可知:1)交通事件持续时间均值为171.5 min,标准差为124 min,中位数为110 min,最小值为33 min,最大值为713 min。对应具体原始事件信息,得知最长时间的事件发生在雾天,造成拥堵并且涉及3辆车以上;而最小时间的事件发生在晴天,只涉及1辆小车。由此可见,车辆类型、车辆数、天气状况、拥堵情况与持续时间的长短存在一定的内在联系。2)如图1~4所示,直线下半部分的曲线点表示左尾的数据比拟合分布预期的少。3)若AD检验的P值(如果可用)低于选定的显著水平(0.05),则可得出数据不服从指定分布的结论。在95%置信水平下,对数正态分布和对数Logistic分布的P值大于指定的显著水平0.05(见表1),接受原假设,可认为宁通高速公路的交通事故数据服从这两种指定的分布,可用其进行持续时间范围及其概率预测,而其余分布模型不能很好地表征数据分布。

2 事件持续时间线性回归模型分析

分布分析方法和回归分析容易理解且易于快速获得相应的预测值,故利用类似回归分析的数学方法建立事件持续时间模型。

在回归分析中,因变量是事件持续时间,自变量是相关因素,主要包括时间因素、条件因素等(见表2),具体转化过程见文献[7]。

表2 事件持续时间相关变量的转化

续表2

由于涉及的变量较多,采用逐步回归的分析方法,这样所得到的最优方程能在最少的自变量与最佳的拟合效果之间达到平衡。所得回归方程为:

调整的相关系数R2为0.76,F检验的统计量为9.62,对应的P值为零,远小于显著水平0.05,所以该回归方程总体显著。

由式(1)可知持续时间最小值为49.06 min,这对时间较短的事件预测精度不是很高,同时天气及拥堵情况在该方程中系数较大,说明其对事件持续时间的影响显著。此外,在20多项影响因素中只有3个显著的变量,表明事故持续时间随机性强,规律不明确,很难用明确的变量来区分。这3个因素在事件初期较易获得,通过该回归方程能提供事件发生的短期预测值,可为管理人员在第一时间发布出行信息提供帮助。

3 影响分析及模型校正

回归分析中的一个重要假设是使用的模型对所有数据都是合适的。但实际中有可能模型适合于大多数数据,而一个或多个样本观测值与模型不相符。影响分析的目的是探查对拟合有异常大影响的数据并将其删除。采用该手段,利用剩余数据通过逐步回归方法重新建立回归模型:

调整的相关系数R2为0.82,明显大于式(1),F检验的统计量为13.71,对应的P值为零,远小于显著水平0.05,所得回归方程总体显著。比较式(1)和式(2),天气和拥堵情况变量的系数变化较大,这也表明影响分析的必要性和有效性。利用式(2)进行预测,模型预测结果和实际值的比较见图5。

从图5可看出:预测值的趋势与实际数据相符,但对于较小的实际值其预测值往往偏大、而较大的实际值其预测值往往偏小,这可能与预测模型选取的变量较少有关。采用回归手段对交通事故持续时间进行预测所获得的值趋向于均值,并且不会随着时间的发展而改变,使得该方法的用途受限。

图5 持续时间预测值与实际值的比较

4 结论

该文依托宁通高速公路,收集其交通事故和交通救助数据,分析研究了高速公路交通事件持续时间预测方法及模型,建立了交通事故持续时间的概率模型。主要结论如下:

(1)事故类持续时间远比救助类事件长;恶劣天气造成的事件持续时间显著长于其他天气情况,在高速公路运营管理中应对恶劣天气情况下车辆的行驶加强管理及引导。

(2)事件持续时间的分布具有右偏、长尾的特点;宁通高速公路的交通事故数据服从对数正态分布和对数Logistic分布。

(3)采用逐步回归分析的方法建立以天气、涉及车辆数、堵车车道数为自变量的多元线性回归方程,数据拟合表明该模型预测结果接近实际数据,能起到一定的预测作用。

参考文献:

[1] 刘伟铭,管丽萍,尹湘源.基于多元回归分析的事件持续时间预测[J].公路交通科技,2005,22(11).

[2] Ozbay Kaan,Pushkin Kachroo.Incident management in intelligent transportation systems[M].Artech House,1999.

[3] Kevin W Smith,Brian L Smith.Forecasting theclearance time of freeway accidents[R].Smart Travel Lab Report,2001.

[4] Choi H-K.Predicting freeway traffic incident duration an expert system context using fuzzy logic[R].University of Southern California,1996.

[5] Lin P,Zou N,Chang G.Integration of a discrete choice model and a rule-based system for estimation of incident duration:a case study in Maryland[A].83rd Meeting of the Transportation Research Board[C]. 2003.

[6] Anderson T W,Darling D A.Asymptotic theory of certain“goodness-of-fit”criteria based on stochastic processes[J].Annals of Mathematical Statistics,1952,23(2).

[7] 夏正丰.高速公路交通事件持续时间建模与预测[D].南京:东南大学,2010.

[8] 管丽萍.高速公路事件持续时间预测方法研究[D].长沙:长沙交通学院,2003.

[9] 彭非,王伟.生存分析[M].北京:中国人民大学出版社,2004.

中图分类号:U491.3

文献标志码:A

文章编号:1671-2668(2016)03-0052-03

收稿日期:2015-11-27

猜你喜欢

交通安全高速公路
高速公路养护与管理探讨
一辆开上了高速公路的汽车
为什么高速公路上不用路灯照明
试论如何加强企业交通安全管理工作
探析道路因素对城市交通安全的影响
乡镇道路交通安全
农村道路交通安全问题
基于交通安全的高速公路路线平纵组合设计
高速公路与PPP
高速公路上的狗