APP下载

基于交通态势数据的高速公路拥堵分析

2021-09-10谷朋飞李俊异张特森戚将军

交通科技与管理 2021年21期

谷朋飞 李俊异 张特森 戚将军

摘 要:本文使用Python爬取高德地图的交通态势,收集了成都来渝方向高速路段4周的路况数据,以交通态势路况指数为指标对数据进行路网地图可视化,发现某些地区高速公路与城市道路的衔接地段较为拥堵,并初步细化了地区内的拥堵区域;以平均行程速度为指标验证了上述的拥堵区域。结果证明:成渝环线高速(白市驿互通到西环立交段与赖家桥立交到渝遂互通段)拥堵问题比较严重,对这几个互通区域的衔接道路以及周边路网进行协同研究。

关键词:交通态势;Python;平均行程速度

0 引言

近年来,随着重庆城市化、机动化进程的加快和“成渝双城经济圈”等国家战略规划的提出,促使城市间和区域内的人流量、车流量、信息流量快速增加。截至2020年底,重庆高速公路总里程数已达到3 400公里,省际出口通道由13个增加到24个,汽车保有量已经突破500万辆,这对重庆市高速公路与城市道路衔接提出了更高的要求。高速互通交通路况的拥堵程度是判断高速公路与城市道路衔接是否合理的一个重要标准,所以本文将对重庆境内的成渝环线高速拥堵路段以及拥堵程度进行细化与分析。

1 交通态势数据爬取

1.1 交通态势简介

交通态势数据是一类由高德提供的GPS点数据,经过ArcMap可视化后,可以反映道路的实时路况。数据中包含2个重要指标,分别是交通态势指数和平均行程速度。交通态势指数分为“0,1,2,3”,“0”表示路况未知路段,“1”表示路段畅通,“2”表示道路轻度拥堵,“3”表示道路重度拥堵;平均行程速度是一条道路上的某一区间路段的平均行程速度。

1.2 基本流程

(1)发送请求:申请“Web服务API接口”密钥(Key);拼接HTTP请求URL,申请的Key作为必填参数一同发送。

(2)获取响应:接收HTTP请求返回的数据(JSON或XML格式)。

(3)解析內容:主要是将爬取出来的数据进行解析,存入文件。

(4)保存数据:保存至数据库。本文将获得的交通态势数据保存为CSV类型文件。

1.3 实现方法

本文使用Python编码爬虫程序事先采集了成渝环线高速(重庆段)四周的路况数据,主要操作步骤如下:

首先,调用Python爬取模块当中所需的第三方库,包括requests,pandas,json,time模块。

其次,采集区域划分。本研究区域为成渝环线高速(重庆段)的范围,西南角的经纬度坐标为(106.227 817,

29.457 999);东北角的经纬度坐标为(106.502 819,29.687 256);但由于高德地图的矩形采集区域限制为对角线不超过10公里,故采用网格切分的思想,先将采集区域进行分割,划分为几个较小的采集区域。本文依据实际的面积大小,将采集区域划分为4*4区域(如图1所示),然后使用for... in range对每一个方格区域,进行循环依次采集。

最后,将运行的结果数据储存为csv文件,如图2所示。

c=pd.DataFrame(x,columns=['路名','交通态势','速度','经度','纬度','编号'])

c.to_csv('C:/Users/Learning/Desktop/交通态势/traffic.csv',encoding='utf-8-sig')

2 数据预处理

数据分析的成功与否,取决于采集的数据能否真实反映研究对象的情况,所以数据预处理是数据分析的重要一环。存在质量问题的数据即缺失值。缺失值主要包括数据记录的整体缺失,或者记录中的关键值字段缺失。处理方式分为两种,删除记录和缺失值插补。

本文对采集到的行程速度进行预处理。如果采集到的交通态势指数或平均行程速度不完整,关键路段值缺失,则需要对缺失值处理;处理的方式包括删除记录和数据插补。采集的数据缺失整条路的交通态势指数或平均行程速度值字段,即平均行程速度值字段为None,则删除该记录;若采集的数据缺失某点数据,则需要采用数据插补的方式。本文采取最近邻插补的方法,即在记录中找到与缺失样本最接近的样本的平均行程速度进行插补。

3 数据可视化

3.1 交通态势数据地图化处理

首先,打开ArcMap软件,将爬取的某一时刻交通态势数据以XY数据的形式导入,XY坐标分别对应经度和纬度,坐标系设置为WGS-84,点击确定之后,即可看到CSV文件成功的转换为了点要素文件(如图3)。其次,将该要素导出为SHP文件,接下来是利用点集转线工具将交通态势点转换为线,将除高速之外的路段数据剔除,然后对路况依据交通态势指数进行标注(如图3,红色为严重拥堵路段,黄色为较为拥堵路段,绿色为畅通路段)。

通过将四周的交通态势数据地图化处理,可以发现早高峰拥堵程度较为严重的区域有:渝遂互通和西环立交;晚高峰拥堵程度较为严重的区域有:渝遂互通、西环立交、白市驿互通和西永互通。接下来利用渝遂互通、西环立交、白市驿互通和西永互通四个区域的平均行程速度分布进行验证。

3.2 平均行程速度分布处理

从高德开放平台上爬取到的交通态势数据中的速度数据,是一条道路上的某一区间路段的平均行程速度,而互通区域可能包含多个区间段,所以需要对平均行程速度进行计算。计算公式为:

其中,表示某条道路某方向的平均行程速度,单位为km/h;D表示区域内道路的分段数;表示某一区间路段的平均行程速度,单位为km/h。

利用平均行程速度计算公式分别计算互通区域与环线高速相交路段早晚高峰的平均行程速度,以下为其中一周数据的计算结果(如图4所示)。

由以上5个高速互通区域路段一周的平均行程速度可以看出,早高峰时段,西环立交和渝遂互通的平均行程速度分布在30 km/h~40 km/h,白市驿互通和西永互通的平均行程速度分布在40 km/h~60 km/h;晚高峰时段,渝遂互通、西环立交、白市驿互通和西永互通的平均行程速度分布在30 km/h~40 km/h;物流园互通在早晚高峰时段的行程速度分布在90 km/h~95 km/h。

4 结论与讨论

通过对交通态势指数数据进行地图化处理,筛选出拥堵程度比较严重的区域,并对区域内的成渝环线高速路段计算平均行程速度,结果发现,渝遂互通、西环立交、白市驿互通和西永互通早晚高峰的平均行程速度与其他互通区域相比较低,由此可以得出,成渝环线高速(重庆境内)早高峰拥堵严重的区域为渝遂互通和西环立交,较为拥堵的路段为白市驿互通和西永互通;晚高峰拥堵严重的区域为渝遂互通、西环立交、白市驿互通和西永互通。

本文以高德交通态势数据为基础,主要确定了早晚高峰时段成渝环线高速在重庆市的拥堵路段分布以及拥堵程度,接下来以文章中提及到的拥堵区域为中心,重点研究高速公路与城市道路衔接中存在的问题。

参考文献:

[1]贺席燕,赵航,黄红良.贵阳市道路拥堵状态时空分布规律研究——基于出租车GPS大数据[J].人文地理,2018,33(3):112-120.

[2]盛宇裕,毕硕本,范京津,等.运用交通运行状况指标分析交通热点时空模式[J/OL].武汉大学学报(信息科学版):1-11[2021-05-18].

[3]丁涛杰,史殿习,李永谋.基于出租车GPS数据的道路平均速度估计方法[J].计算机技术与发展,2015,25(7):15-19.

[4]胡立伟,杨锦青,何越人,等.城市交通拥塞辐射模型及其对路网服务能力损伤研究[J].中国公路学报,2019,32

(3):145-154.