APP下载

基于多源数据的公里级路网数据采集方法研究

2022-08-09薛盘芬

时代汽车 2022年16期
关键词:路网路段百度

薛盘芬

安徽省交通运输综合执法监督局 安徽省合肥市 230041

1 引言

随着我国汽车保有量的逐步上升,普通国省道路网交通状况随着车流量的增多和交通需求的增长而每况愈下,常发性交通拥挤问题的不断恶化,交通高峰的不断持续,交通拥挤路段的不断增加,都对路网交通的运行管理能力造成严重的影响。路网运输监测数据是衡量路网运行管理能力的基本标准。通过对路网数据的采集和分析处理,从而进一步改善公路路网的交通拥堵状况。

目前,普通国省道主管部门主要通过交调站采集的数据来衡量路段的交通运行状况,然而由于交调站布设间距5-30km不等,交调站的数据无法准确反映路段的交通量。此外,已有研究对于ETC门架数据在普通国省道上的采集应用较为缺乏,只考虑到高速公路方面的数据采集。为了提升普通国省道感知能力,本研究运用公里级划分法并参考以往研究的多源数据采集方法,构建集成多源数据的多样化、分层次、综合性的路网运行数据体系。

2 数据现状

普通国省道交通状态多源数据主要是指动态的交通参数,具体为时间和空间上不断变化的交通流信息,可划分为点参数与区间参数,前者主要是指某一指定地点的交通存在状态,包括流量、地点车速、时间占有率、车头时距等,后者特指某一区域内的车辆运行状况,例如车辆的行程时间、交通流密度、车辆排队长度、区间速度等。

2.1 公路系统内数据

通过在全国的国、省、县、乡、专公路上设置固定或临时的交调站来获取公路交调数据,从而掌握公路网交通流的运行特征以及公路网的适应性程度,并进行统计、分析和预测,为公路规划建设、路网运行管理、交通应急处置、科研及社会公众服务提供公路交通信息。

交调检测数据主要包括速度、流量两大类。具体参数包括平均车头时距、小货交通量、小货平均速度、中货交通量、中货平均速度等,具有全天不间断采集,覆盖广、直接、精度较高等优点,布设间距少则3-5km,多则30km以上,但难以有效支撑路网路况的准确判别。

在应用方面,利用交调数据,结合轴载、车型组成等,确定养护计划;利用交调数据,测算养护经费;利用车辆高峰时间,确定养护时段。同时交调数据用于重大活动分析,如重大活动路网保畅工作、新路开通对区域路网的影响、交通管制政策实施效果评价、旅游服务项目对路网的影响等。

2.2 第三方导航平台数据

目前的第三方导航平台数据主要有高德、百度等手机导航数据,其数据源主要来自两个方面:一是公众数据,包含手机地图APP的导航回传和车载导航设备回传的定位数据;二是行业数据,包含通过置换和购买的方式主要是出租车数据,还有一部分是物流车和长途客车数据。互联网地图最基础的格式是定位点,一般隔几秒钟上传一次,是连续点的序列信息,能够完整地复现一个用户出行轨迹。将点位匹配到地图上,可以深入了解路网运行情况,根据用户需求提供多元信息,数据量大且覆盖面广,数据实时传输,稳定性强,能在一定程度上反映路网的运行情况。

3 公里级划分方法

通过对路网现状的调研分析,发现现有公路主管部门路网运行监测手段存在比较单一,监测路段划分不合理等问题,拟考虑结合现有数据(车检器、交调点等)、交通系统内其它数据(如ETC数据)、第三方(高德、百度等)导航系统数据、手机信令数据等,采用公里级路段划分算法,将路网运行监测数据以公里级粒度进行划分,以百度地图为底图,搭建全路网公里级多源数据融合应用与共享平台,为路段级路网运行状态监测、路网事件检测、路况短时预测、节假日流量预测等业务应用提供数据支撑。

3.1 公里级划分原则

公里级划分法主要以2km为标准对示范路段进行划分,并将重要交通场景,包括大型交叉口、桥梁等纳入独立的路段。

图1 公里级划分示意图

3.2 百度地图数据获取

百度公司提供路段划分软件平台功能,支持在地图上自由打断点的功能,断点确定后,自动生成所有细分路段的拥堵指数、拥堵里程和平均速度等数据。通过接口的方式进行对接,开发相应的程序主动捕捉百度共享数据,按照《百度数据对接协议文档》,解析完数据后,把数据保存到数据库中。以下为数据获取具体方式:基于百度调用权限获取重点道路路段详情接口,进而查询指定道路id的道路详情,即某一天从零点到二十四点内每5min粒度的指标。

表1 输入参数信息

表2 输出参数含义

4 采集方法

本研究主要以交通系统相关的企业单位为调研与对接对象,进行数据采集总体路线分析。通过制定数据交换与管理策略,包括数据管理交换策略、数据交换标准方法、数据存储规则、数据共享规则等将数据需求总体目标按数据归口单位进行分解,达到数据采集的目的。

4.1 数据交换标准方法

路网运行监测数据抽取是利用不同的工具、脚本等计算机程序,从各个相关系统中获取所需数据而同时不影响原有系统的正常运行的数据采集过程之一。数据抽取需考虑到数据的需求内容、传输网络、安全保密等,通过对公路体系内现有的数据以及外部支撑数据调研和协调,按数据提供方式,可将数据抽取方式分为数据库抽取与接口(API)抽取两大类。

1)数据库抽取

数据库抽取,是指原数据生产系统可开放已有的数据库或公路管理与应急指挥系统中已汇聚的数据库,利用ETL工具进行抽取的一种方法。存储于库表的数据,已经具备一定的结构化组织属性,关联性较强,基本可以被上层应用所使用。这类数据包括道路基础数据、公路设施数据、交通调查数据、“两客一危”数据、桥梁健康监测数据、路网事件数据、应急资源数据等。

2)API抽取

API抽取,是数据采集系统在考虑源系统数据安全性的前提下无法直接通过数据库获取数据时,只能经过源系统所开放的对应接口程序来传输数据的一种方法。目前,也是主流系统之间数据交互的重要方法之一。

API(Application Programming Interface,应用程序接口)是一些预先定义的函数,或指软件系统不同组成部分衔接的约定。用来提供应用程序与开发人员基于某软件或硬件得以访问的一组例程,而又无需访问源码,或理解内部工作机制的细节。良好的接口设计可以降低系统各部分的相互依赖,提高组成单元的内聚性,降低组成单元间的耦合程度,从而提高系统的可维护性和可扩展性。

4.2 数据共享规则

数据在经过抽取汇聚、清洗处理、存储管理后,最终回归到具体应用中时,共享这一环节,显得尤为重要。一方面,需要为上层应用提供足够丰富的数据,另一方面,还需考虑数据的安全性,具体是指在提供数据的过程中保证数据不篡改、隐私不泄露和服务不宕机。

数据库共享,是上层应用获取数据最为直接的方式。通过SQL直接读取库表中所需数据字段,能够大大减少中间转化过程,从而缩短开发周期以及实际应用中所存在的数据传输延迟。

对于上层应用,数据采集系统只需要根据不同应用的数据需求,开通使用者账户,配置管理数据库中的只读权限,即可保障数据安全的前提下进行数据交互与应用。

通过该共享方式,路网运行状态评价模型可直接使用汇聚清洗后的道路基础数据、交通调查数据、“两客一危”数据等,路网信息发布应用可直接使用汇聚清洗后的公路设施信息数据、路网事件信息数据等,应用不必再对接不同系统来获取数据,取而代之的是通过数据采集系统来获取包括静态、动态数据在内的所有需求数据,使之更专注于应用功能,实现数据与多元功能的灵活匹配与自定义。

图2 互联网数据交换方法逻辑图

具体地,针对不同网络下所部署的应用,分为内网数据库共享和外网数据库共享。应用部署于与数据采集系统在同一局域网内且组网中具备高等级信息安全保障机制,如路网运行状态评价、信息发布等,采用内网数据库共享;而应用部署于公网时,由于内外网隔离,无法直接访问本地数据库,如云控平台,因此需在雨花中心部署共享服务器,将内网数据库同步至该服务器上,而后外网应用通过访问此服务器,来获取数据,数据获取内容、频次等取决于数据同步。在具体实施中,将采用频率最小间隔、所有数据项同步的方式进行同步,来保证外网应用所得到的数据满足实时性、完整性、易用性等原则。

图3 数据共享规则逻辑图

5 结论

本研究基于百度地图对普通国省道进行公里级划分,并通过对既有数据(车检器、交调点、两客一危)以及其他交通系统内数据、第三方导航平台数据等进行分析,研究采取标准接口数据库直连和ETL工具来实现多源数据采集,搭建了全路网多源数据融合交换与共享体系,实现公里级公路数据采集,同时在普通国省干线创新应用了ETC门架数据,探索了ETC除收费功能外作为数据采集设备的应用,为路网运行状态监测、路网事件检测、路况短时预测、节假日流量预测等业务应用提供数据支撑。

猜你喜欢

路网路段百度
基于元胞自动机下的交通事故路段仿真
基于元胞自动机下的交通事故路段仿真
百度年度热搜榜
不懂就百度
走好人生“特殊路段”
百度年度人气萌娃
万有的百度