APP下载

公交IC卡数据分析处理方法研究

2018-01-15刘姣姣

科学与财富 2018年34期
关键词:分析处理公交

摘要:获取公交客流信息是公交运行工作中的基础,不仅为公交的日常调节提供了可靠的依据,也为公交的线路网优化提供了一定的参考。公交管理部门应当深入了解居民乘坐公交車出行的交通特点,及时准确的掌握出行数据,才能正确的对公交的运营线路和运营规划做出正确的调整。因此,合理的公交IC卡的数据分析处理方法,是建立高效的城市交通系统的一条重要途径。那么面对这些海量的公交数据,如何进行有效的处理和分析正是本文研究的目的。

关键词:公交;IC数据;分析处理

随着信息技术的飞速发展,智能交通系统在解决交通问题中显示着它越来越重要的地位,公交系统也渐渐开始向信息化的方向发展,IC卡、GPS定位技术的提出正是信息化发展的基础。将IC卡与GPS结合起来,通过对公交数据的分析和处理合理运用城市道路等固有配置,为公交日常调度提供切实有效的依据,并以此为基础运用先进的管理手段和技术,来保证城市交通系统的高效运行。

一、公交IC卡概述

公交IC卡已经在我国越来越多的城市被应用,已经成为公交收费的一种大势,这种方式不仅仅给乘客的付款方式提供了新的选择,也为公交数据调查提供了一种先进的调查手段,通过IC卡我们可以获得居民的IC卡号、刷卡路线、上车地点和乘客的上下车时间等,也可以得到乘客的基本出行信息。对这些基础数据进行分析和处理就可以得到该路线的基本客流量信息。IC卡统计出行数据具有高效、便捷、快速、低成本的特点。根据IC卡提供的信息可以跟踪了解乘客的出行习惯,但他的缺点是对使用现金的乘客无法统计。它的系统组成一般包括以下几个部分:IC卡、车载收费机、数据采集机、数据采集站、客运分公司、IC卡管理中心、IC卡充值点。

二、公交IC卡数据仓库建立及数据分析

2.1建设数据基础仓库

构建公交IC卡数据仓库之前,首先要确定信息体系构成,根据公交IC卡数据分析目标和数据分析过程,可以建立IC卡的数据分析系统,IC卡数据分析系统分为以下四个过程:数据采集、数据预处理、数据分析、数据解释。它又由三个数据模块构成,数据仓库模块、数据分析模块、分析结果显示模块。三个模块各自承担自数据采集、分析和处理职能,从而构成了完整的公交IC卡数据分析系统。数据仓库模块执行数据采集和数据的预处理职能,用于结合通过各个数据源获得的城市公交数据,并对数据进行降噪,转化和整合,处理过后的数据按主题储存到不同的表中,数据分析模块是通过计算机来完成库中的数据进行自动分析,分析结果显示模块可根据用户指定的运算规则和算法模型,给出报表或其他形式显示数据分析的结果,从而帮助运营者做出对城市公交运营的决策。

2.2数据仓库及数据分析工具选择

建立数据分析仓库的目的是对城市公交进行分析处理和决策支持,因此选择数据分析仓库也可是说是选择数据分析的工具,以便于后期数据分析。不同的数据分析工具有不同的优缺点,因此选择数据分析工具时应当趋合高效的理念。公交IC卡数据分析需要运用到多种数据来源,因此我们应当选择支持不同数据分析的数据平台仓库。大数据处理能力,公交IC卡的信息数据仓库数量相当大,分析工具必须具备大数据的处理能力,要求数据分析工具一定要有较快的数据处理速度,数据处理能力要和数据处理速度相等。分析工具的用户界面要快捷,让用户可自己选择算法,连接数据,开始任务,降低人为错误发生率,处理结果要具备可视化,能通过报表和图表等方式直面的呈现给用户。

2.3公交数据预处理

构建一个数据仓库,最基础的就是要有充足的数据来源,不仅仅只是传统的数据仓库,也可以是非结构化的信息,如文本文件,也可以从网络上获得资源,要保证能得出对决策者有用的信息就要保证外部数据的完整性、质量性。数据预处理是从海量的基础数据中提出有价值的信息或是清理一些杂乱的无效信息,从而避免被错误信息误导,改善数据质量和数据分析的速度。

三、基于公交IC卡数据采集改进

3.1基于系统聚类法的乘客上车点判断

系统聚类法是最常见的聚类分析方法,但也是最有效的聚类分析方法。它将需要类聚的n个样本各自看成一个整体,按照事先设定好的计算方法计各个样本之间的聚类指数,根据指数的大小将分析各个样本之间的密切指数,将关系最密切的两类并成一类,其余样本不变,在按上述方法重新进行计算和归类,循环进行下去,直到最后n个变量都归为一类。通过这种方法可以通过最短距离法对IC卡数据进行聚类和分组,得到样本数据,然后进行各站到各站的到站时间预测,将聚类分组中每组第一个样本刷卡时间与推算的时间进行比较,确定各组乘客的上车站点。具体流程如下:公交站IC刷卡信息——最短距离类聚分析——聚类分类——分组中第一个样本的刷卡时间——与人工预测时间相比——得到乘客上车地点。

3.2单个乘客刷卡数据的下车点判断

虽然因为公交单一的运行线路,以及下车不用刷卡等因素,无法对乘客的下车地点进行判断,但是居民的每日出行都具有一定的规律性。我们可以通过长期的归纳集合和短期乘客下车点的规律性,来进行乘客下车点的判断。例如拿工作来说:居民由居住地刷卡上车到达工作地上下车,完成第一次出行,工作结束后,该居民从工作地上车回到居住地,完成第二次出行,由此第二次出行的终点就可以认为是第一次出行的终点下车点。总而言之,在相当一段时间内乘客的乘车路线是保持不变的有一定的规律性,应当利用乘客多日的出行数据来进行分析从而判断乘客的下车地点。

四、结语

综上所述,通过对公交IC流量卡的数据分析得知,目前我国对于公交数据挖掘技术和公交数据库的建设还不够成熟。公交IC是城市交通运营中的重要一环,只有做好这一环的工作,完善公交系统的信息化程度,才能有效帮助公交系统运营者做出正确的决断。交通信息智能化的发展,可得到的城市交通信息和基础数据将更加丰富,根据海量的信息我们应当不断研究新的算法,从而得到更多,准确反映城市交通情况的信息,帮助完善城市交通线路规划。

参考文献:

[1]陈孟柯.基于公交IC卡数据的公共交通客流分析——以南京为例[J].科技视界,2016(22):157-158.

[2]宋竹,秦志光,徐进,吴斗.基于公交IC卡数据的大规模OD矩阵推导算法研究[J].计算机应用研究,2016,33(07):2007-2013.

[3]马晓磊,刘从从,刘剑锋,陈锋,于海洋.基于公交IC卡数据的上车站点推算研究[J].交通运输系统工程与信息,2015,15(04):78-84.

[4]陈君,杨东援.基于智能调度数据的公交IC卡乘客上车站点判断方法[J].交通运输系统工程与信息,2013,13(01):76-80.

作者简介:刘姣姣,出生年月:19890515,性别:女,民族:汉,籍贯(精确到市):天津市,当前职务:工程师,当前职称:助理工程师,学历:本科,研究方向:智能卡.

猜你喜欢

分析处理公交
“纳凉公交”值得推广
一元公交开进太行深处
等公交
风力发电机组批量性故障分析及处理
物理力学实验数据获取与受力分析处理探究
公交Ⅱ个股表现