APP下载

基于APTS数据的公交卡乘客通勤OD分布估计方法

2013-08-02杨东援

交通运输系统工程与信息 2013年4期
关键词:卡号工作日乘车

陈 君,杨东援

(1.西安建筑科技大学土木工程学院,西安710055;2.同济大学交通运输工程学院,上海201804)

基于APTS数据的公交卡乘客通勤OD分布估计方法

陈 君*1,杨东援2

(1.西安建筑科技大学土木工程学院,西安710055;2.同济大学交通运输工程学院,上海201804)

为提高通勤者使用公交出行的比例,有效缓解城市交通拥堵,对应用智能公交系统数据(Advanced Public Transportation Systems,APTS)获得公交通勤出行需求的方法进行研究.采集APTS数据,通过对公交IC卡数据和智能调度系统数据的关联获得公交乘客的上车站点信息.根据早、晚高峰的出行频率判断公交通勤乘客,利用通勤出行的时间和空间特征确定居住地点和工作地点.以此基本思路,提出公交卡乘客通勤OD分布估计算法,并应用海量APTS系统数据对算法进行了试验和分析.最后,通过与基于“出行链”的方法进行比较,分析了算法的精度.本文提出的方法具有精度高、可操作性强的优点,为快速、经济地获取公交通勤OD分布提供了一种新的途径.

交通工程;公共交通;通勤出行;OD;智能公交系统;公交IC卡

1 引 言

通勤交通是城市早、晚高峰客流的主要组成部分,吸引通勤者选择公共交通出行,对于缓解城市交通拥堵具有重要作用.掌握通勤者公交出行需求的特征和规律,是优化公交系统、更高水平地满足通勤出行需求的基础.传统的公交出行信息一般是通过大规模居民出行调查来获得,具有费用高、数据生命周期短的不足.决策信息的匮乏和滞后造成公交线网规划和公交运营计划难以根据出行需求的动态变化来进行及时调整.智能公交系统(Advanced Public Transportation Systems,APTS)除了提供公交系统的控制管理与交通信息服务外,还产生大量的系统运营数据,挖掘这些数据隐含的信息,为建立成本低廉、动态连续的公交出行需求分析方法提供了新的契机.美国东北大学David S.Navick(2002)[1]应用洛杉矶的公交电子售票数据分析乘客单条公交线路的站点间OD,这是国际上最早应用公交电子售票数据进行分析的研究之一.麻省理工学院的Alex Cui(2006)[2]根据连续两次公交乘车的关系推算公交卡乘客的下车站点.纽约城市公交的Janine M.Farin(2008)[3]对圣保罗市交通小区间的公交卡乘客的出行OD进行推算,并将得到的公交出行模式与居民出行调查得到的数据进行了比较.但该研究将每一次乘车作为一次出行,没有考虑同一次出行可能经过两次或多次公交的换乘来完成.目前公交乘客出行OD的推算,由最初的单条公交线路的站点间OD推算,向公交网络层面研究深入.

公交通勤乘客为城市常住居民,一般使用公交卡乘车,获得公交卡乘客的通勤OD分布,能够对公交通勤出行需求的特征和规律进行分析,本文对应用APTS数据估计公交卡乘客通勤OD分布的方法展开研究.

2 研究数据描述

本文采集了2008年12月南宁市57条智能公交线路的系统运营数据,包括公交IC卡数据、公交GPS数据、公交站点坐标数据和公交运行记录数据,公交IC卡数据来自公交自动收费系统,其他3种数据来自公交智能调度系统.在SQL-Server 2005数据库导入原始数据并进行数据预处理.将智能调度系统数据与公交IC卡数据关联确定公交IC卡乘客的上车站点,计算过程限于篇幅不再赘述.将已知上车站点信息的公交IC卡数据作为本文的基础研究数据,其字段描述如表1所示.

表1 研究数据字段描述Table 1 Fields description of research data

3 基本思路

通勤交通是城市公交服务重点保障的对象,准确掌握公交乘客通勤出行的起点(Origin)和终点(Destination),即公交通勤OD,对于公交系统的线网规划和运营管理具有重要意义.通勤交通是指家与工作地点(或者学校)之间往返的过程,通常一个工作日至少有两次出行.采用公交出行方式的通勤交通存在这样的规律:对于大部分公交乘客,其通勤出行的上车站点和下车站点总是相互转换的,即回程时的上车站点就是出发时的下车站点,而出发时的上车站点又是回程时的下车站点.同济大学的刘靓(2008)[4]利用深圳市IC卡数据研究地铁乘客的站点间OD、站点首达时间、使用的站点频率等出行特征,也证实了公交乘客的交通行为具有很强的时空规律性,即大部分人都是在家和工作单位两点之间展开出行,而出行时间和地点呈现24小时周期性.因此,通过判别公交乘客早、晚高峰经常性乘车的站点,可能判断通勤乘客的居住地点和工作地点.基于公交通勤出行规律,提出本文研究的3个基本假定:

假定1工作日早、晚高峰时段经常性乘坐公交的乘客为公交通勤乘客.

假定2公交通勤乘客早高峰时段经常性的乘车站点为居住地点.

假定3公交通勤乘客晚高峰时段经常性的乘车站点为工作地点.

根据以上分析和假定,本文提出方法的基本思路如下:

Step 1确定早、晚高峰时间范围及可能的居住地和工作地点.

以每个星期5个工作日的已知上车站点的公交IC卡数据作为通勤出行OD分析的基本单元.通过对公交乘客出行时间分布的分析,确定早、晚高峰时段.将通勤乘客早高峰的首次乘车站点作为可能居住地点,晚高峰首次乘车站点作为可能工作地点(包括上学地点).每个公交卡号5个工作日的高峰时段首次乘车的总次数表示为K,K最大为10次,早高峰和晚高峰首次乘车总次数分别表示为M和N,M和N最大为5次.

Step 2通勤乘客判定.

对公交乘客5个工作日高峰时段的出行频次进行统计,大于一定出行次数的乘客判定为通勤乘客.将公交通勤乘客K、M和N所应满足的最小值,分别表示为Kt、Mt、Nt,这3个参数的取值越大,通勤OD判断的准确性越高.将满足K≥Kt,M≥Mt,N≥Nt3个条件的公交卡乘客判定为通勤乘客.

Step 3通勤乘客居住地点和工作地点估计.

通勤乘客工作地与居住地之间存在多条公交线路可以乘坐的情况下,每次通勤出行乘坐的公交线路可能不同,即使每次乘坐同一条公交线路,也能选择在工作地或居住地邻近的不同站点乘车.因此,需要从早、晚高峰的首次乘车站点中确定出通勤出行的上车站点.本文采用乘车频次统计和空间聚类2个方法,来确定通勤乘客的居住地和工作地.

(1)乘车频次统计方法.

以乘客上车站点编号统计出5个工作日早、晚高峰首次乘车的站点中,使用频次最高的站点,将该站点5个工作日早、晚高峰的首次乘车次数分别表示为Mmax和Nmax.当Mmax大于早高峰首次乘车总次数M的1/2以上(即Mmax≥Int(M/2)+1),则将该站点确定为居住地站点(如M=5,Mmax≥3时).同理,当Nmax≥Int(N/2)+1,将该站点确定为工作地站点.

(2)空间聚类方法.

对于通勤交通有不同公交站点可以选择乘坐的情况,采用站点乘车频次统计方法推算通勤OD可能会出现漏判.在具有公交站点坐标数据条件下,对于站点乘车频次统计方法未确定出通勤OD的通勤卡号,再应用站点坐标空间聚类方法对其进行通勤OD确定.首先,计算通勤卡号早高峰(或晚高峰)首次乘车站点间的空间直线距离,将站点间距离小于设定聚类距离(取500 m)的站点划分为1类.然后,求出站点数最多的1类,如果该类的站点数(Mmax(或Nmax))超过早高峰(或晚高峰)首次乘车的站点总数M(或N)的1/2时,计算该类站点的坐标中心点.这个中心点坐标被确定为居住地(或工作地)地点坐标.

Step 4每个工作日早、晚高峰公交通勤OD统计.

将以上得到的5个工作日的通勤乘客卡号及其居住地和工作地信息,与通勤乘客早、晚高峰的上车站点信息进行比较,提取每个工作日的公交通勤OD.

4 算法提出

根据以上基本思路,提出基于APTS数据的公交卡乘客通勤OD分布估计算法:

Step 0给定Kt、Mt、Nt3个参数值.

Step 1将1个星期5个工作日已知上车站点的公交卡数据导入到数据库中的新表CommuterOD,保留每个公交卡号早、晚高峰时段内刷卡时间最早的一条记录,其它记录删除.

Step 2删除表CommuterOD中K<Kt、M<Mt及N<Nt的公交卡号的所有记录.

Step 3从表CommuterOD中提取一个公交卡号的全部记录,采用乘车频次统计方法判断.当Mmax≥Int(M/2)+1 and Nmax≥Int(N/2)+1时,得到通勤OD,取下一个卡号进行判断,否则到Step 4.

Step 4采用空间聚类方法进行判断(以居住地站点判断为例):

Step 4.1取出该卡号5个工作日早高峰首次乘车的所有站点,总数为M.

Step 4.2从M个站点中,取出一个站点Sj,计算其与所有站点的空间直线距离Lj,距离小于500 m的站点划分到与Sj同一个类中.

Step 4.3计算距离Lj小于500 m的站点个数mj(包括Sj).如果mj=M,则跳到Step 5,否则到Step 4.4.(mj=M表示M个站点之间距离全部小于500 m,即mj=M=Mmax)

Step 4.4取出该卡号的下一个站点Sj+1,重复Step 4.2-Step 4.3,直到M个站点全部计算完毕.

Step 4.5求mj中的最大值Mmax,如果Mmax≥Int(M/2)+1,则计算mj最大的这一类中站点之间的坐标中心.坐标中心通过计算站点坐标的均值得到,这个坐标中心点即为居住地点.

Step 4.6如果出现两个以上mj相同的站点,且同时为最大值Mmax,则再计算mj相同的分组中心点坐标的均值,作为居住地点坐标.

Step 5重复Step 3-Step 4,直到CommuterOD表中全部卡号计算完毕.

Step 6提取每个工作日的通勤OD.

算法Step 1-Step 2、Step 6在数据库中采用TSQL命令完成,Step 3-Step 5采用VB.NET程序实现.

5 算法试验

以南宁市57条智能调度线路2008年12月1日(星期一)~12月5日(星期五)5个工作日的182 007个公交卡号,共计899 174条公交IC卡记录作为算例数据.算法程序运行的计算机硬件环境为:双核2.8 GHz CUP;1 GB内存;300 GB硬盘.软件环境为:Windows XP操作系统;Visual Studio 2008开发环境;SQL Server 2005数据库.

由于Kt、Mt、Nt3个参数的取值越大,通勤OD判断的准确性越高,对Kt、Mt和Nt3个参数取值最小的条件进行测试,试验中设定Kt=2、Mt= 1、Nt=1.

算法程序Step3-Step5,3个小时完成运算,确定出5个工作日共36 882个通勤者的通勤OD对,其中采用乘车频次统计方法判断出23 624个通勤OD,运算结果如图1所示,字段描述见表2;采用空间聚类方法判断出13 258个通勤OD对,运算结果如图2所示,字段描述见表3.

图1 乘车频次统计方法推算部分结果Fig.1 Partial results of boarding frequency statistics method

表2 运算结果字段描述Table 2 Fields description of operation results

图2 空间聚类方法部分运算结果Fig.2 Partial results of spatial clustering method

表3 运算结果字段描述Table 3 Fields description ofoperation results

根据5个工作日通勤者的居住地和工作地信息,分别提取每个工作日早高峰(06:30~09:30)和晚高峰(16:30~19:30)的通勤卡号,并得到早、晚高峰的通勤出行OD,运算结果统计见表4.

5个工作日早高峰提取的通勤卡号比例,均在50%左右,晚高峰提取的通勤卡号比例总体低于早高峰,其中12月5日(星期五)最低为40.5%,其它4个工作日均在45%左右.晚高峰有部分市民下班后并非直接回家,所以晚高峰通勤交通所占的比例总体低于早高峰,周末(12月5日)最为显著.

经过统计,本算例中“朝阳广场”为工作人数最多的站点,这与朝阳广场是南宁市的城市中心,与就业人口最密集的地区特征相吻合.“朝阳广场”和“秀厢市场”站为通勤量最大的站点OD对,两个站点间距2.9公里,途径7个站点,有6条公交线路可以直达.

表4 运算结果统计Table 4 Statistics of operation results

6 算法验证

6.1 验证思路

将本文提出方法与国外研究提出的基于“出行链”的公交出行OD推算方法[5,6]进行比较.国外基于“出行链”的推算方法主要基于以下3个假设:

(1)“下一次出行”假设:同一乘客在同一天中公交乘车的下车站点大多接近下一次乘车的上车站点.

(2)“最后一次出行”假设:同一乘客在同一天中最后一次乘车的下车站点接近同一天第一次乘车的上车站点.

(3)“返程出行”假设:同一乘客在同一天中如果连续两次乘车的线路相同,方向(上行和下行)相反,则第一次乘车的下车站点为第二次乘车的上车站点,第二次乘车下车站点为第一次乘车的上车站点.

基于“出行链”的方法只能应用于乘客全天有2次以上公交乘车,对于全天只有1次乘车时,不能推算其OD.本文提出的公交通勤OD分布估计方法不受全天出行次数的限制.基于“出行链”方法的计算步骤,限于篇幅不再赘述.将2种方法共同能够推算出来OD的公交卡号提取出来,通过计算2种公交出行OD推算结果的一致比例,确定本文所提出的公交通勤OD推算方法的精度.

6.2 验证结果

将第5节的运算结果,与采用基于“出行链”方法的运算结果进行比较.通过运算,提取用于比较的OD对11 072个,2种方法推算结果的一致率为75.27%.根据现有研究结果,基于“出行链”方法所能推算出的公交乘客出行OD的准确率在90%以上[5,6].假设基于“出行链”方法的精度为90%,则本算例的公交通勤出行OD推算结果的准确率为83.63%(75.27/90%).由于Kt、Mt、Nt3个参数的取值越大,通勤OD判断的准确性越高,对Kt、Mt、Nt3个参数在不同取值条件的精度进行了试验,结果见表5.

表5 不同参数条件验证结果Table 5 Verification results in different parameter

表5中,当Kt=6、Mt=2、Nt=2时,2种方法推算结果的一致率为88.51%,公交通勤OD推算结果的准确率已达到98.34%(82.0/90%).验证结果表明,本文提出的方法其精度能够满足城市交通规划的数据要求.

7 研究结论

本文对应用APTS数据估计公交卡乘客通勤出行OD分布的方法进行研究,提出的方法具有以下特点:

(1)可判别公交卡通勤乘客,推算其居住地和工作地位置信息,得到每个工作日早、晚高峰的通勤OD分布.

(2)与传统居民出行调查方法相比,具有费用低、样本量大、数据可动态更新的优点.

(3)与基于“出行链”推算公交卡乘客出行OD方法相比,其不受公交乘客全天乘车次数的限制.

(4)算法的精度高、可操作性强,可以应用于实际公交通勤出行需求的动态监测和分析.

本文限于数据条件,仅采用了部分公交线路的数据进行了试验,随着智能公交系统的广泛应用,当使用全部公交线路数据计算时,所获得的公交通勤OD的精度和样本量还能够得到进一步提高.

[1] Navick DS,Furth PG.Using location-stamped farebox data to estimate passenger-miles,O-D patterns,and loads[C].TRB 2002 Annual Meeting,2002.

[2] Cui A.Bus-passenger origin-destination matrix estimation using automated data collection systems[D].MIT Master Thesis,2006.

[3] M Farin J.Constructing an automated bus origin-destination matrix using farecard and GPS data in Sao Paulo,Brzail [C].TRB 2008 Annual Meeting,2008.

[4] 刘靓.普适计算环境下居民交通行为特征研究[D].同济大学,2008.[LIU L.Research on inhabitant travel behavior under pervasive computing environment [D].Tongji University,2008.]

[5] Barry JJ,Newhouser R,Rahbee A,et al.Origin and destination estimation in new york city using automated fare system data[J].Transportation Research Record, 2002,(1871):183-187.

[6] Zhao J,Rahbee A,Wilson N.Estimation a rail passenger trip origin-destination matrix using automatic data collection systems[J].Computer-Aided Civil and Infrastructure Engineering,2007,(22): 376-387.

Estimating Smart Card Commuters Origin-Destination Distribution Based on APTS Data

CHEN Jun1,YANG Dong-yuan2
(1.School of Civil Engineering,Xi'an University of Architecture&Technology,Xi'an 710055,Shaanxi,China; 2.School of Transportation Engineering,Tongji University,Shanghai 201804,China)

Increasing the proportion of commuters travelling by public transportation can effectively ease urban traffic congestion.This paper addresses the application of Advanced Public Transportation Systems (APTS)data to analyze transit commuters travel demand.This study involved collection of APTS data and boarding stops information by combining smart card data and intelligent dispatching data.Transit commuters were judged according to travel frequency of morning and evening traffic peaks.The residences and work places were identified by spatial-temporal characteristics of commuters travel.Based on this idea,an estimation algorithm was proposed.The algorithm was tested and analyzed using large-scale APTS data. Finally,the method's accuracy was analyzed by comparison with the“Trip-chain”method.The proposed method provides some advantages including,high accuracy and strong operability.The study provides a fast and economic new approach to acquiring transit commuters Origin-Destination(OD)distribution.

traffic engineering;public transportation;commuters travel;OD(Origin-destination); advanced public transportation systems(APTS);smart card

U491.1Document code: A

U491.1

A

1009-6744(2013)04-0047-07

2013-01-23

2013-04-08录用日期:2013-04-15

国家自然科学基金项目(51208408);陕西省教育厅科研计划项目(12JK0797).

陈君(1977-),男,陕西平利人,讲师,工学博士.

*通讯作者:chenjuntom@126.com

猜你喜欢

卡号工作日乘车
河南省长葛市彩红蜂衣蜂帽加工厂
河南省长葛市彩红蜂衣蜂帽加工厂
这一次优步乘车,让我感动了
关于休闲的量的问题的考察
乘车
好老板
对《资本论》中工作日问题的哲学思考
郑州局办理业务全程提速