APP下载

基于手机GPS轨迹的出行方式判别分析研究

2018-07-05裴玉龙李浩然

关键词:平均速度小汽车步行

裴玉龙,李浩然

(东北林业大学, 哈尔滨 150040)

现今手机GPS定位技术已日臻完善,每一部智能手机都有GPS定位功能,这就会产生海量的轨迹数据。通过对轨迹数据的分析,可以得到很多与公共交通出行相关的信息。随着智能化、数字化生活的不断发展,各种手机应用层出不穷。现在很多手机应用都可以记录出行轨迹信息,只要能提取出应用中记录的出行轨迹信息,就能据此对出行目的、出行方式、出行分布等进行分析,对提高居民出行特征数据的准确度、及时性、可信度都有很大的帮助。

1 研究现状

能对手机GPS轨迹反映出的出行方式进行判别,就能掌握城市的交通结构,这对于解决城市交通问题至关重要。近年来,国内专家学者对GPS轨迹数据的研究很多,主要分为以下3个方面:

1) 提高手机GPS精度方面的研究

李传华、武文等[1-2]通过对GPS差分定位系统进行研究,可将手机GPS定位误差降低到4 m以下;夏敬潮[3]通过手机GPS定位与Wi-Fi信号的结合,确定了一种GPS辅助定位方法,对室内精确定位数据的获取提供了思路;田洋[4]基于手机安卓无线GPS定位系统设计出一套土地测绘系统,系统的定位精度可达到米级。随着定位精度的不断提高,手机GPS定位完全可以运用于交通信息的采集。

2) GPS轨迹数据交通信息提取方法研究

张冶华等[5-7]从轨迹数据的预处理出发,将轨迹点转化为连续轨迹、出行方式转换点的获取,最后对出行方式识别进行了研究,其在出行方式识别过程中多采用决策树、人工神经网络算法等。

3) GPS轨迹数据在交通方面的应用

杨超等[8-9]对手机定位数据进行研究,获取居民出行OD等出行特征信息。韦义明[10]运用手机GPS定位数据,使用主成分回归分析对交通流速度进行预测。

国外学者对利用GPS轨迹信息进行出行方式划分的研究也有较多,不过国外学者大多通过GPS接收器收集出行轨迹。Stopher、Chen和Rasmussen[11-13]均将GPS轨迹数据与地理信息相结合,对出行方式进行识别,而Schuessler等[14]则完全依靠对采集到的GPS轨迹数据进行清洗、平滑和轨迹段分割,不依靠附加信息对出行方式进行识别。

现有文献对手机GPS数据提取与出行方式选择进行了较为深入的研究,为解决出行方式判别问题提供了有益的思路,但利用判别分析这一数学工具对轨迹出行方式的相关研究却鲜见报道,而判别分析作为一种优秀的机器学习分类算法,由于其计算方法简便、对数据要求小而被广泛地应用在实际研究中。本文拟采用手机对不同出行方式轨迹进行收集,分析不同出行方式轨迹的特点,依据轨迹特点选出判别变量,分别用Fisher法与Bayes法对轨迹出行方式进行判别,为利用手机GPS轨迹大数据分析交通问题提供一定的参考和依据。

2 出行轨迹数据收集与轨迹特点分析

2.1 收集工具与收集方法

本次出行轨迹数据收集采用手机GPS记录的方法,实验设备包括某国产品牌手机一部、“分享轨迹”手机APP,如图1所示。实验对象采用不同种交通方式出行,分别记录不同种交通方式出行过程中产生的时间、速度、经度、纬度、水平精度等数据。

图1 数据收集使用器材

分别使用步行、自行车、常规公交、小汽车作为交通工具,实验对象使用APP记录的所在位置纬度、经度、速度、水平精度以及轨迹长度等数据,通过软件将数据提取出来。本次实验共收集到52条不同出行方式的轨迹数据,其中步行出行轨迹12条、自行车出行轨迹12条、常规公交出行轨迹14条、小汽车交通出行轨迹14条。一条轨迹数据中包含上百甚至上千个轨迹点数据,难以一一列出,因此以下仅列出轨迹数据形式,如表1所示。

表1 轨迹数据示意

2.2 出行轨迹特点分析

1) 步行出行轨迹特点

步行是最常见的出行方式,大部分城市的短距离出行都以步行交通方式为主。不同种交通方式之间的衔接也主要依靠步行。通过对步行轨迹数据的收集,在速度与地图匹配性方面对其进行分析。

通过12条步行轨迹数据计算得出步行轨迹的平均速度在3.69~6.51 km/h之间,轨迹数据中最高速度为7.2 km/h,最低速度为0。由于人身体的局限性,步行速度与其他交通方式相比速度较慢,但由于人的能动性,步行与其他方式相比更加灵活。此外由于人的适应性,步行与其他交通方式相比对道路环境的要求更低。

总结步行出行轨迹特点为:① 速度慢,一般步行速度在0.5~6 km/h之间;② 速度变化小,轨迹连续性高;③ 轨迹灵活,会出现在机动车不可能到达的地方。

2) 自行车出行轨迹特点

自行车出行是城市主要出行方式之一,方便灵活,是步行与使用车辆出行外的有效补充。近年来随着共享单车在国内的不断布局、投放,自行车出行的便捷性有了很大的提升,自行车出行率不断提高。

自行车也是靠人力驱动,其出行轨迹与步行出行轨迹类似,与机动车出行相比最大的特点是速度较慢,根据实际轨迹数据计算出自行车出行平均速度为8.52 km/h,轨迹数据中最高速度为11.23 km/h,最低速度为2.54 km/h。由于人身体的局限性,自行车出行速度与机动化出行相比速度较慢,但由于人的能动性,自行车出行与机动化出行相比更加灵活。此外,由于人的适应性,自行车出行与机动车出行相比对道路环境的要求更低。

总结自行车出行轨迹特点为:① 速度慢,一般为5~10 km/h;② 速度变化小,轨迹连续性高;③ 轨迹灵活,会出现在机动车不可能到达的地方。

3) 常规公交出行轨迹特点

城市常规公交最大的特点就是定点定线运行,本文主要根据常规公交的这个特点,在运行速度和轨迹与地图匹配性方面进行分析。

8条常规公交轨迹中平均速度最高为45.6 km/h,最低为17.48 km/h。速度极差最大的为54.7 km/h,最小的为32.2 km/h,平均速度与速度极差均远大于步行出行与自行车出行。根据收集的轨迹数据,常规公交出行速度变化较大,主要原因是常规公交到站必停,沿道路行驶会遇到交叉口信号灯变化、堵车等情况,导致速度变化较大。

总结常规公交出行轨迹特点:① 速度较快,平均速度大于10 km/h;② 速度变化较大,在公交站点会出现明显的速度低谷;③ 轨迹固定,沿现有道路延伸。

4) 小汽车交通出行轨迹特点

小汽车交通是与公共交通相对的一种出行方式,一般指私家车出行,但出租车、网约车提供的也是点对点的服务,载客后的行驶方式与私家车相同,所以本文在分析其轨迹时统一划归为小汽车交通,对其轨迹进行分析。

9条小汽车交通出行轨迹中平均速度最高为39.7 km/h,最低为16.2 km/h,平均速度区间与常规公交相比差别不大。轨迹中速度极差最大的为61.2 km/h,最小的为27.7 km/h,速度极差与常规公交相比差距也不大。小汽车交通出行速度变化较大,主要原因是沿道路行驶会遇到交叉口信号灯、堵车等情况,导致速度变化较大。由于小汽车交通点对点的特性,其轨迹会延伸到不通公交线路的道路,也不会在公交站附近出现明显的速度降低现象。

总结小汽车交通出行轨迹特点:① 速度较快,平均速度大于15 km/h;② 速度变化大,在道路交叉口处会出现明显的速度低谷;③ 轨迹较为灵活,可能会在小区内部、偏僻小道或支路上出现。

图2为不同交通方式速度分布概率,从图中可以明显看出不同种交通方式的速度分布区别:慢行交通(包括步行出行与自行车出行)的轨迹点瞬时速度多在10 km/h以下;步行与自行车出行速度概率峰值也有较为明显的区别;机动化出行(包括常规公交出行与小汽车出行)的轨迹点瞬时速度均匀的分布在2~60 km/h的区间上。常规公交出行与小汽车出行速度分布形式类似,仅凭速度难以对这两者进行区分。考虑到前述常规公交与小汽车交通的特点,引入20%分位数速度以下轨迹点落入公交站区域概率作为区分两者的判别变量。

图2 速度分布概率

3 判别变量选取及相关性分析

3.1 判别变量选取

依据本文对不同出行方式轨迹特点分析的结果选择以平均速度(X1)、速度极差(X2)、20%分位数速度以下轨迹点落入公交站区域概率(X3)作为判别变量。

1) 平均速度(km/h)

平均速度是单一轨迹出行距离与出行耗时的比值,是区分慢行出行与机动化出行之间最有效的指标,慢行出行速度一般与采用交通工具出行相差一个数量级,通过轨迹数据的分析可以清楚地看出步行轨迹平均速度在5 km/h左右,自行车出行在8 km/h左右,而机动化出行的平均速度达到了15 km/h以上。

2) 速度极差(km/h)

速度极差为轨迹点数据中瞬时速度最大值与最小值之差,是描述速度变化幅度的指标。慢行出行与机动化出行速度相差很多,通过速度极差可以很好地分辨慢行出行与机动化出行。此外,公共交通与小汽车交通由于运行方式、运行目的等不同,行驶方式也会有所不同,小汽车交通的速度极差与公共交通相比略大。

3) 20%分位数速度以下轨迹点落入公交站区域概率(%)

20%分位数速度以下轨迹点落入公交站区域概率是将轨迹点瞬时速度排序,位于20%分位数速度以下的轨迹点在公交站区域内的概率。公交站区域指将公交站看做一个长50 m、宽10 m的长方形区域,根据公交站点的实际分布情况,确定区域四角的经纬度,即可得到一个公交站的区域方程,可根据轨迹点的经纬度计算其是否落入公交站区域内。

通过对轨迹特点分析可以得出小汽车交通与常规公交最大的区别就是常规公交在固定的停靠站点会减速停止,而小汽车交通一般不会在这些站点减速停止,所以常规公交速度20%分位数速度以下轨迹点落入公交站区域的概率相较小汽车交通会更高。通过这个区别可以区分出常规公交出行与小汽车交通出行的轨迹。

3.2 判别变量相关性分析

借助SPSS软件采用皮尔逊系数法(Pearson法)进行相关性计算,得到表3判别变量相关性分析结果。

通过相关性分析结果可以看出:平均速度与速度极差的相关性为0.856,显著性检验值为0,远低于0.05;平均速度与20%分位数速度以下落入公交站区域概率相关性为0.691,显著性检验值为0,小于0.05;速度极差与20%分位数速度以下轨迹落入公交站区域概率相关性为0.517,显著性为0,小于0.05。

通过表3的数据可以得出平均速度与速度极差高度相关,且相关性显著。平均速度反映的是轨迹整体的快慢程度,而速度极差则体现速度的变化程度,虽然两变量高度相关,但因其表现内容不同,所以不做删减,都用来进行判别分析。平均速度与20%分位数速度以下轨迹落入公交站区域概率低度相关,对之后的判别分析无明显影响。

表2 不同出行方式判别变量

表3 判别变量相关性分析结果

注:显著性水平取值为0.05

4 判别函数构建

本文已对3个判别变量的相关关系进行了分析,3个判别变量都可以用来进行判别函数的构建,通过SPSS软件对数据的判别分析运算,得出典型判别函数公式对不同的出行方式进行判别分析。本文将出行方式分为慢行出行与机动化出行,在此使用两级判别分析,先对慢行出行与机动化出行进行判别,后对步行、自行车出行与常规公交、小汽车交通出行进行判别。

4.1 Fisher判别模型

1) 1级判别

以平均速度(X1)、速度极差(X2)、20%分位数速度以下轨迹点落入公交站区域概率(X3)作为判别变量;取慢行出行为1,机动化出行为2,作为因变量(分组变量)取值,利用SPSS软件根据表1中的数据进行分析,得到Fisher判别模型。

Y=0.046X1+0.143X2+

0.065X3-5.291

(1)

2) 2级判别

① 步行与自行车出行判别

对步行与自行车出行的判别仅采用平均速度(X1)、速度极差(X2)两个变量,取步行为1、自行车出行为2作为因变量(分组变量)取值。利用SPSS软件对不同种出行方式样本数据进行分析,得到Fisher判别模型:

Y=1.126X1-0.127X2-6.244

(2)

② 小汽车与常规公交出行判别

对小汽车与常规公交进行判别时要将20%分位数速度以下轨迹点落入公交站区域概率(X3)这个影响因素代入,这是小汽车与常规公交最显著的区别。取小汽车出行为1、常规公交出行为2作为因变量(分组变量)取值,借助SPSS软件对不同种出行方式样本数据矩阵分析,得到Fisher判别模型:

Y=-0.097X1+0.063X2+

0.217X3-3.318

(3)

4.2 Bayes判别模型

1) 1级判别

与Fisher判别模型相同,以平均速度(X1)、速度极差(X2)、20%分位数速度以下轨迹点落入公交站区域概率(X3)作为预测变量。取慢行出行为1、机动化出行为2作为因变量(分组变量)取值,借助SPSS软件对不同种出行方式样本数据进行分析,得到Bayes判别模型:

Y1=0.178X1+0.098X2+

0.02X3-1.472

(4)

Y2=0.544X1+1.224X2+

0.535X3-40.795

(5)

2) 2级判别

① 步行与自行车出行判别

借助SPSS软件对不同出行方式样本数据进行分析,得到Bayes判别模型:

Y1=6.79X1-1.616X2-14.647

(6)

Y2=9.412X1-1.912X2-29.185

(7)

② 小汽车与常规公交出行判别

借助SPSS软件对不同出行方式样本数据进行分析,得到Bayes判别模型:

Y1=0.223X1+0.761X2+

0.507X3-23.880

(8)

Y2=-0.062X1+0.947X2+

1.144X3-33.597

(9)

5 判别结果检验

根据上述判别函数,将步行出行、自行车出行、常规公交出行、小汽车交通出行样本各变量值代入以上2种判别函数进行回判。

5.1 Fisher判别模型检验

1) 1级判别模型检验

(10)

式中:n1为慢行出行样本数量;n2为机动化出行样本数量;n为样本总数。

将实际数据代入式(10)求得临界值Y0=-0.005 47,将样本X1、X2、X3代入式(1)进行计算,得到的值小于临界值,则为慢行出行;得到值大于临界值,则为机动化出行。对出行方式样品判别结果如表4所示。

表4 Fisher判别结果(1级判别模型)

Fisher判别模型对慢行出行与机动化出行方式的准确率为100%。

2) 2级判别模型检验

① 步行与自行车判别模型检验

依照上述对临界值的计算方法对临界值进行计算,得临界值Y0=-0.000 95,将样本X1、X2、X3代入式(2)进行计算,得到的值小于临界值,则为步行出行;得到值大于临界值,则为自行车出行。对出行方式样品判别结果如表5所示。

Fisher判别模型对步行出行与自行车出行方式的综合准确率为91.67%。

表5 Fisher判别结果(2级判别模型1)

② 小汽车交通与常规公交判别模型检验

依照上述对临界值的计算方法对临界值进行计算,得临界值Y0=-0.023 72,将样本X1、X2、X3代入式(3)进行计算,得到的值小于临界值Y0,则为小汽车出行;得到值大于临界值Y0,则为常规公交出行。对出行方式样品判别结果如表6所示。

表6 Fisher判别结果(2级判别模型2)

Fisher判别模型对小汽车交通出行与常规公交出行方式的综合准确率为96.43%。

5.2 Bayes判别模型检验

1) 1级判别模型检验

将样本X1、X2、X3代入式(4)、(5)分别进行计算,得到Y1、Y2,若Y1>Y2,则判定样本属于组1,即样本属于慢行出行;若Y1

Bayes判别模型估计慢行出行与机动化出行方式的准确率为100%。

2) 2级判别模型检验

① 步行与自行车判别模型检验

将样本X1、X2、X3代入式(6)、(7)分别进行计算,得到Y1、Y2,若Y1>Y2,则判定样本属于组1,即样本属于步行出行;若Y1

表7 Bayes判别结果(1级判别模型)

表8 Bayes判别结果(2级判别模型1)

Bayes判别模型估计步行出行与自行车出行方式的综合准确率为91.67%。

② 小汽车交通与常规公交判别模型检验

将样本X1、X2、X3代入式(8)、(9)分别进行计算,得到Y1、Y2,若Y1>Y2,则判定样本属于组1,即样本属于常规公交出行;若Y1

Bayes判别模型估计小汽车交通出行与常规公交出行方式的综合准确率为96.42%。

6 结束语

本文利用手机GPS轨迹数据,对不同种出行方式轨迹特点进行分析,依据不同出行方式的轨迹特点提出了平均速度、速度极差、20%分位数速度以下轨迹点落入公交站区域概率3个判别变量,分别利用Fisher法与Bayes法构建判别函数,对收集到的38份不同出行方式轨迹数据进行了判别,取得了较好的判别结果。虽然本文所判别的轨迹数据较少,也可能会出现一定的误差,且大规模的手机GPS轨迹数据较难收集,但为利用手机GPS轨迹大数据分析交通问题提供了一定的参考和依据。

[1] 李传华,孙礼军,陆林涛.GPS手机的差分定位系统研究[J].测绘科学,2012,37(3):50-51,28.

[2] 武文,李博峰,李振,等.采用GPS差分改正数提高手机导航定位精度[J].导航定位学报,2015,3(3):122-125,131.

[3] 夏敬潮,叶世榕,刘炎炎,等.Wi-Fi辅助下附有高程信息的GPS定位[J].武汉大学学报(信息科学版),2014,39(1):52-55.

[4] 田洋.基于Android的无线GPS定位系统设计[D].南京:东南大学,2016.

[5] 张治华.基于GPS轨迹的出行信息提取研究[D].上海:华东师范大学,2010.

[6] 邓中伟.面向交通服务的多源移动轨迹数据挖掘与多尺度居民活动的知识发现[D].上海:华东师范大学,2012.

[7] SHEN Y,DONG H,JIA L,et al.A Method of Traffic Travel Status Segmentatioin Based on Position Trajectories[C]//IEEE,International Coference on Intelligent Transportation Systems.USA:IEEE,2015:2877-2882.

[8] 杨超,朱荣荣,涂然.基于智能手机调查数据的居民出行活动特征分析[J].交通信息与安全,2015,33(6):25-32.

[9] 唐娟.基于手机定位数据的居民出行OD矩阵获取方法研究[D].成都:西南交通大学,2016.

[10] 韦义明.应用手机GPS数据预测交通流速度[J].电子产品世界,2016,23(7):67-69.

[11] STOPHER P R,GREAVES S P.Household travel surveys:Where are we going?[J].Transportation Research Part A Policy & Practice,2007,41(5):367-381.

[12] CHEN C,GONG H,LAWSON T,et al.Evaluating the feasibility of a passive travel survey collection in a complex urban environment:Lessons learned from the New York City case study[J].Transportation Research Part A:Policy and Practice,2010,44(10):830-840.

[13] RASMUSSEN T K,INGVARDSON J B,NIELSEN O A.Improved methods to deduct trip legs and mode from travel surveys using wearable GPS devices:A case study from the Greater Copenhagen area[J].Computers Environment & Urban Systems,2015,54:301-313.

[14] SCHUESSLER N,AXHAUSEN K W.Processing Raw Data from Global Positioning Systems Without Additional Information[J].Transportation Research Record Journal of the Transportation Research Board,2009(5):28-36.

猜你喜欢

平均速度小汽车步行
“运动的快慢”“测量平均速度”知识巩固
步行回家
小汽车
我的玩具小汽车
攀山擅离步行道自拍,不幸坠落身亡谁担责?
探究物体的平均速度
拼一拼
『运动的快慢』『测量平均速度』练习
把脉平均速度的测量
从步行到奔跑