APP下载

基于Wi-Fi探针数据分析末端片区交通行为特征
——以北京西城区月坛街区为例

2022-04-12陈廷照陈艳艳赖见辉王子理

北京工业大学学报 2022年4期
关键词:探针高峰道路

陈廷照,陈艳艳,赖见辉,王子理

(1.北京工业大学城市交通学院,北京 100124;2.济南市道路和桥隧服务中心,济南 250101)

街区的发展是城市可持续发展的重要组成部分,也是城市规划和管理的基本单元.已有的城市研究对街区的探索还比较有限,多以定性描述街道环境为主,定量研究较少,并且受限于数据的获取形式.最常用的建筑环境指标是3Ds[1]和5Ds[2],其中3Ds是指密度、多样性和设计,5Ds是指密度、多样性、设计、交通距离和可达性.近年来,关于街区指标评价方面的研究不断地丰富[3-5].这些指标在分析街区出行行为特征的时候具有一定的合理性,但在系统地反映街区形态方面限制了数据的数量和多样性,从而阻碍了深入分析.

目前,智能(integrated circuit,IC)卡数据终止于公交站点和地铁站点,手机信令数据覆盖范围过大,无法具体到街道层面的分析.许多研究者试图使用手机数据研究街区的活力[6-8].但是市区内手机基站的覆盖半径为200~500 m,致使分析小范围街区精度达不到.Wi-Fi探针技术凭借其短半径覆盖范围、高频率上传数据、灵活的安装位置和可控的安装密度等特点,可实现对手机基站覆盖不到的范围或覆盖到却不能具体到街道的范围进行精细化分析.随着科技的进步,Wi-Fi定位技术的研究和应用得到了迅速的发展,可以实现对校园、购物商场、公园等特定区域内人员的实时定位跟踪[9-10].Abedi等[11-12]通过实验指出Wi-Fi探针相对于蓝牙可以探测样本量更大的数据,提出Wi-Fi探针数据可以较精确地测量小范围的行人和自行车的行程时间及其运动行为特征.Sakib等[13]针对Wi-Fi匿名MAC地址,提出了一种既不泄露真实MAC地址,又可追踪定位移动用户的数据处理方法,且准确率接近83%.文献[14-16]利用Wi-Fi探针技术评估了巴士线路的客流并进行了识别.Tsubota等[17]在交叉口布置蓝牙探针检测分析了交叉口的拥堵情况.

因此本文提出了以Wi-Fi探针数据为主,路况数据和视频数据为辅的街区时空出行行为特征分析方法,揭示末端出行街区的交通运行状态、公共交通出行特征和地铁接驳路径偏好,最终实现街区的精细化评估,并为将来街区的设计和决策奠定基础.

1 研究方法

1.1 案例选址

月坛片区涵盖行政单位A和B两大部门,片区内交通秩序混乱,且片区内包含商业、办公和住宅用地,是一个典型的公-商-住的街区,因此本研究选择北京市西城区月坛片区为研究对象,研究范围870 m×720 m,北起月坛南街,南至复兴门外大街,东起三里河东路,西至三里河路,占地面积约626 400 m2.如图1所示,该片区包含了3个行政单位、2个居民小区、4处教育单位、1处医疗单位,三里河南横街以南居住区居多,片区周边有16个公交站点,一个地铁站点.内部主要横向道路为三里河南横街,纵向道路一巷、二巷、四巷、五巷、六巷东侧路、六巷、七巷、八巷均为单向道路.早晚高峰期间交通秩序杂乱.本研究主要以行政单位A、B工作人员的末端出行分析街区公共出行特征和接驳路径偏好.

1.2 数据获取

本研究首先采取高德2020年6月1—5日5个工作日的实时车辆速度和拥堵延迟指数对研究片区周边道路的运行情况进行分析,给研究片区的交通状态进行定位.由于路况数据在街区微观交通层面的不足,本文主要采用Wi-Fi探针技术获取此前无法获得或难以获取的人口活动微观层面信息.然而,本研究仍存在一定的局限性.例如,抽样数据存在偏差,包括智能手机用户和普通人群的年龄和性别分布模式之间的差异.未来无线局域网(wireless local area nework,WLAN)技术的逐步成熟和日益广泛的覆盖,越来越多的人能够使用无线网络,使精细化地刻画街区微观交通画像成为可能.

Wi-Fi探针探测范围为80~100 m,以250 ms的频率采集数据并主动上传,可实时获取手机等移动设备的移动终端(media access control,MAC)地址和接受的信号强度(received sigal strength indication,RSSI)数据.结合Java编程对采集数据进行整合上传到后台数据库,经Python编程进行后期分析处理.具有Wi-Fi功能的移动智能设备与无线热点之间的2种状态为连接和断开.智能手机的Wi-Fi功能一旦开启,就会主动向Wi-Fi基站发送探测请求帧,并接收提供网络服务接入点的探测响应帧,从而获得网络信号.无论移动设备是否连接,探测请求帧发送的信号都包括移动智能终端的MAC地址、RSSI数据和相应的时间戳.Wi-Fi探针收集来自用户终端的请求帧信号,并读取其中包含的信息.其中MAC地址为手机等移动终端的唯一编码,存在广告商通过Wi-Fi探针的手段对接入手机推送广告的现象,导致用户的隐私泄露且可能被恶意利用.Wi-Fi探针数据在格式上类似手机信令数据,本文在规则化获取的情况下用于合法的分析,为街区的发展做贡献.

Wi-Fi探针设备安装完毕后,启动电源键,进入数据采集状态,当监测点向数据库传回监测数据时,会得到数据库中的表格数据.图2说明了数据采集过程.Wi-Fi探针设备自身携带蓄电电池,由于片区内道路狭窄、建筑密集,道路被从居民家里或商铺里发射的WLAN信号覆盖,为周围的Wi-Fi探测设备和移动终端提供WLAN支持.Wi-Fi探针布置在周边公交站、重点关注单位和小区开口路侧,为了尽可能地捕获片区内的出行人员,提高数据采集效率.Wi-Fi探测器根据其有效探测半径进行布置,收集接收到的信号并通过电信基站提供的局域网发送到笔记本终端.在数据采集完成之后,基于一定的规则采用Python编程分析用户的末端接驳出行特征.

本文探究月坛片区内行政单位A、B工作人员的公共出行情况以及B单位工作人员的地铁出行轨迹,由于探针设备有限,将采集调查分为2个部分,如图3所示,采集时段选取包含该片区早晚高峰的工作时间段.第1部分将Wi-Fi探针布置在行政单位A、B的门口和周边公交站点,共布置了24部探针设备,采集时间为2019年10月11日7:00—19:00;第2部分将Wi-Fi探针布置在三里河南横街以南的居住区、行政单位B门口及木樨地地铁站点,共布置了29部探针设备,采集时间为2019年10月16日7:00—19:00.

为了验证Wi-Fi探针的流量分析精度,本文采集了特定位置同时间段、相应路段的视频数据.图4为现场视频采集环境,由于探针和视频采集器合并安装在三角支架上,探针和视频采集器的安装位置为图片不可见的采集视角位置.

图4 数据收集位置 Fig.4 Location of data collection

1.3 数据处理

Wi-Fi探针设备每250 ms向平台上传一次采集数据,再经过程序转换进行存储.在进行分析之前,需要对数据进行预处理.为了保证数据的准确性和完整性,需要对数据进行清洗,处理后的数据按照时间顺序进行存储.最后对分析后的数据进行可视化,作为后期研究群体行为特征的基础.在数据隐私方面,后续关于末端出行特征的分析并不涉及用户的具体MAC地址,唯一编码的出现时间和序列足以揭示上述特征,因此在数据处理的过程中,以简要编码代替用户的MAC地址,达到保护用户隐私的效果.

数据清理是指按照一定的原则对数据库中错误的或缺失的数据进行整理或改正,去除误导信息,从而保证结果的准确性和科学性.包括检查数据格式的一致性、删除无效数据或补充缺失数据.因Wi-Fi探针设备的无故断电导致的数据缺失在本文无法进行修正.在数据采集过程中,调查者以15 min为间隔查看设备是否正常运行,若不能正常运行立即重启设备,将此项误差降到最低.通常,需要过滤和纠正2种类型的数据:异常值和错误数据.一般来说,在处理阶段,通过对数据的清洗和过滤,可以约束离群值的采集,并容易地从平台上清除.错误数据包括MAC地址的数字异常、时间戳异常和信号接收强度的不规则状态.此外,由于数据属于同一用户在限定空间内移动,删除错误数据对研究结果没有影响.在实际的采集过程中,Wi-Fi探头也会从一些固定的设备上采集信号,比如路侧商铺和居民楼中的电脑,而这部分数据往往只在一个探针设备下被采集且RSSI变化波动不大,较容易被识别.因此,为了降低数据处理的复杂性,提高数据处理的效率,必须通过数据处理过滤掉无用的数据.

在数据的采集过程中应尽量地避免人为和非人为的误差,以获得真实可靠的结果.但由于数据量大,设备运行具有不确定性,因此不可避免地会产生数据偏差.本研究提出了3种误差可能.

1)无线信号的传播属于电磁波,街区内的复杂环境阻碍Wi-Fi信号的传播,导致移动终端被探测到的RSSI小于空旷空间中相同距离位置的强度.但由于在处理过程中本文不进行明确的距离判断,且处理的是移动的个体用户,因此该项误差对结果的影响降到最小.

2)不能全样本地监测到经过探针布置区域的人群.老人和小孩拥有移动手机的概率较低,即使他们拥有移动手机,如果移动设备不开启WLAN功能,也无法探测到这部分人群的信息.鉴于此,真实的人群数据与采集数据之间存在缩样指数.

3)程序分析误差.在程序分析过程中可能会出现隶属误差,这个非人为误差通过实际对比矫正关键点进行修正.

1.4 数据分析

本研究利用Python程序语言对采集的Wi-Fi探针数据进行处理,利用ArcGIS技术对个体时空轨迹进行可视化分析.对不同空间、不同时间的人口流动特征进行收集和分类,并导出直观的分析图,这是得出结论的重要依据.本文通过交通运行状态、公交接驳特征和接驳路径选择偏好3个方面来分析末端接驳片区的交通行为特征.

首先,依据高德路况大数据对研究片区的总体交通运行状态进行定位,明确对研究区域进行微观分析的必要性.建立道路的运行速度及交通拥堵延迟指数指标,其中交通拥堵延迟指数指平均一次出行实际旅行时间与自由流状态下旅行时间的比值.

式中:vi为该时段检测到的用户行驶速度;vj为路段的自由行驶速度;e为交通拥堵延迟指数.

其次,基于Wi-Fi探针采集到的数据,按一定的规则识别行政单位A、B的工作人员,分析其使用周边公交出行的特征.其中包括公共出行分布、末端接驳时耗、接驳方式划分.

识别规则:早晚高峰活动在公交站点和单位的,包含中午外出吃午餐的用户人群.

公共出行分布:根据识别到的行政单位A、B的工作人员,计算其早晚高峰经周边公交站点与地铁站点出发和到达的数量分布.

末端接驳时耗:行政单位A、B采用公共出行方式的工作人员在单位至公交站点之间通行消耗的时长.

接驳方式划分:根据接驳行驶速度划分出行方式,其中将行驶速度小于4 km/h的认为是步行到达,将4~15 km/h的认为是骑行到达.

由于路况数据的不全面性,使用1 d内Wi-Fi探针采集到的用户数量,分析每个Wi-Fi探针所在路段的交通流量时空分布规律,并以早高峰在特定Wi-Fi探针位置同时采集的视频数据统计的路段流量作为实际道路断面流量,将Wi-Fi探针探测的断面流量与实际流量之比定义为缩样指数.另外,使用者在空间内的活动顺序代表了行人以某种目的出行的路径选择.通过整合该片区内单位B工作人员经木樨地地铁站出行的路径选择特征,得到该活动空间内地铁选择偏好路径.该结果可用于评价道路交通的活力,从而为优化道路空间提供决策支持,提升街区的慢行舒适度.

2 结果

2.1 交通运行状态

利用高德2020年6月1—5日5个工作日的实时车辆速度和拥堵延迟指数,分别分析内部道路和外部道路的速度和拥挤情况.以三里河南横街为例,如图5所示,24 h的拥堵延迟指数在7:00—8:00和17:00—18:00显示出较明显的双峰特征(侧面印证了Wi-Fi采集时段的合理性),且白天速度在20 km/h上下波动,原因是三里河南横街双向两车道,且宽度约为6 m,道路狭窄及穿行行人较多造成内部道路不畅.相对于内部道路和外部道路的双峰特征早晚高峰车速降低更明显,拥堵延迟指数早晚高峰时段最高达2.5,说明在该时段拥堵非常集中.如表1所示,外部道路的全日平均速度大于内部车道,且早晚高峰外部道路的平均速度也大于内部道路.对于面积只有0.63 km2,集中了教育、住宅、行政单位和商业的月坛片区来说,探索这样一个典型的混合功能的小型街区有利于加深对该类型街区的了解.

表1 平均速度Table 1 Average speed km/h

图5 三里河南横街双向运行状态雷达图 Fig.5 Radar map of the two-way operation state of Sanlihe South Horizontal Street

2.2 末端出行特征

2.2.1 公共出行分布

一号线木樨地地铁站经月坛区域,地铁站距单位A路径长约1 000 m,距单位B路径长约667 m.月坛区域附近共设有16个公交站点,途经30余条公交线路,公交站点的具体位置参见图1.

本节分析结果是基于第1部分调查数据得出的,本调查共获取数据1 073 586条.按识别原则识别单位A、B工作人员至周边公交站点的出行分布,单位A工作人员早高峰7:00—9:00至木樨地北站、木樨地地铁站及西城三里河站的人数最多,分别约占16.61%、23.88%和23.52%;晚高峰17:00—19:00至西城三里河站和木樨地地铁站的人数最多,分别占23.60%、26.97 %.可以看出,早高峰交通出行多以地铁出行为主,其中吸引力比较强的公交站点为西城三里河站和三里河东口站,这跟站点途经的公交线路数密不可分.另外,虽然木樨地地铁站相当于单位A的位置较远,但其吸引强度是最大的.足以说明,地铁站点的吸引力范围在1 km以内是有效的.具体分布如图6所示.

图6 早晚高峰单位A、B工作人员的公共出行比例Fig.6 Proportion of public travel of A and B staff in morning and evening peak hours

单位B至周边公交站的出行状况:早高峰7:00—9:00至木樨地地铁站的人数最多,约占57.27%;晚高峰17:00—19:00同样至木樨地地铁站的人数最多,约占46.67%.其余公交站点占比均不足20%.可以看出,单位B早、晚高峰交通出行以地铁出行为主,公交起到辅助作用.

2.2.2 末端接驳时耗

对单位A、B的工作人员在早晚高峰时段前往各公交站点的平均出行时间和出行方式进行分析,其中早高峰公交站点平均出行时间是指乘客早高峰从公交站点下车去往单位A、B的平均出行时间,晚高峰公交站点平均出行时间是指单位A、B的工作人员在晚高峰至公交站台的平均出行时间.单位A工作人员早高峰从公交站点下车至单位的平均出行时间192 s;晚高峰从单位至公交站点的平均出行时间251 s.单位B工作人员早高峰从公交站点下车至单位的平均出行时间148 s;晚高峰从单位至公交站点的平均出行时间138 s.单位A的早晚高峰平均出行时间比单位B的要高,但均在5 min以内,出行时间与单位距离公交站点的距离呈正相关,因此该片区内的公交出行可达性是比较合理的,如图7所示.

图7 早晚高峰单位A至公交站点的公共出行时间与距离的相关性Fig.7 Relationship between public travel time and distance between unit A and bus stations in morning and evening peak hours

2.2.3 接驳方式划分

假设与公交站点的接驳方式只有步行和骑行2种.单位A早高峰出行多以步行为主,自行车也占有一定出行比例;晚高峰从单位至公交站点的出行多以步行为主,距离近的车站步行出行方式占比更高.单位B早高峰从公交站点下车至单位的出行多以步行为主;晚高峰三里河东路南口,西城三里河站和玉渊潭东门站使用自行车出行的占比超过50%.对比单位A和B的出行方式,发现2个单位多以步行出行为主,且呈现出距公交站点越近步行出行方式占比越大,越远自行车出行方式占比越大的特征,如图8所示.

图8 早晚高峰单位A、B的出行方式占比Fig.8 Proportion of travel modes of A and B in the morning and evening peaks.

2.2.4 接驳路径偏好

本节分析结果是基于第2部分调查数据得出的,主要用于探究单位B工作人员的地铁出行特征.通过统计分析Wi-Fi探针测点数据,得出7:00—19:00的流量时空斑图,如图9所示.早高峰三里河南横街、七巷的人流较大,其次是六巷.晚高峰同样是三里河南横街、七巷的人流较大.说明纵向七巷与六巷是住宅区内的主要交通通道,横向主要通道为三里河南横街.另外编号4032的探针在中午11:00—14:00间的流量较高,由于六巷东侧路里有较多的小餐馆和超市,在中午午餐时间吸引较多的顾客.根据同时布置在现场的摄像机的采集的视频数据,统计得出三里河横街的4个岔路口的实际交通流量,结果显示Wi-Fi探针测得的用户数量与交通流量比值为17~23,即如果使用Wi-Fi探针的采集数据评估流量的话,缩样指数为17~23.

图9 各个Wi-Fi探针位置流量时空斑图Fig.9 Spatio-temporal pattern of flow at each Wi-Fi probe location

单位B至地铁站的纵向路径共有5条,分别是六巷东侧路、六巷、七巷、八巷、九巷,均布置了Wi-Fi探针.经分析探针数据得到单位B至木樨地地铁站选择路径统计量,如表2所示.

表2 路径选择偏向倍数表Table 2 Multiple relationship of path selection

早高峰单位B的工作人员从地铁站至单位的纵向路径选择偏好为七巷,有少量选择经九巷+三里河南横街至单位,路径偏好倍数为7倍.晚高峰从单位B至地铁站的工作人员纵向路径选择偏好为七巷,少量选择六巷,路径偏好倍数为5倍,可视化结果如图10所示.早晚的主要偏好路径同为七巷,主要原因是七巷为地铁站至单位的南北道路中道路线性比较顺畅,且道路环境相对较好的.次要偏好路径不同主要是因为六巷有许多小商铺,导致早高峰赶时间的工作人员不选择这条路径.在末端出行多条最短路存在的情况下,行人多选择道路条件舒适的路径出行.因此在道路宽度有限的条件下,预降低出行重点道路的无序程度,应优化次要路径的慢行舒适度,提高片区内慢行体验.

图10 早晚高峰单位B的地铁出行路径偏好 Fig.10 Subway travel route preference of B in morning and evening rush hours

3 结论

提出了一种以Wi-Fi探针技术为主,路况数据和视频数据为辅的方法,弥补了单独使用手机信令数据和路况数据的不足,有效地检测了公交和地铁站点末端接驳的交通行为特征,并结合街区内单位人员的出行特征评价了站点的可达性和路径的选择偏好.

1)该街区的公共出行时长均在5 min以内,公交可达性良好.明确了末端街区的公交可达性及出行分布占比,有利于针对性地提升公交场站的服务水平和通达路径的舒适性.

2)该街区内,木樨地地铁站对1 km左右的单位工作人员的交通吸引力仍然占优势.从路径的角度,有效揭示轨道站点的影响范围.

3)B单位轨道出行偏好路径为道路条件顺畅、路侧风景舒适的七巷.打破了以问卷调查的方式揭示行人路径选择偏好的传统方法.

4)与实地采集的视频数据对比,确定了以Wi-Fi探针技术得到的街道流量的缩样指数为17~23.尝试了Wi-Fi探针技术在断面流量评估方面的应用.

猜你喜欢

探针高峰道路
坚持中国道路——方向决定道路,道路决定命运
道听途说
南通籍华裔科学家高峰
石庆云
荧光探针在游离肼检测中的研究进展
运筹70年,中国道路
早高峰
一次骑行带来的感悟
通过接触测试来提高探针痕迹的一致性
并行测试探针卡的移动规则选择