APP下载

基于生存分析的夜间驻留停车需求预测

2020-01-16李林波高天爽

关键词:停车场时刻概率

李林波 高天爽 姜 屿

(1同济大学道路与交通工程教育部重点实验室, 上海201804)(2北京市城市规划设计研究院, 北京100045)

随着机动车保有量的不断攀升,精细化的停车管理成为提高停车设施利用效率、缓解停车难问题的重要手段.作为城市停车设施精细化管理的前提和基础,准确地进行停车需求预测变得十分重要.随着共享停车理念的深入,精细化的停车管理势必要根据停车场主体建筑类型,对白天与夜晚的停车需求进行区分,分别制定相应、合理的车位预留容量方案,从而达到掌握停车需求全天变化情况、保障共享停车管理有序执行的目的.

对于停车需求预测,宏观的预测方法主要包括停车生成率模型、出行吸引量模型、交通量停车需求模型以及多元回归分析预测模型.随着停车调查与需求分析的深入,停车需求预测模型逐渐增加了对简化调查方法[1]以及交通需求分配[2-3]、停车行为[4-5]、停车区位[6]、路网容量限制[7]等影响因素的考虑.随着数据采集和存储技术的发展,停车调查的观测尺度越来越小,连续停车数据的获取变得越来越容易,部分学者提出了采用时间序列和机器学习等方法进行停车需求的短时预测.传统的时间序列预测方法主要包括ARIMA(autoregressive integrated moving average)模型[8-11]、考虑时空相关性的多元自回归预测模型[12]、马尔科夫模型[13]、卡尔曼滤波模型[14-16]等;机器学习方法除简单的BP(back propagation)神经网络[17-18]、无监督学习算法[19]外,还包括进一步提高预测精度的组合预测模型,如结合小波分析及马尔科夫链的预测模型[20]、基于混沌和BP神经网络的复合预测模型[21]、基于小波变换的神经网络改进模型[22-24]等.

夜间停车需求又称基本停车需求,主要是由车辆保有量引起的停车需求.目前专门针对夜间停车需求预测的研究很少,大多包含在全天停车需求预测中,且主要是采用区域注册车辆数估计或根据区域停车生成率计算等宏观方法.应用神经网络等人工智能方法虽然理论上能获得较好的预测精度,但是该类方法包含一些不可认知(隐含)的过程,导致研究者无法进一步掌握停车需求的变化规律,大大降低预测结果对停车管理决策的指导意义.

因此,考虑到夜间停车需求时变波动不大,且主要是由日间驶入车辆波动引起,本文提出采用生存分析的方法,针对单一建筑类型自备路外停车场,对日间驶入车辆的停车时长进行分析,以预测夜间驻留车辆数.

1 夜间停车需求特征分析

为了研究夜间停车需求特征,分别选取办公、医院、高铁站3类停车场的正常工作日停车数据进行分析(见表1),进而把握各类停车场夜间停车需求的大致变化特征.以每天的停车需求变化为观测周期,从全年的观测角度来分析3个建筑物类型的停车场实际泊位占用量数据.

表1 3类停车场数据

注:城市等级根据《关于调整城市规模划分标准的通知》中的城市规模划分标准确定.

由图1可知,各类停车场全年实际泊位占用量每天的时变趋势大致相似;22:00—07:00作为夜间时段,停车需求时变波动不大,几乎所有曲线在该时段内均呈稳定的直线状态;但从全年的时间维度来看,夜间停车需求仍具有一定的波动性,体现在不同日期和月份之间的夜间泊位占用量差异.

因此,在时变特征分析中,夜间停车需求具有小时变化维度上的稳定性和日变化维度上的波动性,具备预测的特征基础.对于夜间停车需求预测,可采用纵向和横向2种预测思路,分别利用夜间和日间的停车数据进行分析.利用夜间停车数据进行预测,可用分布函数模型,但预测结果只能获得需求量处于某个分布区间的概率,难以获得精确的需求.因此考虑到夜间停放车辆是日间驶入车辆的驻留部分,提出利用日间驶入车辆的停车时长分布来估计过夜驻留停车概率的思路和方法.

2 夜间停车需求预测模型构建

2.1 生存分析方法

生存分析(survival analysis)是研究生存现象和响应时间数据及其统计规律的现代统计分析方法[25],同时也是风险模型或持续模型,其在国内外交通运输研究领域的应用主要包括事故分析[26-27]、事件持续时间分析[28-30]、机动车与非机动车相互影响分析[31]、行人风险分析[32]等.生存分析将事件发生的结果和出现此结果的持续时间结合起来进行研究.与传统的多因素分析方法(如线性回归、Logistic回归等)相比,生存分析在存在以下情况时具有明显的优势:① 在问题分析中既需考虑生存结果,又需考虑生存时间;② 存在大量失访的资料,即删截数据,例如与研究对象失去联系、无法观测到结局等;③ 时间分布不明确,一般不呈正态分布,在不同情况下的分布规律也不相同.

(b) 新华医院

(c) 高铁站南车库

2.2 基于夜间驻留停车需求的生存模型

2.2.1 驻留停车需求的生存分析问题

针对夜间驻留的停车需求,研究拟获取白天时段(07:00—22:00,共计15 h)驶入停车场车辆在多种因素影响下的夜间驻留停车行为变化情况.本文将观测时段定义为日间07:00—22:00,将22:00后车辆仍停放在停车场定义为夜间驻留现象.

由于夜间停车需求变化很小,基本保持稳定,因此夜间驻留停车需求或行为的产生即来自于日间驶入停车场的车辆.基于此,针对夜间驻留停车的问题即可转化为针对白天时段(07:00—22:00)不同时刻下驶入停车场的车辆的停放时间持续到22:00之后的问题.此时,对应的生存分析研究中的兴趣(关注)事件为白天时段不同时刻下驶入停车场的车辆驶离停车场的行为.对应的生存分析问题要素定义如下:

1) 事件开始的时间指车辆在白天驶入停车场的时刻.

2) 事件终止的时间指车辆驶离停车场的时刻或研究时段结束时刻(22:00).

3) 生存时间指车辆在停车场停放的时间,即车辆驶离与驶入停车场的时间差.

4) 结局变量存在2种情况:① 车辆在白天时段内驶离停车场;② 车辆在白天时段内驶入但在研究时段内未驶离,即出现驻留现象.

根据研究对象的结局,生存时间数据可分为2种:完全数据和删截数据.通过以上分析可知,第1种结局明确知道事件开始时间、结束时间,故为完全数据;而第2种结局只知道车辆驶入停车场的时刻,对于驶离时刻无法确切知道,但能够知道其停放时间至少大于多长时间,因此为删截数据,且全部为右删截数据.

2.2.2 驻留停车需求的生存函数

用T表示生存时间,即车辆在停车场的停放时间,其分布函数F(t)表示事件T≤t发生的概率,即P(T≤t),具体表示形式为

(1)

式中,f(t)为生存时间T的概率密度函数.

T的生存函数S(t)表示车辆在停放时间为t时仍停留在停车场的概率,也称为可靠度函数或累计生存概率,其公式为

(2)

式中,P(T>t)表示事件T>t发生的概率.

令h(t)表示与生存函数对应的风险函数,即停放时间为t的车辆在下一个很小的时间段内驶离停车场的概率,其公式如下:

(3)

对应的累计危险率函数H(t)为

(4)

S(t)与H(t)的关系为

(5)

2.2.3 驻留停车需求的生存估计方法

生存分析常用的估计方法有3种:参数分析法、非参数分析法及半参数分析法.考虑到停车时间本身是一个随机变量,其分布形式无法事先获得,且停车时间的长短会受到多个因素的影响,同时本文研究的停车数据中存在删截,因此在估计方法上选择半参数分析法.

半参数分析法可以在未知生存时间分布的情况下,分析多个因素对生存时间的影响程度.通过分析在这些影响因素的作用下,生存事件在不同时刻结束的风险函数,得到带有影响因素的生存函数.因此针对夜间驻留停车需求的生存分析,研究将采用半参数分析法中的Cox比例风险模型,通过构建白天时段驶入停车场的车辆停车时长的Cox比例风险模型,运用调查数据对模型参数进行估计,从而对停车场夜间驻留停车需求进行预测.

2.3 驻留停车需求的Cox比例风险模型

Cox比例风险回归模型(proportional hazards model)是一种半参数回归模型,该模型以生存结局和生存时间为因变量,可同时分析众多因素对生存时间的影响,适用于本研究的模型建立.

基本Cox比例风险模型表达式为

h(t|x1,x2,…,xp)=h0(t)g(x1,x2,…,xp)

(6)

式中,x={x1,x2,…,xp}表示p个协变量组成的向量;h0(t)为潜在危险率函数,代表x1=x2=…=xp=0时车辆停放时间为t的风险函数;g(x)表示各个协变量的效应函数.在Cox比例风险模型中,假定各个协变量的效应服从指数分布,因此,生存时间T的风险函数可以写成如下形式:

(7)

式中,b={b1,b2,…,bp}为协变量对应的系数(参数)向量,系数bj(j=1,2,…,p)可以从观测到的数据中估计得出,表示对其协变量的影响大小.

根据生存函数、风险函数和累计危险率函数的等价对应关系,则生存时间T的生存函数S(t)可以表示如下:

(8)

式中,H0(t)为忽略所有协变量影响后的基准车辆驶离累计危险率函数;S0(t)为忽略所有协变量影响后的基准停车时长生存函数.

对于协变量的显著性检验,可采用对数似然比(log-partial-likelihood ratio)检验、Score统计量检验、Wald统计量检验3种方法;对模型整体拟合度检验,可采用Cox-Snell残差检验.

3 案例应用

上海某科技园位于上海市浦东新区,靠近中环,占据张江高科技园区产业核心区域,是典型的办公建筑.科技园建筑面积7.6万m2,办公面积约6.5万m2,自备路外停车场总停车位为502个,包括地面停车位181个和地库停车位321个.本文选取该科技园2016年6—11月共6个月的停车数据对模型进行性能评价,其中2016-06-01—2016-08-31共超过3×104条的停车数据作为模型训练样本,2016-09-01—2016-11-30的停车数据作为测试样本.

3.1 夜间驻留停车的生存函数

通过综合现有关于单一自备停车场停车行为的相关研究文献,结合对停车场基础信息的调研及刷卡数据特征,并考虑数据采集处理的难易程度3个方面,最终本文考虑的主要协变量可分为3类:固定信息特征、停车行为特征以及环境特征,具体协变量的定义及说明如表2所示.

表2 协变量的定义及说明

对表2中协变量建立Cox比例风险模型,采用向后逐步回归法对模型中的各协变量进行筛选和参数估计.每步回归中,似然比检验水平设置为0.05,得到Cox比例风险模型协变量的参数估计结果,如表3所示.

表3 保留的参数最大似然估计结果

注:χ2表示卡方;P表示参数显著性检验的结果.

由表3可知,影响车辆停放时长的影响因素包括驶入时刻、用户类型、驶入天气和工作日,参数估计值反映了协变量的影响程度,影响程度最大的因素是“用户类型”;危险比表示在其他自变量不变的情况下,该变量从a增加到a+1,相对的事件发生危险指数变化,反映了变量促进风险发生的效应,如因素“驶入时刻”的危险比为1.035,代表驶入时刻每延后一个时段,发生驻留的概率是前一个时段发生驻留概率的1.035倍,说明驶入时刻对于停车驻留来说呈正向作用,因此因素“驶入时刻”的作用效应最大.

从表4模型协变量的显著性检验来看,在零假设为β=0,即回归系数与0无差异时,3种检验的显著性均小于0.05,表示对应的4个解释变量对模型的影响显著,均为有效变量.

表4 模型显著性检验

图2 Cox-Snell残差图

模型的检验结果表示模型有效且具有优良的拟合效果,得到不同影响因素下的停车时长生存时间模型的表达式如下:

(9)

式中,xit、xc、xif、xw分别表示驶入时刻、用户类型、驶入天气和工作日.

3.2 夜间驻留停车需求预测

根据式(9)的Cox比例风险模型可以进行不同影响因素条件下的停车时长生存时间的可能性预测,即对不同影响因素下过夜驻留停车概率的预测.下面将以3个例子进行预测结果展示.

1) 算例1 以晴天、周一09:00驶入停车场的长期用户车辆过夜驻留概率预测为例.

基于各个协变量的定义,该题设条件下,长期用户的取值xc=1,周一的取值xw=1,晴天的取值xif=0,驶入时刻09:00的取值xit=9,代入Cox比例风险模型式(9)中,其停车时长的生存时间曲线如图3所示.

图3 算例1驶入车辆的停车时长生存时间概率转移曲线

图3中曲线的任意一点表示在该题设条件下,09:00驶入停车场的车辆停放至横坐标时长的概率.随着时间的后移,车辆继续停放的概率在逐渐降低,且在17:00之后有一个明显的下降,原因可能是通勤人员大多在17:00下班.在95%置信区间下,车辆在22:00后仍然驻留在停车场的概率为(0.069 03,0.078 36),均值为0.073 55,即有0.073 55的概率会出现过夜驻留停车情况.

在相同条件下,利用测试集数据进行检验.根据9—11月实际情况统计得到的过夜概率为0.031 15,相对误差约为4.2%.其中9—11月09:00驶入停车场的最大车辆数量为55辆(统计间隔为15 min),即模型预测结果的误差约为2辆,认为该模型预测精度良好,满足实际需求.此外,根据Cox比例风险模型,同样可以预测车辆在其他停车时长的驶离行为,为精细化的停车管理提供信息支持.

2) 算例2 以晴天、周一各时刻驶入停车场的长期用户车辆过夜驻留概率预测为例.

进一步拓展模型的使用,预测同一日不同驶入时刻的车辆发生过夜驻留停车行为的概率.模型的参数设定与算例1中相同,xc=1、xw=1、xif=0,分别预测各个驶入时刻相应的停车时长达到过夜驻留条件(即停放至22:00之后)时的生存可能性,其结果如图4所示.

图4 算例2驶入车辆的过夜驻留停车概率转移曲线

图4中曲线的任意一点表示在该横坐标时刻驶入停车场的车辆过夜驻留的概率.在09:00前,随着驶入时刻的推后,车辆发生过夜驻留停车行为的概率逐渐降低;09:00后,随着时间的推移,整体的过夜驻留停车概率呈递增的趋势;值得注意的是,从19:00开始,过夜驻留停车的概率急速增加.考虑原因,可能是09:00前驶入的多为通勤人员,过夜驻留的概率较低,而之后驶入的多为其他社会车辆,随着驶入时刻的后移驻留概率也相应增大,且该停车场附近多为商务办公区域,休闲娱乐区域较少,因此19:00之后驶入车辆的停车目的有很大的可能性是过夜,模型预测结果与实际基本符合.结合上述分析,在停车管理中,可对19:00之后的停车收费规则进行相应的调整以使停车效益最大化.

计算得到在该条件下,模型预测过夜停车数的全天平均相对误差约为7.9%,预测精度达到92.1%,满足预测精度的需要.为了验证研究方法预测过夜驻留停车需求的可靠性,在测试集内选取相同条件下的9月12日的实际数据进行比较,结果如图5所示.9月12日全天预测驻留停车数为46,而实际预测驻留停车数为31,误差为15辆,约占停车场容量的3.0%,可以认为所提方法的预测效果可靠,满足实际停车管理的要求.

3) 算例3 以晴天、一周内各工作日驶入停车场的长期用户车辆过夜驻留概率预测为例.

图5 长期用户9月12日各时刻的预测与实际驻留车辆数

设定模型参数xif=0、xc=1,分别预测一周各工作日不同时刻驶入停车场车辆的停车时长达到过夜驻留条件时的生存可能性,结果如图6所示.

图6 算例3驶入车辆的过夜驻留停车概率预测曲面图

计算该条件下的各时刻预测过夜停车数的相对误差如图7所示,可以看到10:00前的误差均在0.05以下,处于较低的水平,而中午时段和20:30以后的时段概率预测误差较大,可能与在这些时段内实际驶入的车辆数较少有关.对全天时段的相对误差取平均值得到全天的平均相对误差约为6.2%,在可接受的误差允许范围内.

图7 算例3各时刻预测过夜驻留车辆数的相对误差

最后,结合当前已有研究对于日间停车需求时变预测方法的应用,提出基于Cox比例风险模型的过夜驻留停车预测流程.在获取日间停车特性后,通过短时停车需求预测方法对日间各时刻的停车驶入量进行预测,然后结合本文通过时间生存分析方法所获得的过夜驻留停车模型,即可求得相应的过夜驻留停车数量,从而为精细化停车管理中夜间驻留停车需求的分析与预测提供切实、有效、准确的理论依据与技术支持.

4 结论

1) 针对夜间驻留停车需求预测,提出了将过夜驻留停车预测问题转化为停车时长的生存时间分析的思路.由此,构建了半参数的生存分析方法,建立不同影响因素下的停车时长预测模型,进而预测停车驻留概率,获得夜间停车需求.

2) 案例分析结果表明该方法预测精度良好,全天夜间驻留预测精度达到92.1%,同时能够扩展到对停车时长的潜在影响因素分析,有一定的应用价值.

3) 研究结论能够为停车场的精细化管理提供理论支撑和决策依据.预测的夜间泊位使用量能够帮助停车场做出相应的夜间停车管理决策,例如对外开放停车场使用权,或加强管控措施以预防停车高峰问题,或优化收费结构等;也可应用在停车分区方面,例如划分夜间专用停放区域等;同时可针对影响夜间停车需求的因素施行管理决策,例如吸引固定用户或临时用户等,对需求进行调控.

4) 停车时长还受交通状况、出行目的、停车场状况等多方面的影响,限于研究获得的停车场基础数据信息,本文仅选取了7个主要因素,在实际的应用过程中可以考虑更多的影响因素,以提高夜间停车需求的预测精度.另外本文只针对办公类型的停车场进行了实例验证,后续会增加其他类型的停车场,以全方位验证该方法的可靠性.

猜你喜欢

停车场时刻概率
概率统计中的决策问题
概率统计解答题易错点透视
冬“傲”时刻
捕猎时刻
停车场
概率与统计(1)
概率与统计(2)
Maxe 迷宫闯一闯
停车场迷宫
一天的时刻