APP下载

基于时空地理加权回归的服务区驶入量影响因素分析

2023-07-31田晓梅崔洪军朱敏清马新卫

科学技术与工程 2023年20期
关键词:小型车交通量服务区

田晓梅,崔洪军*,朱敏清,马新卫

(1.河北工业大学土木与交通学院,天津 300401;2.河北工业大学建筑与艺术设计学院,天津 300401)

近年来,随着中国高速公路的高速发展以及汽车保有量的提升,公众出行不断增长,服务区数量也随之增加,截至2020年底,中国高速公里数达1.6×104km[1],按中国服务区50 km标准间距估算,目前服务区数量约3 220对。在发展过程中,部分区域的服务区不同车型在某些时段的车位供需矛盾也日益凸显。问题的产生原因,很大程度是由于车位规模及比例通常依赖标准进行配置,没有考虑不同服务区不同车型驶入量具有时空特性,导致停车位配置不合理。服务区车辆驶入量是进行服务区基础设施规划设计的前提,其影响因素十分复杂,包括服务区建设运营因素、道路交通因素以及车辆及司乘人员因素等,时间和空间作为基本要素却往往被忽略。因此,急需从时间和空间的维度揭示各种因素对服务区不同车型驶入量的影响,从而为科学合理地进行服务区停车位统筹规划提供理论依据。

众多学者针对服务区车辆驶入开展了研究。部分学者运用数理统计方法,闫寒等[1]提出了基于车辆连续行驶时间的驶入率测算方法。王殊等[2]基于排队理论对传统的高峰小时驶入率的确定进行了改进,李彤[3]结合司乘需求产生规律采用Logistic模型研究货车驶入服务区的概率。还有学者基于各类影响因素对驶入率进行建模预测研究,姬杨蓓蓓等[4]在美国联邦公路局FHWA模型的基础上引入集装箱卡车流量特有影响因素,提出了改进的集装箱卡车流量预测法。陈力云等[5]结合服务区运营状况及服务区上下游路段车辆因素与时序特征构建了服务区车流量时序优化预测模型。孙朝云等[6]采用机器学习的方法,基于时间序列特征以及服务区交通量特征,对服务区短期交通流量进行预测。

总的来说,目前对于服务区驶入量的研究主要包括基于数理统计的测算和基于影响因素的预测。前者依赖大量样本数据的数量和质量,且有效性难以得到验证,而后者的研究聚焦于预测方法上的创新,影响因素大多局限于的服务区建设运营情况、道路交通及车辆特征方面[7]。目前已有学者基于服务区驶入量的时序特征进行了建模研究,但从时空角度结合复杂影响因素对服务区不同车型驶入量作用的研究仍属于空白。现有的影响因素分析与建模常用的模型有最小二乘法回归模型[8]、空间误差模型[9]、空间滞后模型[10]等传统的常参数计量模型。袁梦雨等[11]在普通最小二乘法模型中引入样本点地理位置的函数,构建了地理加权回归模型(geographically weighted regression,GWR),描述研究对象在空间上的差异性,但该模型无法刻画交通领域车辆数据的潮汐性。

为同时考虑高速公路服务区不同车型驶入量的时间非平稳性和空间非平稳性,基于多源数据构建时空地理加权回归模型(geographically and temporally weighted regression,GTWR),影响因素的选取除基本的服务区规模及其所在高速公路属性外,还引入地理区位因素用来表征服务区的空间特性。针对服务区关联区域考虑了土地利用变量的影响,将各服务区每月小型车、中型车和大型车驶入量作为预测的因变量,从空间和时间两方面揭示服务区规模、地理区位、关联区域土地利用、所在高速公路属性几类因素对服务区车辆驶入量及车型结构的影响,最终针对不同区域特点的服务区提出有利的停车位规划及调整的建议。从时空角度研究了服务区驶入量影响因素的作用机理,对于今后宏观调控以及合理配置服务区各类服务设施与资源具有一定的参考作用。

1 研究区概况与数据处理

1.1 研究区域

截至2019年,河北省高速公路总里程达7 476 km,省内共33条高速路线(含在建高速),服务区数量达110个。以河北省内的26条高速路线(包括京秦高速、荣乌高速、黄石高速、京沪高速、青银高速、长深高速、大广高速京衡段、大广高速衡大段、京港澳高速等)沿线的78个服务区作为研究对象,数据来源由河北省高速公路管理局提供,所提供服务区2019年全年正常营业。图1为所研究的服务区一月车辆驶入量的空间分布情况。

图1 服务区车辆驶入量空间分布图Fig.1 Spatial distribution map of vehicle entry in the service area

1.2 解释变量与数据来源

主要目的是探究服务区规模、地理区位因素、关联区域土地利用及其所处高速公路属性之间的关系。其中地理区位是一个复杂的要素,包括地理位置、因特定目的联系起来的地区的社会经济因素[11]。选取服务区地理位置、断面交通量、社会经济人口属性及三类因子来解释地理区位要素。根据文献[3],货车连续行驶时间2.5~4 h区间的驶入量占总量的80%;而客车连续行驶时间2~3.5 h区间的驶入量占总量的80%。因此2~4 h车程区域内土地利用可以反映出区域内交通出发点的类型。

所需多源数据包括服务区历史车辆驶入数据、服务区规模数据、服务区断面交通量、服务区地理位置相关数据、所属县区社会经济人口数据(年GDP、路网密度、客运站点密度及人口密度)、关联区域(2~4 h车程)内的土地利用,及其所属高速公路等级和沿途资源型城市数量。其中,服务区车辆驶入量数据与服务区规模数据由河北省高速公路管理局提供,包括78个2019年全年正常营业的服务区。车辆驶入量数据时间跨度为2019年1—12月,数据结构包含:服务区名称、服务区所属高速公路、桩号、每月小型车、中型车及大型车驶入量。服务区规模数据包括服务区占地面积、建筑面积、服务设施数量。服务区月断面交通量来源为河北省交通运输厅编制的《2019年河北省公路交通情况调查资料汇编》。服务区地理位置数据(与上下游相邻服务区、收费站间距、距行政中心距离)由高德地图测量得到。年GDP、路网密度、人口密度数据来源于各城市统计年鉴。服务区2~4 h车程内土地利用数据包括:客运站点密度(包括火车站、高铁站)、风景名胜密度、兴趣点(POI)数据,由河北省各城市统计年鉴或通过Python软件爬虫获得。高速公路等级分为国家级和地方级两大类,用0-1变量表示(国家级=1,地方级=0)。资源型城市依据《全国资源型城市可持续发展规划(2013—2020年)》所列出的资源型城市名单确定。

将服务区每月小型车、中型车及大型车驶入量作为因变量,车型划分及车辆折算系数参考《汽车分类国家标准》(GB 9417—89)。解释变量分为四类:服务区属性、地理区位因素变量、关联城市土地利用变量和所处高速公路属性。表1为各变量的定义与描述性统计。

表1 变量的定义与描述性统计Table 1 Definition and descriptive statistics of dependent and explanatory variables

2 研究方法

2.1 多重共线性

多重共线性是指线性回归模型中的自变量之间具有高度相关关系,这将影响模型估计的准确性[12]。因此,在建模前采用方差膨胀因子(VIF)对解释变量与服务区车辆驶入量关系进行共线性检验[13],其计算公式为

(1)

式(1)中:R为线性回归中的决定系数,表示回归方程中解释变量变化的大小。

VIF越大,说明解释变量共线性越严重,VIF低于10,则解释变量之间不存在高度共线性,可直接进行回归分析[14]。本研究的解释变量VIF值均小于10,VIF结果如表2所示。

表2 VIF结果Table 2 The results of VIF

2.2 空间自相关性

空间自相关性是指变量在同一空间分布内的观测数据之间具有潜在相关性,GWR建模前需进行自变量空间相关性分析[12]。Moran’s I(记为I)是进行空间自相关性分析的有效工具[12-14],其计算公式为

(2)

Z-score(记为Z)是检验Moran’s I指数统计显著性的指标,其计算公式为[15]

(3)

式(3)中:E(I)和V(I)分别为I统计量的期望和标准偏差。

本研究的显著性水平为0.05。

2.3 回归模型

研究对最小二乘法(OLS)、GWR模型和GTWR模型进行证实分析,并对其拟合效果进行分析与比较。

最小二乘法(OLS)是进行回归分析常用的线性回归模型,其表达式为

(4)

式(4)中:i为第i个样本点;Yi为第i个样本点的被解释变量;α0为线性回归方程的截距;k为第k个解释变量;αk为第k个解释变量的回归系数;Xik为第i个样本点的第k个解释变量;θi为随机误差。

OLS模型无法反映参数在空间上的非平稳性,GWR模型对传统线性回归模型进行了改进,引入了代表区域地理位置的函数,在线性回归模型之中加入了空间权重矩阵,从而展现参数估计的空间结构差异,其计算公式为[15]

(5)

式(5)中:Yi为第i个样本点的被解释变量;(ui,vi)为第i个样本点的空间经纬度坐标;α0(ui,vi)为第i个样本点的常数项;αk(ui,vi)为第k个解释变量在第i个样本点的回归系数;Xik为第i个样本点的第k个解释变量;θi为随机误差。

GTWR将时间维度嵌入回归参数中,在时间上扩展了GWR模型。GTWR模型中自变量的回归参数是随着时空位置的变化而变化,不同服务区的车辆驶入量在不同时空也呈现出明显差异性,因此使用GTWR模型在对其进行建模时能发挥其优势。GTWR模型表达式为[15]

(6)

式(6)中:ui、vi和ti分别为第i个样本点的经纬度坐标和时间坐标;(ui,vi,ti)为第i个样本点的时空维度坐标;α0(ui,vi,ti)为第i个样本点的常数项;αk(ui,vi,ti)为第k个解释变量在第i个样本点的回归系数。

GTWR采用局部加权最小二乘进行回归参数估计,计算公式为[15]

XTW(ui,vi,ti)Y

(7)

Wij(1≤j≤n)为时空距离衰减函数,其计算公式为[16]

(8)

(9)

式(9)中:λ为调节系数;uj、vj、tj分别为第j个样本点的空间经纬度坐标与时间坐标。

(10)

利用修正后的赤池信息量(AICc)作为模型决策的度量标准,AICc值最低的模型拟合优度最佳[16]。所使用的模型参数估计工具为GWR4.0软件。

3 模型结果与分析

3.1 模型结果比较

进行多重共线性分析和空间自相关性检验之后,分别建立OLS、GWR和GTWR模型,进行分析比较。模型决策度量指标中,R2越高,AICc值越小,说明自变量对因变量的解释度越强[15]。如表3所示,GTWR模型的R2在小型车、中型车和大型车的分析中比传统的GWR模型分别提高了0.443、0.509和0.505,比OLS模型分别提高了0.411、0.493和0.472;同时,GTWR模型的AICc值比传统的GWR和OLS模型都小,表明GTWR模型能更好地刻画解释变量对服务区不同种类车辆驶入量的影响,能更好地拟合具有时空特征的数据。

表3 OLS、GWR和GTWR模型的比较结果Table 3 Comparison result of OLS,GWR and GTWR models

图2为3种车型的GTWR模型拟合系数,可表示各解释变量对服务区小型车、中型车和大型车驶入量的影响程度。其中,拟合系数为正值时,表示对因变量有促进的影响,且绝对值越大,影响越大;拟合系数为负值时,表示对因变量有抑制的影响,且绝对值越大,影响越大[11]。

图2 3种车型的GTWR模型拟合系数Fig.2 GTWR model fitting coefficients for three types of vehicles

3.2 拟合系数的时空特性

GTWR模型各个解释变量的拟合系数随着空间和时间的变化而变化。由于本文着重分析地理要素以及社会经济要素的影响,因此结合3.1节中3种车型的模型拟合系数,从地理区位因素、关联区域土地利用和高速公路属性三类影响因素中选择影响最为显著的4个变量:2~4 h车程区域内风景名胜密度、2~4 h车程区域内工商业型POI密度、所属高速沿途资源型城市数量与服务区周边客运站点密度。服务区车辆驶入量是断面交通量与驶入率的乘积[5-6],见式(11),服务区断面交通量是服务区车辆驶入量的重要影响因素。因此,选择服务区断面交通量、2~4 h车程区域内风景名胜密度、2~4 h车程区域内工商业型POI密度、所属高速沿途资源型城市数量与服务区周边客运站点密度5个变量对模型拟合系数的时间与空间特性进行可视化分析。

Q=λQsection

(11)

式(11)中:Q为车辆驶入量;λ为车辆驶入率;Qsection为该服务区所处高速公路的断面交通量。

3.2.1 拟合系数的时间特性

选取解释变量拟合系数的平均值在时间维度的变化情况如图3所示,3种线形分别代表各变量在对小型车、中型车、大型车驶入量的影响。

图3 所选取的5种变量的平均系数的时间分布Fig.3 Time distribution of the average coefficients for the five variables selected

由图3(a)可知,服务区断面交通量对车辆驶入量具有促进作用(这种促进作用可用驶入量与断面交通量的比值来表示,称为驶入率[5],促进作用越大驶入率越高)。驶入率在7—9月份达到峰值,这是由于河北省夏季高温炎热,车辆空调能耗增大,且高温天气下驾驶员更容易产生疲劳,驾驶员生理以及心理需求均有所增加。相对于大中型车,小型车驶入率受时间的影响浮动更大,这是由于小型车出行通常更为灵活,弹性需求较多,而大中型车(大客车及大货车)休息时间相对固定,驶入率受时间影响较小。图3(b)表明服务区2~4 h区域内风景名胜密度对驶入量有促进作用,特别是5月、8月和10月作为一年中的旅游旺季,风景名胜作为吸引点提升了中小型车辆交通量,使得2~4 h车程距离服务区驶入量增加。图3(c)反映了2~4 h车程区域内工商业型POI密度起促进作用。工商业型POI密度大的地方多为商品集散地,因此以这些地方作为起讫点的中小型货车交通量较大,从而增加了2~4 h距离服务区的中小型车辆驶入量,促进作用的峰值出现在一年中的货运高峰时期(12月—次年2月)。从图3(d)可以看出,服务区所属高速沿途资源型城市数量对于车辆驶入具有促进作用,尤其是对于大中型车辆,且最高峰出现在11月—次年3月,对小型车驶入量的作用不显著且无明显时间规律。其原因为河北省供暖日期为11月—次年3月,期间煤炭货运周转量增加,而途径资源型城市的高速路线,很大一部分承担了煤炭运输工作,从而对沿线服务区大中型车辆驶入量呈现显著促进作用。如图3(e)所示,服务区所在县区大型客运站点密度对于中型车驶入量起促进作用,对小型车和大型车起抑制作用。这主要由于客运站点包括长途汽车站,增加了大客车驶入量,尤其是在1月春运,以及5月、10月小长假客运繁忙期,促进作用尤为显著。而对应时期对小型车与大型车驶入量的抑制作用显著,这是由于铁路运输与公路客货运输为竞争关系,客运站点密度大会导致更多人选择铁路运输旅行或运输货物。

3.2.2 拟合系数的空间特性

借助ArcGIS可视化工具从空间的角度分析解释变量拟合系数的平均值的分布情况。

如图4所示,断面交通量对3种车型驶入量均起促进作用,对小型车的影响最为显著,中型车次之,对大型车的影响作用较小。这是由于小客车属于个性化出行车流,其出行目的多样化,出行时间线路随意性较大,因此断面交通量起到的促进作用显著。而大型车由大型卡车、集装箱车辆构成,这类型车在高速公路上行使的线路和时间相对固定,因此断面交通量起到的促进作用较小。3种车型在西北部受到的影响均较小。主要原因在于西北部的张家口、承德区域夏季气温相对较低,即使在一年中的驶入率峰值期夏季,驶入率涨幅也不大,因此该地区服务区驶入量受断面交通量影响程度小。

图4 服务区断面交通量平均系数的空间分布Fig.4 Spatial distribution of average coefficients for traffic volume in the service area section

如图5所示,2~4 h车程区域内风景名胜密度对车辆驶入量起促进作用。小型车的拟合系数在张涿高速、荣乌高速、京秦高速路线达到峰值,中型车拟合系数在京秦高速、张承高速路段达到峰值。主要原因是张家口市、承德市、秦皇岛市以及保定市旅游综合竞争力高[7],形成了完善的旅游产业链,因此连接这些区域的高速路线上会吸引更多的大小客车,从而增加沿线服务区中小型车辆驶入量。而大型车受到的影响大部分地区并不显著,拟合系数在张家口市中心以及秦皇岛市中心附近服务区达到峰值,主要原因为两地旅游业繁荣,旅游景区物流供应增加了附近服务区大型车驶入量。

图5 2~4 h车程区域内风景名胜密度平均系数的空间分布Fig.5 Spatial distribution of average coefficients for density of scenic spots in the driving area of 2 to 4 h

如图6所示,2~4 h车程区域内工商业型POI密度对车辆驶入量起促进作用,其中对于大中型车的影响最为显著。这是由于工商业型POI密度大的地方多为商品集散地,货运周转量大。拟合系数峰值集中在石家庄、邯郸、雄安新区以及环京津区域的服务区,主要原因是石家庄、邯郸的大型企业数量在河北省位于前列,包括冶金、钢铁、汽车以及医药等方面,而雄安新区以及环京津地区是“京津冀一体化”建设的重要枢纽,因此该区域交通量受到工商业密度的影响更显著。

如图7所示,高速沿途资源型城市数量对于沿途服务区车辆驶入量起促进作用,尤其是对于大中型车。高速沿途资源型城市可以在一定程度上反映高速公路行驶的货运车辆数量。从空间上看,拟合系数在唐山、张家口、邢台以及邯郸市区域达路段达到峰值,这些资源型城市,拥有煤矿、石油矿以及金属矿等丰富的矿产资源,沿线高速公路承担着向全国各地输送矿产的任务,大中型货车交通量相对较大,因此大中型车辆驶入量受到的促进作用显著。

图7 高速沿途资源型城市数量平均系数的空间分布Fig.7 Spatial distribution of average coefficients for number of resource-based cities along the highway

如图8所示,服务区所在地(区县)客运站点密度对于服务区中型车驶入量具有促进作用,而对小型车及大型车驶入量产生抑制作用。客运站密度大使得客流更多地选择大客车,高速公路上中型车流量增加;货流选择铁路运输,高速公路小型车及大型车流量减少。从空间上看,衡水、承德及张家口地区服务区的小型车驶入量受客运站点密度的影响最为显著,其原因在于这些城市的经济在省内排名靠后,经济欠发达地区人均机动车拥有量相对较低,居民更倾向于选择客运站点出行。

图8 服务区所在地客运站点密度平均系数的空间分布Fig.8 Spatial distribution of average coefficients for density of passenger stations where the service area is located

4 结论

采用时空地理加权回归模型,研究了服务区大中小3种车型的驶入量的影响因素在时空上的特性及规律,得到以下结论。

(1)与OLS模型和GWR模型相比,地理加权回归模型能更好地从时空的角度刻画解释变量对服务区不同类型车辆驶入量的影响,拟合度高,针对3种车型构建的模型R2均达到了0.8以上,远远高于其他模型。

(2)对小型车驶入量影响最大的因素为2~4 h车程区域内风景名胜POI密度,其促进作用在旅游旺季最为显著,断面交通量对于小型车驶入量促进作用次之,且在夏季高温地区显著。同时这些地区服务区的大型车驶入量受到的促进作用不显著,因此建议2~4 h车程区域内风景名胜POI密度大的服务区和位于夏季高温地区的服务区分别在旅游旺季和夏季高温月份增设小型车停车位,或者将空闲率较高的大型车停车位临时改为小型车停车位,缓解这些服务区在旅游旺季的小型车停车压力。

(3)2~4 h车程区域内工商业型POI密度对于大中型车驶入量影响最大,尤其是当服务区位于大型企业数量多的贸易发达城市时影响最为显著,并在一年中的货运高峰时期达到峰值。建议针对此类服务区在每年的货运高峰期提高大中型车辆停车位的占比。

(4)高速沿线资源型城市数量对大型车的驶入量促进作用最为显著,尤其是在北方冬季供暖的月份,而该因素对中小型车辆的作用相对较小。针对这一特点,建议在供暖月份为高速沿线资源型城市数量大的服务区增设大型车停车位,具备技术条件的服务区,也可探索建设小型车立体停车位,节省用地空间,从而满足大型车停车需求。

(5)在未来,智慧服务区建设成为发展方向,在把握驶入量时空规律的基础上与智慧基础设施建设相结合,提高司乘人员服务体验,该领域尚需进一步探讨。

猜你喜欢

小型车交通量服务区
基于AIoT+GIS的智慧服务区构建
基于ETC门架数据的高速公路交通量转换探究
高速公路服务区信息技术的应用
基于动态差法的交通量监测技术应用
高速公路补偿交通量模型研究
建言高速公路服务区实现“双提升”
基于四阶段法的公路交通量预测研究
小型车用液压混合动力系统的开发
小型汽车在美打“翻身仗”
通用舍中国在印度造小型车