APP下载

基于长短期记忆网络的轨道交通短期OD客流量预测

2021-09-18张萍,肖为周,沈铮玺

河北工业科技 2021年5期
关键词:城市轨道交通

张萍,肖为周,沈铮玺

摘要:為了更准确地掌握轨道交通客流在线网中的时空分布,更高效地匹配客流需求与运输能力,实现提高轨道交通运输效率、改善运营服务质量的目的,提出了一种基于长短期记忆网络的短期OD(交通起止点)客流量预测方法。以历史客流数据为基础,定性分析车站间OD客流量的时空相关性,利用回归分析法定量分析客流影响因素,筛选出运营时刻、运营日特征、最低气温3个时间特征。为提高预测精度,以长短期记忆网络为基础,结合时间特征,为每对起讫点单独构建预测模型,形成了基于长短期记忆网络的轨道交通短期OD客流量预测模型。以苏州市为例进行验证,结果表明,加入了时间特征的短期OD客流量预测模型较移动平均模型、仅利用历史客流数据训练的基于LSTM网络的短期OD客流量预测模型,预测结果与真实值之间的误差降低了6.27%~8.58%,所提出的方法和模型可为轨道交通运营部门制定列车运行计划、组织客运工作提供更准确的数据资料。

关键词:交通运输工程;城市轨道交通;站间OD客流;短期客流预测;长短期记忆网络

中图分类号:U293.13文献标识码:ADOI: 10.7535/hbgykj.2021yx05001

Forecast of short-term origin-destination passenger flow of rail transit

based on long short-term memory network

ZHANG Ping,XIAO Weizhou,SHEN Zhengxi

(School of Rail Transportation,Soochow University,Suzhou,Jiangsu 215131,China)

Abstract:In order to grasp the temporal and spatial distribution of passenger flow in the rail transit more accurately,match the demand of passenger flow and the capacity of rail transportation more efficiently,and achieve the purpose of improving rail transit transportation efficiency and operation service quality,a forecast method of short-term OD passenger flow (origin-destination ) based on long short-term memory network was proposed.The temporal and spatial correlation of OD passenger flow between stations was qualitatively analyzed based on the historical passenger flow data.The influencing factors of passenger flow were analyzed by regression analysis method,and three time characteristics of operation time,operation day characteristics and minimum temperature were selected.Based on the long short-term memory network,the model was built for each OD combining with the time features to improve the forecast accuracy.Therefore,the short-term OD passenger flow forecast of rail transit based on long short-term memory network was formed.Suzhou railway transit was taken as an example to make an imitation test.The results show that compared with the moving average model and the short-term OD prediction model based on LSTM network trained only by historical data,the error between the real value and the predicted result of the short-term OD prediction model with the time characteristics is reduced by 6.27%~8.58%.In short,the proposed model and the methods can provide more accurate data for rail transit operation department to make the train operation plan and organize passenger transport.

Keywords:traffic and transportation engineering;urban rail transit;origin-destination flow between stations;short-term passenger flow forecast;long short-term memory

轨道交通具有快速、准时等特点,性价比高,越来越多的居民选择轨道交通作为主要出行方式。截至2019年底,中国共有40个内地城市开通轨道交通运营线路,总运营线路为208条,线路总里程为6 736.2 km;2019年全年累计客运量达237.1亿人次,同比增长12.5%[1]。可以看出,中国的轨道交通正处于快速发展时期。一般而言,轨道交通的线网规模越大,乘客的出行特征就越复杂,客运工作就越难组织和协调。准确掌握轨道交通短期客流数据,是运营部门制定运营计划的关键,是协调各部门完成运输工作的基础。

在短期客流预测方面,大部分学者的研究对象是轨道交通线路或者部分车站的进出站客流量[2]、日客流量[3]及小时客流量[4]。而站间OD(交通起讫点)客流体现了进出站客流的流向和分布,是分析客流时空分布的基础,是进行客运组织和票务清分的关键数据。近几年,也有学者对此进行了研究。姚向明等[5]基于乘客行程时间分布的客流到达率构建状态空间模型,以卡尔曼滤波求解短时OD估计;之后,姚向明等[6]在先前研究的基础上,考虑前向多个时段的影响,引入了滑动平均策略构建模型;刘洋等[7]对运营日、运营时段进行了聚类划分,分析了OD客流量分布的稳定性和相关性;陈志杰等[8]考虑到不同时段内不同起讫点间的客流差异,建立了多时间尺度的短时OD客流量估计模型并利用交互模型求解,进一步提高了计算精度;蒋熙等[9]、李若怡等[10]、ZHANG等[11]、TANG等[12]以长短期记忆网络LSTM为基础,在短时OD客流量预测中考虑了状态方程迭代递推、多源数据、OD客流量吸引度、时空特征等内容,实现了深度学习方法在短时OD客流量预测中的运用;侯晓云等[13]建立了基于GRU神经网络的短时OD客流量预测模型,在收敛速度和预测稳定性方面有了进一步提高。

上述的研究均是建立在实时数据输入条件下,基于状态空间法结合历史客流研究客流分流率,对当前进站客流进行流向估计从而得到OD客流量矩阵。本文提出的短期OD客流量预测以历史刷卡数据为基础,预测未来一周或未来一个月的OD客流量,以满足运营公司短期运营决策的需求。

1问题描述

在轨道交通网络结构较为稳定的情况下,OD客流量的变化情况与历史同期类似[14]。以某市轨道交通线网中任一对OD为例,以一星期为周期分析客流变化,如图1所示,观察可发现OD客流量的变化趋势与历史同期大致相似,仅在部分时段变化有出入但基本稳定。

轨道交通自动售检票系统(automatic fare collection system,AFC) 是一个封闭式自动化网络系统,具有售票、检票、收费、统计等功能,记录了所有乘客的出行信息,可以从中提取出包含进站车站、进站时间、出站车站、出站时间、票卡类型等信息。对历史AFC数据进行深入挖掘,取τ为时间粒度,将运营时间等分为m个时段,以进站时间为划分标准,统计站间OD客流量。假设当前时段为s(s∈[1,M],M为所有时段数),在时段s内,从车站i出发去往车站j的客流量为qij(s)(i∈[1,N],N为网络中所有车站数)。对于同一OD而言,乘客的在车时间大致相等,等车时间则与发车间隔即运营时刻有关,乘客是否跨时段出行对本文预测结果影响不大,因而不讨论乘客跨时段出站的情况。

本文的短期OD客流量预测是指在获得了轨道交通历史AFC数据的条件下,结合站间客流在时间维度的高度相关性,构建历史客流数据间的输入输出关系,通过大量数据训练和误差调整,能通过前k个时段的数据估计时段s的OD客流量值,而时段s的预测结果,也可作为s+1时段的基础数据。因此本文提出的短期站间OD客流量预测模型可以预测未来一周、一个月的OD客流量。

2方法提出

轨道交通站间OD客流量分布在不同时间会呈现出不完全相同的特征,例如工作日和非工作日、高峰期与平峰期,笔者将时间因素细分,结合现有研究和轨道交通运营实际,选取易获得的运营时刻、运营特征日、温度、天气情况,定量分析时间因素对OD客流量的影响。

2.1影响因素

将一天的运营时间细分,若时间粒度为τ,则运营时刻被分成m个时段,编号为1—m,运营特征日分为工作日、周末和节假日3类,分别取值为1,2,3,温度取当天的最高气温和最低气温,天气情况分为雨雪天气和其他情况2类,其中雨雪天气用1表示,其他情况用2表示,具体字符和数值对应情况如表1所示。

用线性函数的形式来描述运营时刻、运营特征日、天气情况、最低气温、最高气温对客流的影响,形式如式(1)所示。

qijs=αHs+βDs+γZs+

λWLs+ωWHs。(1)

运用回归分析方法标定参数,结果见表2,变量需通过5%的置信水平检验,即|t|>1.96,需通过显著性检验即Sig.P<0.05,根据估计结果,去除天气情况和最高气温。

对运营时刻、运营特征日、最低气温再次运用回归函数分析,此时各参数均满足置信水平检验和显著性检验,线性回归方程的拟合优度为0.196,说明上述3个时间因素是站间OD客流量的重要影響因素,但还不能完全表达客流量,用线性回归方式预测OD客流量的效果不佳。在站间OD客流量其他影响因素尚不明确的情况下,神经网络的优势得以发挥。

2.2LSTM模型

长短期记忆网络(long short-term memory,LSTM)[15]是一种特殊的循环网络,是为了解决一般循环神经网络(recurrent neural network,RNN)在处理长期序列时产生的梯度爆炸或梯度消失问题而提出的。相比RNN只有一个传递状态ht,见图2,LSTM在重复模块中增加了一个传输状态ct,见图3,可以记忆不定时间长度的数值,在复杂序列特征学习方面具有优势,适用于处理轨道交通客流数据这类影响因素复杂、间隔和延迟比较长的时间序列数据。图2、图3中,xt,yt分别表示当前节点数据的输入和输出。

LSTM的重复单元内部有4个网络层,通过3个门来控制输入输出,如图4所示。

圖4中zf,zi ,zo分别对应一种门控状态,是由ht-1和xt组成的拼接向量乘以权重W,经过sigmoid激活函数形成的0~1的向量,如式(2)所示:

zτ=σ(Wτ·ht-1,xt+bτ),τ∈f,i,o。(2)

zt表示对输入数据进行处理,是拼接向量乘以权重的结果经过tanh激活函数形成的-1~1的向量,计算公式如式(3)所示:

zt=tanhWt·ht-1,xt+bt。(3)

具体运算流程如下。

1)遗忘门zf对上一节点的输入进行选择性记忆。

2)输入门zi决定当前节点的更新,zt表示对当前输入进行选择性记忆。在输入阶段,经遗忘门更新的传输信息与通过输入门的信息相加,得到当前节点的ct,如式(4)所示:

ct=zfct-1+zizt 。(4)

3)输出门zo控制当前节点的输出,传递状态ht由ct变化后与输出控制zo相乘得到,如式(5)所示,当前节点的输出yt由ht变化得到,如式(6)所示:

ht=zotanh(ct),(5)

yt=σWt′·ht。(6)

在图4及式(3)-式(7)中,表示矩阵对应相乘;表示矩阵对应相加; Wα,α∈f,i,o,t,t′表示各状态对应的权重向量;bβ,β∈f,i,t,o表示各状态对应的偏置项;σ表示sigmoid激活函数,输出是0~1的值,数值代表通过sigmoid函数的信息的保留程度,0表示不保留,1表示全保留 tanh函数类似sigmoid,输出为-1~1,两者的计算公式如式(7)所示:

σx=11+e-x,

tanhx=ex-e-xex+e-x。(7)

3模型构建

以网络中的车站i和车站j为例,运用LSTM网络构建车站间短期OD客流量预测模型。结合上文OD客流量影响因素研究,车站i和车站j间s时段的数据用Pij(s):qijs,Hs,Ds,WLs表示,由s时段车站i和车站j之间的OD客流量、s时段的运营时刻编号、s时段的运营特征日属性、s时段的最低气温组成。将所有数据整理成数据集,以前k条数据作为输入,即式(2)与式(3)中x=(Pij(s-k),Pij(s-k+1),…,Pij(s-1)),以下一条数据的OD客流量作为输出,式(6)中y=qij(s),构成模型的训练结构,在模型训练过程中不断重复式(2)-式(6),直到满足收敛条件。

在LSTM网络模型中,模型参数的取值分别为时间步长k、隐藏层神经元个数n、迭代次数epoch对模型的预测结果和运算效率有较大影响。当k=3时,即以前3条数据的客流值作为输入、后1条数据的客流值作为输出时,整体效果较好。LSTM网络设置一个隐藏层,隐藏层神经元取200个,迭代次数为350次。选用Adam算法更新权重,MAE作为损失函数,在隐藏层采用Dropout约束 [16]防止预测网络过拟合。经过数据训练和测试,将得到基于LSTM的短期站间OD客流量预测模型,该模型表达的是在时间因素影响下车站i和车站j之间OD客流量的非线性映射关系。

4实例分析

以2020年5月-8月苏州轨道交通126个车站连续17周的AFC刷卡数据为例,对数据中异常记录进行筛除,数据的有效性为99.99%。通常,短时OD客流量估计的时间间隔为5,10或15 min,一般不超过30 min;本文研究的是短期客流,研究30 min以内或超过120 min的时间粒度意义不大,因此选取60 min作为短期客流OD客流量预测的时间粒度。以60 min为时间间隔,统计各站间OD客流量,全日运营时间为6:00~23:00,划分成17个时段,编号为1—17,运营特征日按工作日为1、周末为2、节假日为3的分类取值原则取值,历史及预测期内的最低气温通过中国天气网(www.weather.com.cn)查询,共形成2 023条数据,模型数据示例如表3所示。

根据模型构建部分的参数设置,时间步长取3,隐藏层神经元个数取200个,迭代次数为350次,Dropout取0.2,将前16周的数据作为训练集,最后1周的数据作为测试集。

运用Python3.7对模型进行求解,本文为每对OD客流量单独建模,预测时,网络被分解为126×125个独立并行的子任务,形成独立的基于LSTM的短期OD客流量预测模型。在此,取其中2个OD客流量值估计结果进行分析,图5、图6分别展示了车站1—车站2、车站3—车站4间模型预测结果与实际值的拟合效果。

进一步分析模型预测效果,将本文提出的模型与其他模型对比。在轨道交通客流相对稳定的情况下,运营者常常采用历史同期数据或近一段时间的实际客流进行估算,即移动平均法,称为模型1;为了验证本文在客流预测模型中加入时间因素的优势,将案例数据中运营时刻、运营特征日、最低气温三者删去,不考虑时间因素的影响,仅利用历史客流数据训练模型,即仅客流数据输入的基于LSTM网络的短期OD客流量预测模型,称为模型2;本文提出的时间因素条件下基于LSTM网络的短期OD客流量预测模型称为模型3。以时间为横坐标,以某天的真实值、模型的预测值为纵坐标,如图7、图8所示,显然,模型3的拟合效果优于模型1与模型2。

以平均绝对误差MAE和均方根误差RMSE作为评价指标,如表4所示,本文提出的时间因素条件下基于LSTM网络的短期站间OD客流量预测模型的MAE及RMSE分为12.43%和17.20%,误差比移动平均模型下降了6.27%和8.36%,比仅利用历史客流数据训练的基于LSTM网络的短期OD客流量预测模型下降7.77%和8.58%。

5结语

本文以轨道交通历史AFC数据为基础,定性分析了空间因素、时间因素对OD客流量的影响,研究结果如下:

1)运用回归分析法定量分析客流影响因素,将运营时刻、运营特征日和最低气温3个对客流影响较为显著的因素从神经网络的黑箱中提取出来,在一定程度上增强了模型的解释能力;

2)分析了LSTM网络的结构和特征,指出其对于轨道交通客流预测的适用性,结合特征值为每对OD客流量建立短期预测模型,有效提高了预测精度;

3)运用苏州轨道交通2020年5月—8月共16周的数据训练模型,预测得到轨道交通网络8月最后一周的分时OD客流量,与移动平均模型、仅输入历史客流数据的LSTM模型的结果对比,误差降低了6.27%~8.58%,验证了模型的可行性及有效性。

综上所述,本文提出了一个可预测未来一周的站间OD客流量的模型,所得数据可用于计算站点进出站客流量、换乘站各方向换乘客流量、断面客流量等诸多客流指标,有助于轨道交通运营公司、城市交通管理部门了解轨道交通客流量的时空分布特征,为下一阶段的轨道交通行车组织、人员安排、城市交通管理等工作提供依据,具有较强的实际意义。本文的不足之处在于模型参数还需结合其他轨道交通网络进行深入研究,以提高模型的适用性。

参考文献/References:

[1]城市轨道交通协会.城市轨道交通2019年度统计和分析报告[J].中国城市轨道交通协会信息,2020(2):1-53.

[2]崔洪涛,陈晓旭,杨超,等.基于深度长短期记忆网络的地铁进站客流预测[J].城市轨道交通研究,2019,22(9):41-45.

CUI Hongtao,CHEN Xiaoxu,YANG Chao,et al.Forecast of subway inbound passenger flow based on DLSTM recurrent network[J].Urban Mass Transit,2019,22(9):41-45.

[3]白丽.城市轨道交通常态与非常态短期客流预测方法研究[J].交通运输系统工程与信息,2017,17(1):127-135.

BAI Li.Urban rail Transit normal and abnormal short-term passenger flow forecasting method[J].Journal of Transportation Systems Engineering and Information Technology,2017,17(1):127-135.

[4]LI Y,WANG X D,SUN S,et al.Forecasting short-term subway passenger flow under special events scenarios using multiscale radial basis function networks[J].Transportation Research Part C:Emerging Technologies,2017,77:306-328.

[5]姚向明,赵鹏,禹丹丹.城市轨道交通网络短时客流OD估计模型[J].交通运输系统工程与信息,2015,15(2):149-155.

YAO Xiangming,ZHAO Peng,YU Dandan.Short-time passenger flow origin-destination estimation model for urban rail transit network[J].Journal of Transportation Systems Engineering and Information Technology,2015,15(2):149-155.

[6]姚向明,赵鹏,禹丹丹.基于平均策略的城市軌道交通动态OD矩阵估计[J].吉林大学学报(工学版),2016,46(1):92-99.

YAO Xiangming,ZHAO Peng,YU Dandan.Dynamic origin-destination matrix estimation for urban rail transit based on averaging strategy[J].Journal of Jilin University(Engineering and Technology Edition),2016,46(1):92-99.

[7]刘洋,凌力,伍元忠,等.基于约束卡尔曼滤波的城市轨道交通线网客流OD实时估计研究[J].铁道运输与经济,2018,40(10):103-108.

LIU Yang,LING Li,WU Yuanzhong,et al.A real-time OD estimation of passenger flow in urban rail transit network based on constrained Kalman filtering[J].Railway Transport and Economy,2018,40(10):103-108.

[8]陈志杰,毛保华,柏赟,等.基于多时间尺度的城市轨道交通短时OD估计[J].交通运输系统工程与信息,2017,17(5):166-172.

CHEN Zhijie,MAO Baohua,BAI Yun,et al.Short-term origin-destination estimation for urban rail Transit based on multiple temporal scales[J].Journal of Transportation Systems Engineering and Information Technology,2017,17(5):166-172.

[9]蒋熙,贾飞凡,冯佳平.基于AFC数据的城轨路网客流OD在线动态估计[J].交通运输系统工程与信息,2018,18(5):129-135.

JIANG Xi,JIA Feifan,FENG Jiaping.An online estimation method for passenger flow OD of urban rail Transit network by using AFC data[J].Journal of Transportation Systems Engineering and Information Technology,2018,18(5):129-135.

[10]李若怡,李得伟.城市轨道交通动态OD矩阵分析及估计模型研究[J].铁路计算机应用,2017,26(1):63-66.

LI Ruoyi,LI Dewei.Analysis and estimation model of dynamic OD matrixes for urban rail Transit[J].Railway Computer Application,2017,26(1):63-66.

[11]ZHANG J L,CHEN F,WANG Z J,et al.Short-term origin-destination forecasting in urban rail transit based on attraction degree[J].IEEE Access,2019,7(99):133452-133462.

[12]TANG Q C,YANG M N,YANG Y,et al.ST-LSTM:A deep learning approach combined spatio-temporal features for short-term forecast in rail transit[J].Journal of Advanced Transportation,2019.DOI:10.1155/2019/8392592.

[13]侯曉云,邵丽萍,李静,等.基于深度学习的城市轨道交通短时客流起讫点预测[J].城市轨道交通研究,2020,23(1):55-58.

HOU Xiaoyun,SHAO Liping,LI Jing,et al.Urban rail transit short-time passenger flow OD forecasting based on deep learning modeling[J].Urban Mass Transit,2020,23(1):55-58.

[14]许俊,王登,李晨毓,等.基于动态反馈神经网络的城市轨道交通短期客流预测[J].现代交通技术,2014,11(5):43-46.

XU Jun,WANG Deng,LI Chenyu,et al.Short-term passenger flow forecasting for urban rail transit based on dynamic feedback neural network[J].Modern Transportation Technology,2014,11(5):43-46.

[15]HOCHREITER S,SCHMIDHUBER J.Long short-term memory[J].Neural Computation,1997,9(8):1735-1780.

[16]SRIVASTAVA N,HINTON G,KRIZHEVSKY A,et al.Dropout:A simple way to prevent neural networks from overfitting[J].Journal of Machine Learning Research,2014,15(1):1929-1958.

猜你喜欢

城市轨道交通
城市轨道交通物资总库选址模型研究
城市轨道交通通信传输系统的方案选择
沈阳市城市轨道交通综合交通枢纽换乘优化研究
基于BP神经网络的轨道客流短期预测
智能视频监控系统在城市轨道交通的应用与发展趋势
利用既有铁路发展城市轨道交通的可行性分析
我国城市轨道交通突发事件分析及对策
智能电网建设与调控一体化发展研究
关于城市轨道交通监控系统的施工工法研究