APP下载

基于AFC数据的城轨路网客流OD在线动态估计

2018-10-29贾飞凡冯佳平

交通运输系统工程与信息 2018年5期
关键词:路网客流预估

蒋 熙,贾飞凡,冯佳平

(北京交通大学轨道交通控制与安全国家重点实验室,北京100044)

0 引言

城市轨道交通路网的日常运营过程中,运营部门特别关注如何及时准确地把握路网当前运营状态,以便为列车运行调整或客流控制决策提供科学依据,而客流OD(Origin Destination)是形成路网运营状态的重要基础.运营中,从分时段上传的准实时AFC(Automatic Fair Collection)刷卡数据可以得到当前时段各车站的进出站客流信息,而当前时段路网客流OD尚处于未知状态,需要进行动态在线估计.

道路交通领域的客流OD动态估计,主要是利用路段流量数据,运用神经网络模型、贝叶斯滤波等方法进行研究[1-3].而城市轨道交通的可观测信息主要来源于“准实时”AFC刷卡数据,基于AFC数据的客流估计研究逐步发展,代表性的研究包括基于卡尔曼滤波的客流OD估计模型构建[4-5],以及在此基础上通过数据融合降低估计误差的研究[6].此外,还有基于交通行为非集计模型的客流OD预测的研究[7].

路网客流状态变化具有非线性、不确定性特征,目前已有的城轨路网客流OD动态估计方法在及时性、准确性方面仍然有待提高.本文结合路网客流OD动态特性及其与观测数据间的关联逻辑,综合利用历史信息与准实时数据,研究与之相适应的方法、模型及算法,以在线方式实现客流OD动态估计,满足日常运营在线决策支持的需要.

1 数据与问题分析

从数据时效性上看,城市轨道交通的AFC数据可分成准实时AFC数据和历史AFC数据两类.准实时AFC数据以乘客每次进出站刷卡记录作为一个单元进行采集,并按一定时间间隔(如每15 min)打包上传.运营结束后对实时AFC进出站数据进行汇总和配对后形成历史AFC数据,从中可以处理得到当日的分时段客流OD矩阵,从而形成历史客流OD时序数据.

运营过程中的每一时段,由进出站刷卡记录可以获得采集周期内各车站的进出站客流量.路网中,客流状态的规律性与随机不确定性共存,各乘客在路网出行过程中存在着时间消耗,某一时段由某一“O点”进站的客流将会在当前及后续的若干时段内分批、陆续到达不同的“D点”车站,这些到达客流量可以看成是该“O点”进站客流量在不同去向站、不同时段上的时空分布.

本文所述路网客流OD在线动态估计是指,在获得了准实时AFC数据的条件下,基于客流OD在时空维度的分布特性与逻辑关联,结合历史客流OD信息,随时间的推进,分时段对当前路网的客流OD矩阵进行动态估计.

2 方法的提出

源于地铁客流出行需求的动态变化规律及在出行过程中的动态关联,分时段的客流OD即存在时序特征,也与相关时段的进出站客流间存在着某种时空关联逻辑,其随机概率特性或者隐含在历史数据中,或者隐含在准实时AFC提供的观测数据与客流OD的联系中.由此,对这些随机概率特性进行发现、建模和综合利用就是本文的基本研究思路.

2.1 客流OD递归贝叶斯估计

考虑到城轨这一非线性动态系统中AFC观测数据与客流OD间的关联逻辑,本文基于递归贝叶斯理论方法研究客流OD的在线动态估计.其基本思想是,基于客流OD的时序关联构建状态转移方程,基于AFC与客流OD间的时空关联构建量测方程,并随着时间推进,利用这两个方程以递归方式进行客流OD概率密度的迭代计算.

按照AFC数据采样周期的长度Δt(如15 min)进行时段划分,用T={1,2,…,k,…,t,…}表示各离散时间段,k代表[(k-1)Δt,kΔt)时间区间.在路网客流OD动态估计迭代过程中,任意时段k,主要包括如下两个阶段任务.

(1)k时段路网客流OD量的预估.在获得了前序时段客流OD概率分布的条件下,输入到系统状态转移方程中得到当前时段k客流OD量概率分布,形成客流OD预估值.

(2)k时段路网客流OD量的修订更新.得到预估值后,在时段k采集准实时AFC数据作为观测数据,依据量测方程,通过贝叶斯原理对当前时段客流OD进行后验估计,形成预估值的修订更新,使结果与当前的系统状况更接近.然后进入k+1的预估阶段,如此迭代下去.

2.2 LSTM模型嵌入下的客流OD递归贝叶斯估计方法框架

预估阶段的关键是构建客流OD状态转移方程.因历史OD数据中蕴涵着难以用一般解析公式准确刻画的OD动态变化特性,可采用机器学习方法进行数据挖掘,并以网络模型形式体现出历史时序数据中的先验规律.长短时记忆网络LSTM(Long Short Term Memory Network)作为一种改进循环神经网络,适用于具有长时间依赖性的时间序列预测问题.因此,本文运用LSTM及客流OD历史数据进行模型构建与训练,学习得到客流OD预估模型,并将其作为状态转移方程嵌入到贝叶斯估计的迭代过程中,实现客流OD动态估计,其方法框架如图1所示.

在进入在线估计过程前,首先利用历史客流OD数据对LSTM网络进行训练,形成LSTM网络形式的客流OD状态转移方程.然后,开始在线估计迭代过程,在每一时段,先利用若干前序时段的客流OD估计值作为输入,运行LSTM状态转移模型得到当前时段客流OD的预估值,作为该迭代步下当前时段的先验估计;再利用相关车站的AFC进出站刷卡数据作为观测值进行后验修订,对原预估的OD进行更新;然后,再进入下一时段,继续利用LSTM模型进行新的客流OD预估.如此,随时钟推进,客流OD在周而复始的递推过程中实现在线动态估计.

图1 LSTM模型嵌入下的客流OD递归贝叶斯估计方法框架Fig.1 OD recursive Bayesian estimation method framework embedded with LSTM model

3 模型的构建

按照上节提出的方法框架,构建基于LSTM的系统状态转移方程及系统量测方程来形成客流OD递归贝叶斯估计模型.

3.1 相关定义

设N={1,2,…,i,j,…}为城市轨道交通路网车站集合,定义时段k路网客流OD矩阵Q(k)为

式中:Qi(k)表示在时段k由车站i进站将去往其他各个车站的客流OD向量,Qi(k)=[qi1(k),qi2(k),…,qin(k)];qij(k)表示在时段k由车站i进站将要去往车站j的客流量,这些客流将分批在未来若干时段陆续到达车站j并出站.

定义进站客流向量O(k),表示时段k路网各站的进站客流量,即

式中:oi(k)表示车站i在时段k内进站客流量.

定义累计到达量Rt(k),表示截止到时段k(k≥t),在时段t出发的客流累计到达量矩阵.

对于拥有n个车站的城市轨道交通路网,路网客流OD矩阵可以看成是由各个“O点”车站的去向客流量向量Qi(k)构成,因此可分别对各个车站进行客流OD量估计,最终再组成路网客流OD的矩阵Q(k).这种分车站OD向量进行估计的方式便于采用并行计算技术来实现,可提高计算速度.因此,本文从各个“O点”车站的角度进行模型计算和求解.

3.2 系统状态转移方程的构建

对于路网中任一车站i,采用LSTM模型构建该站客流OD预估模型.该模型以任一时段s的客流OD向量作为输出变量Y,以s以前m个时段的客流OD向量输入变量X.

其中,m的取值对预估结果和运算效率有重要影响,本文经过实际尝试后,发现当m取3时能够在运算效率与效果方面达到一个较好的平衡.将LSTM网络的隐藏层数设置为2层,第1层LSTM选用50个神经元,第2层LSTM选用100个神经元,为防止过拟合的情况选取DropOut为0.2,即每个训练步骤取80%的数据用于参数调整.将历史相关运营日期的客流OD数据按时序处理,以每前3个时段OD向量为输入、后1个时段OD向量为输出构成一个数据单元,按顺序形成训练数据序列,对网络进行训练后得到基于LSTM的客流OD状态转移模型.该模型隐含实现了车站i前序3个时段的客流OD向量对当前时段客流OD向量的非线性动态映射关系,将其命名为fi.

在此基础上,针对任意车站i进行客流OD预估时,对任一时段k(k≥3),将前3个时段的客流OD估计值输入到这个非线性动态映射fi中,可以形成客流OD向量的动态转移,得到时段k的客流OD预估值.则对任意车站i,基于LSTM的客流OD状态转移方程的形式可描述为

式中:w(k)为过程噪声,可从历史AFC数据中统计其随机分布参数.

3.3 系统量测方程的构建

网络化运营条件下,路网客流动态变化具有广泛的时空关联性.首先,车站i的观测量oi(k)与待估状态Qi(k)之间存在某种空间分离的关系,定义进站客流分离率bij(k),表示车站i在时间段k的进站客流oi(k)中qij(k)的比率.

式(10)与式(11)为客流分离率的约束条件.运用本文构建的LSTM客流OD状态转移模型进行Qi(k)的预估时,bij(k)就已经隐藏在其中形成预估取值了.

进一步看,在时段k,由车站i进站去往车站j的客流量,需要在当前及后续的几个时段陆续到达车站j,在多个不同时段的出站数据观测值中才能获得相应的客流信息,为了描述累计出站观测量与待估客流OD量之间的关系,定义累计到达系数矩阵At(k)为

(k)的取值与车站i与j之间的客流出行时间分布、时段的间隔时间长短,以及路网当前运营中的不确定因素有关,本文将其作为一项随机参数,利用历史AFC数据进行统计计算得到.

可见,待估量qij(k)与观测量oi(k)与rit j(k)之间体现了客流在时间与空间上的关联关系.车站i进站客流oi(k)经过空间与时间两个层面上的分离结果可以从观测数据(k)上得到体现.基于上述逻辑关系,可构建量测方程,表示为

式中:V(k)为测量噪声,可从历史AFC数据统计得到随机分布参数.

映射关系h代表关系式为

至此,基于构建完成的状态转移模型和量测方程,可进一步研究客流OD递归贝叶斯估计问题的求解算法,得到每个k时段qij(k)的动态估计.

4 求解算法

卡尔曼滤波是求解线性系统递归贝叶斯估计的经典算法之一,但对于可能需要多维复杂积分运算的非线性系统的适应性较弱.而基于蒙特卡洛重采样技术的粒子滤波方法对非线性系统具有更强的建模能力,因此,本文以粒子滤波为基础研究求解算法.

4.1 对一般粒子滤波算法的高阶扩展

由于LSTM模型的嵌入,状态转移变成三阶马尔科夫过程,而一般粒子滤波算法是在一阶条件下设计的.本文结合客流动态估计问题特点,将一般粒子滤波算法按照如下方式进行扩展,形成面向高阶状态转移的客流OD动态估计的粒子滤波算法.

(1)将随机粒子集扩展为4套,分别对应Qi(k-3)、Qi(k-2),Qi(k-1),Qi(k)的概率密度,各套粒子集中第l个粒子权重分别设为

(2)初始时段k=0,由Q(-2),Q(-1),Q(0)分别表示最初3个时段路网客流OD概率密度(由历史相似运营日的AFC统计获得),并加上噪声后分别形成初始粒子集,将各粒子的初始权重置为1M.

(3)预估阶段,用Qi(k-3)、Qi(k-2)、Qi(k-1)对应的粒子集作为输入,利用LSTM模型进行粒子集传播,形成代表Qi(k)概率密度的粒子集.

(4)修订阶段,选用高斯函数作为基函数用于似然度拟合,利用观测数据分别对代表Qi(k-2)、Qi(k-1)和Qi(k)的各粒子进行条件似然度的计算.基于粒子滤波原理,各粒子权重与其似然度成正比,则将各粒子似然度归一化后就可形成新的权重值.

(5)为防止粒子退化,依据更新后的各粒子权重、运用重采样算法对Qi(k-2)、Qi(k-1)和Qi(k)对应的各套粒子集重新采样.然后时段k加1,将新生成的3套粒子输入到LSTM模型中,进行下一次迭代.

4.2 客流OD动态估计粒子滤波算法流程

经高阶扩展后的客流OD动态估计粒子滤波算法主要分成初始化、客流OD预估、观测数据采集处理、随机粒子更新、形成估计值等步骤,后几个阶段随时间推进不断进行循环迭代,算法流程如图2所示.

5 实例验证

以2018年某市地铁为例进行实例验证.首先采集了预测日前3个星期路网205个车站的历史客流OD向量数据进行处理和机器学习,形成基于LSTM的客流OD预估模型,然后将其嵌入到客流OD动态估计粒子滤波算法中.因本文分别按照各个车站OD向量进行估计,在算法设计时,被分解为205个相对独立的可以并行的子任务以提高运算速度.

在此基础上,在1台4核计算机上运行模型与算法,动态接收每15 min时段的AFC数据作为观测数据,对205个车站进行了在线式全网客流OD动态估计.在此,仅取其中2个OD估计结果进行说明,图3(a)、图3(b)给出了各时段OD实际值、LSTM形成的OD预估值及粒子滤波后估计值的对比关系.可见,预估值、估计值均与当日实际值较接近,而经过粒子滤波处理后得到的估计值表现更好.

图2 客流OD动态估计粒子滤波算法流程Fig.2 Process of passenger flow OD dynamic estimation particle filter algorithm

完成当日估计后,以各时段各OD的实际值为X坐标值,以相应的模型计算值为Y坐标构成的点绘制散点图,如图4所示.不难看出,路网客流OD估计值接近于实际值.进一步,利用各分时OD量的实际值对模型误差进行计算,得到加权相对误差为15.42%(按客流分离率来计算结果相同).

图3 部分客流OD实际值、预估值与估计值的对比Fig.3 Comparison of actual,predicted and estimated value of some OD

图4 实际值与计算值的散点对比图Fig.4 Scattered plots of actual and calculated values

6 结论

本文面向准实时AFC数据接入下的路网客流OD动态估计问题,提出将LSTM模型嵌入到递归贝叶斯估计中实现客流OD动态估计的方法,能够对蕴藏在历史数据中的客流OD动态变化规律及实际运营中获取的观测数据进行综合利用,有助于更准确可靠地实现路网客流OD动态估计.经实例验证表明,本文提出的方法与模型具有较好的效果.

猜你喜欢

路网客流预估
客流增多
美国银行下调今明两年基本金属价格预估
城市轨道交通节假日期间大客流行车组织思考与实践
打着“飞的”去上班 城市空中交通路网还有多远
省际路网联动机制的锦囊妙计
首都路网 不堪其重——2016年重大节假日高速公路免通期的北京路网运行状况
路网标志该如何指路?
SVM分类模型预估网站商业价值
基于自学习补偿的室内定位及在客流分析中的应用
人工免疫算法在电梯客流时段划分的应用