APP下载

考虑先验知识的ICA在轨道交通客流预测中应用

2019-07-05仇建华杨兴园张亚岐李创

计算技术与自动化 2019年2期
关键词:轨道交通预测

仇建华 杨兴园 张亚岐 李创

摘   要:针对轨道交通客流量的不确定性,采用考虑先验知识的独立成分分析法对轨道交通客流量进行预测。首先将采集部分时段同一线路上各个站点客流量数据作为先验样本,获得相应的概率密度;其次通过独立成分分析得各个站点客流量独立源数据,利用独立源数据构建基于相关向量机预测模型;最后通过增加扰动量来对模型进行评价。结果表明:未考虑先验知识的预测模型对相对较小的扰动量不敏感,且对较大扰动量响应的稳定性差;而考虑先验知识的预测模型有很好的敏感度和稳定性。

关键词:轨道交通;先验知识;预测;独立成分分析;扰动量

中图分类号:U121                                                  文献标识码:A

Application of ICA in Prediction of Rail Traffic Passenger

Flow Volume Considering Prior Knowledge

QIU Jian-hua1,YANG Xing-yuan2,ZHANG Ya-qi2?覮,LI Chuang3

(1.Xi'an Aeronautical University,Xi'an,Shaanxi 710077,China;

2.Dongfeng Motor Corporation Technical Center,Wuhan,Hubei 430058,China;

3.Dongfeng Honda Automobile Limited Liability Company,Wuhan,Hubei 430056,China)

Abstract: In view of the uncertainty of rail traffic flow ,this paper adopted the independent component analysis considering prior knowledge to predict passenger flow volume of rail traffic. Firstly ,the passenger flow datas of all stations in the same line were collected and the datas were as the prior samples. Then the corresponding probability density was obtained. Secondly,the independent source datas of all stations can be achieved through independent component analysis.And the independent source datas were used to construct prediction model based on correlation vector machine. Finally,the model was evaluated by increasing the disturbance quantity and results show that the prediction model considering the prior knowledge is not sensitive to relatively small disturbance quantity,and its stability of the response of large disturbance quantity is poor. The prediction model considering the prior knowledge has good sensitivity and stability.

Key word: rail traffic;prior knowledge;predictiton; independent component analysis;disturbance quantity

城市軌道交通客流量预测是很有必要的。一方面,轨道交通作为城市旅客运输的主要载体,其运量大、客流集中、人员进出频繁,且空间相对封闭狭小,一旦造成拥挤可能波及整个交通网络。因此准确预测客流量、提前做好响应机制,对交通拥挤具有一定的遏制作用[1-6];另一方面,智能交通运输系统是未来交通运输发展的主要方向,轨道交通作为智能运输系统的先行者,其运行的可靠性受客流量预测的影响较大。近年来,各国学者从多个维度开展交通客流预测的研究,孙琦峰等人采用改进BP网络对公路旅游客流量进行预测,并对几种预测方法进行了对比,并用试验证明了改进的BP网络模型对公路旅游客流量预测的合理性与可行性。Tsung-Hsien Tsai利用临时的检索模型对铁路旅客的道道时间进行预测,并对模型进行了验证。Yujuan Sun采用非参数回归模型对地铁换乘站客流量进行预测。随着科技水平的不断提高,相继产生了多个行之有效的分析预测模型,如卡尔曼预测模型、支持向量机、神经网络模型以及贝叶斯滤波器等,由于卡尔曼观测器对于强非线性模型并不适用,且支持向量机[7-8]随着样车数增加,其计算成本迅速增加,而神经网络模型需大量样本训练,容易出现过学习或欠学习,影响预测精度。进而出现了基于贝叶斯稀疏特性的相关向量机(RVM),RVM[9]对样本数敏感度不高,适用于解决大样本问题。轨道交通是一个相对封闭网络,各个站点、各条轨道交通线路之间相互影响,乘客可以从某一站点上车,通过换乘可以在任意站点下车,因此,在各个站点设置观测点,将单一线路各个观测点当做一个整体来考虑,依据独立成分分析以及相关向量机对轨道交通客流进行预测。从各个观测点处得到独立源的混合数据,运用部分先验数据构建各个独立源概率密度,通过独立成分分析解析出各独立源信号和混合矩阵,采用相关向量机对各个独立信号进行预测,并经过混合矩阵的逆变换得到客流量的预测值,并采用扰动量对模型的敏感度和稳定性进行评价。

1   独立成分分析

假设有n个独立信号源s(s1,s2,…,sn)T,通过 p个观测点进行m次采样得到s信号的混合叠加信号x,x{x(i) (x(i)1,x(i)2,…,x(i)n);i = 1,…,m},s与x存在如下关系:

x = As                                       (1)

其中x不是單一向量,是n×m的矩阵,其中每一列向量x(i) ,x(i)  = As(i) 。式(1)中A和s是待求变量,求解过程也被称为盲源信号分离。由于独立成分分

析[10-13](Independent Component Analysis,ICA)在没有先验信息的情况下,无法得到唯一确定解[14-15],因此,考虑信号先验信息可得到源信号的唯一解。

假定每个信号源si的概率密度为ps,根据联合分布以及各信源的独立性可得:

p(s) = ∏ni=1ps(si)                                  (2)

p(x) = ps(Wx)W=W∏ni=1ps(wTix)    (3)

式(3)左边是每个采样信号x(n维向量)的概率,等式右边是每个信源信号概率乘积的W倍。在没有先验知识的情况下,ps(si)一般选取sigmoid函数(g(s)= )或其他分布函数,ps(si)随机选取对分析结果有一定影响,为此,本文考虑信源信号的先验知识,即根据部分样本利用最大似然估计得到 ps(si)函数。对于给定样本{x(i) (x(i)1,x(i)2,…,x(i)n);i = 1,…,m},通过样本对数似然估计可以得到 估计值,

λ(W) =   log g′(wTjx(i) ) + logW   (4)

2   相关向量机

相关向量机跟支持向量机相类似,也是将低维非线性不可分问题通过核函数转化为高维线性可分,在支持向量机基础上引入贝叶斯理论[16],通过后验概率的最大化得出相关向量的权重,通过预设权重阈值确定最终的相关向量数量。于给定的样本数据{tn,xn},RVM定义为:

y(x;w) =  wi K(X,Xi) + w0   (5)

上式中:wi为第i个样本权重; K(X,Xi)为核函数;N为样本总数。对于tn = y(xn,w) + ξn,假定ξn服从高斯分布(0,σ2),

P(ti|xi,W,σ2)~N(0,σ2)

=(2πσ2)-0.5exp- (ti - yi)2

=(2πσ2)-0.5exp- (ti - WT?准(x))2(6)

同时训练N个点,则向量t代表了所有独立的训练点ti,然后构造一个N × M维的矩阵,其中第 i行表示向量?准(xi),

P(t|xi,W,σ2)= N(WT?准(x),σ2)

= (2πσ2)-0.5exp- (ti - WT?准(x))2

=(2πσ2)-0.5exp- ‖t - ΦW‖22  (7)

整个样本的似然函数可以表示出来,其中w与σ2是两个参数,可用最大似然估计来计算,一般的数值计算中w元素大都不为0,不为0的元素确定为相关向量,会出现过学习的情况,为避免过学习的情况,RVM中引入了先决条件,认为w服从正太分布:

P(wi|αi) = N(wi|0,σ2i)    (8)

通过式(7)将w的求解转化为α的求解,当α趋于无穷大时,w趋于0。相关向量机预测的基本流程如图1所示,

3   基于ICA-RVM轨道交通客流量预测

ICA-RVM预测模型基本流程如图2所示。

首先将各个观测点得到客流数据作为混合信号,经过ICA得到独立信号和相应的混合矩阵A;通过各个观测点的先验样本得到独立信号的概率密度函数;利用RVM对各个独立信号进行预测,根据各个独立信号预测值以及混合矩阵A得到相应的客流量预测值。

试验中选取重庆某条地铁线当天的客流量数据进行分析。若出现2个及2个以上站点客流量很少时,独立成分分析会将相应的数据不作为独立成分,即表现形式就是:在这些观测点观测到的客流量数据基本保持一致。因此,对于客流量极少的多个站点只设置一个观测点。图3是某个站点的客流量数据,每隔15分钟统计一次客流量,

由于关系式(9)为客流量概率密度,ps(s)值在(0,1)以内,因此系数的数值相对较小。用同样的方法可以得到其他独立信号的概率密度,结合获取到的独立信号概率密度进行独立成分分析,得到混合矩阵A(其中采样100次,观测点25个)和相应的独立信号。采样RVM对各个独立信号分别进行预测,再通过混合矩阵得到客流量的预测值。

图4表明:考虑先验知识的预测模型具有更高的准确率。以9点半为例,该时刻实际数据是处于波谷的,先验预测结果与实际结果存在一定偏离,但有先验知识的模型比无先验知识模型的预测结果更为准确,从图4中可以看出。由于先验知识来源于原有客流量的统计结果,受前期统计数据的影响,模型对某个时间点的客流预测出现偏离是无法避免,只能尽可能的缩小二者差距。其实预测大客流能够为管理者提供决策依据,因此,对突发客流的预测意义更大。为了测试模型的稳定性,对观测

猜你喜欢

轨道交通预测
轨道交通TOD模式创新引领宁波城市发展
选修2—2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
选修2—2期中考试预测卷(A卷)答案与提示
选修2—2期中考试预测卷(B卷)答案与提示
城市轨道交通供电系统及电力技术探析
城市轨道交通节假日期间大客流行车组织思考与实践
轨道交通快慢车越行问题研究
轨道交通快慢车越行问题研究
轨道交通:轨交项目审核全面提速