APP下载

基于无偏灰色组合动态模型的铁路客运量预测研究

2023-02-18柴乃杰周文梁

铁道标准设计 2023年2期
关键词:客运量马尔科夫原始数据

柴乃杰,周文梁

(中南大学交通运输工程学院,长沙 410075)

引言

近些年,随着铁路建设的不断加快,铁路运输工具成为供人们出行选择的最主要交通方式之一,铁路客运量呈逐年增长的趋势[1-2]。对此,在保证满足旅客需求的前提下,为有效地降低铁路运输成本,迫切需要对铁路运营实施精细化管理。其中,客运量预测作为运营管理的重要依据之一,正发挥着越来越大的作用,它不仅能够准确反映当前铁路运输发展水平,还可以预测未来铁路发展趋势,为铁路新线建设、旧线技术设备改造以及列车运行方案编制提供了重要的参考依据,同时它在很大程度上还对运输企业内部的投资结构、资金优化配置以及经营决策发挥着重大作用[3]。

目前,关于铁路客运量预测方法的研究,国内外应用较广泛的有支持向量机法[4-5]、线性回归分析法[6]、灰色模型法[7]、BP神经网络法[8-9]、SARIMA模型[10-11]以及IOWA组合模型[12-14]等,上述方法为客运量预测研究奠定了重要的理论基础,但它们本身也存在着一些局限性,若单独使用往往会使得预测精度不高,达不到预期的预测效果。对此,为提高预测结果的精度和可靠性,已有不少学者研究发现,可以通过将多个单一模型优势互补,如芮海田[15]提出了一种新的基于指数平滑法和马尔科夫模型客运量组合预测方法,结果表明,该组合方法比单一方法更具优越性,其分两步实现,第一步运用指数平滑方法对客运量进行初步拟合,第二步通过马尔科夫方法对初步拟合结果进行修正;侯丽敏[16]运用灰色预测理论构建灰色线性回归的组合模型,既能反映原线性回归模型中没有指数增长趋势的情况,也能弥补基本灰色预测模型中没有线性因素的不足;贺晓霞[17]通过分析铁路客运量的非线性动态变化的特点,建立了灰色GM-周期扩展组合模型,不但能实现客运量趋势预测,而且也能充分考虑铁路客运量呈非线性周期波动这一特征;冯冰玉[18]通过构建灰色理论和RBF神经网络组合模型,一方面加快神经网络学习速度,另一方面避免在实际应用中经常遇到的过拟合、局部极小值和“维数灾难”等问题;刘琳玥[19]基于PCA-BP神经网络的铁路客运量预测模型,提出利用主成分分析法消除原始铁路客运量影响因素之间相关性,运用BP神经网络对分析结果进行学习,进而使得预测结果更加准确;贾金平[20]将灰色GM(1,1)模型预测方法和马尔科夫链相结合,以构造状态转移概率矩阵为基础,获得有效的滞时阶数,建立灰色加权马尔科夫链预测模型;ZHAO[21]根据过去10年的客运量数据统计序列构建三次平滑指数预测模型,并采用马尔科夫法进行改进,取得了95%的统计信度的准确率。上述研究成果为铁路客运量预测提供了方法及理论基础,本文提出一种基于无偏灰色Verhulst-Markov组合预测动态模型,运用无偏Markov链预测方法对无偏灰色Verhulst模型的拟合结果进行修正。换言之,传统灰色Verhulst模型一般仅适用于拟合短期变化趋势较平稳的数据序列,尤其是呈S型增长的数据序列,但该方法本身也存在一些缺陷;相反,马尔科夫模型更适合于拟合长期波动性较大的数据序列。因此,本文将利用两种模型各自的优势,构建出一种组合预测动态模型,既能克服原单一模型使用的局限性,实现长短期波动差异性较大的数据序列拟合,又能消除传统灰色Verhulst模型的自身偏差,提高拟合的精度。

1 无偏灰色组合预测模型建立

1.1 传统灰色Verhulst模型建立

设X(0)为原始数据序列,X(1)为X(0)的一次累加生成1-AGO序列,即

X(0)=(x(0)(1),x(0)(2),…x(0)(k),…,x(0)(n))

(1)

X(1)=(x(1)(1),x(1)(2),…x(1)(k)…,x(1)(n))

(2)

Z(1)为X(1)的紧邻均值生成序列,则有

Z(1)=(z(1)(1),z(1)(2),z(1)(3),…,z(1)(n))

(3)

定义1:称x(0)(k)+az(1)(k)=b(z(1)(k))α为GM(1,1,α)幂模型。

1.2 无偏灰色Verhulst模型建立

(1)无偏GM(1,1)模型的建模思想[22-23]

传统EDGM(1,1)模型的离散时间响应式为

k=1,2,…,n

(4)

将传统EDGM(1,1)模型的时间响应式作如下恒等式变换为

k=1,2,…,n-1

(5)

由于原始序列X(0)非负,两边同时取1-Y次方得到

(6)

即可得到无偏GM(1,1)模型的表达式为

k=2,3,…,n

(7)

式中,-a为发展系数;b为灰色作用量。

(8)

为计算简便,上式(7)可表示为

k=2,3,…,n

(9)

综上可得,无内在偏差的GM(1,1)模型是以传统EDGM(1,1)模型为基础,直接建模,且使用递推法求解得到的。同理,无内在偏差的灰色Verhulst模型也可按照相同的方法推导出。

(2)改进的无偏灰色Verhulst模型

灰色Verhulst模型的时间响应式为

(10)

将式(10)的时间响应式两边同时取倒数,即得到

(11)

通过观察上式(11),发现它正好是关于k的非齐次指数函数,故借鉴EDGM(1,1)模型的改进思想,对原始数据作倒数生成,然后再根据无偏GM(1,1)模型直接建模法的思路,生成无偏灰色Verhulst模型。具体地:

定义Y(1)为X(1)的倒数生成序列,则有

Y(1)=(y(1)(1),y(1)(2),…,y(1)(k),…,y(1)(n)),y(1)(k)=1/x(1)(k),k=1,2,…,n;

然后,称

(12)

其中

(13)

并称上式(13)为无偏灰色Verhulst模型。

1.3 马尔科夫修正预测模型建立

运用马尔科夫(Markov)预测方法[24-25]进行拟合结果修正的基本思路是:以通过原始数据序列求得的无偏灰色Verhulst预测曲线为基准,确定序列状态划分以及状态转移矩阵,并依据所构建的状态转移矩阵,估计出更精确的预测值。

(1)状态划分

⊕i=[⊕i1,⊕i2]

(14)

(2)状态转移概率矩阵计算

设系统中由状态⊕i经过m步转移到状态⊕j的次数为nij(m),且⊕i出现的次数为ni(m),则可推算出由状态⊕i经过m步转移到状态⊕j的概率为

pij(m)=nij(m)/ni(m)

(15)

由此形成相应的状态转移概率矩阵如下

(16)

通过式(16)可反映出系统中各状态之间相互转移的规律。因此,状态转移概率矩阵的构建是实现准确预测的关键步骤。

(3)预测值确定

通过分析状态转移矩阵,一旦确定了转移状态,也就得知了灰元⊕i1和⊕i2、预测值的变动灰区间[⊕i1,⊕i2]以及各状态的中值⊕imid,进而得到修正后的预测模型为

(17)

1.4 无偏灰色组合动态预测模型的构想

铁路客运量数据序列往往具有一定的时效性,因为客流量是不断发展变化的。因此,对于预测模型构建而言,距预测年限更近时期的数据信息对预测模型的贡献越大,而越久远的数据信息对其贡献越小。基于上述思想,本文模型将在拟合过程中不断更新信息数据,一直以最新确定的初始序列来建立模型。总体思路为:利用无偏灰色组合模型每拟合出一个新值,则将其替换原始数据序列中最旧的一个数据,记为数列X0中,而且始终保持前后数列等维是相等的;然后以更新后的数据序列为基础,重新建立无偏灰色组合预测模型,继续拟合下一个新值,并发生替换。如此不断更新与替换数据序列,直到实现预期的预测目标或满足一定的精度要求为止。采用的循环模型为

(18)

综上,按照第1.1~1.4节步骤方法,以不断更新方式不断修正传统预测模型,构建无偏灰色组合动态预测模型。下节内容是将所构建的预测模型应用于具体实例,验证是否可以提高拟合结果的精度。

2 预测模型的应用

为验证本文模型的预测精度及可靠性,拟采用我国兰青铁路兰州站—河口南站区段2010—2019年共10年的客运量数据作为预测原始数列(原始数据来自中经网统计数据库(http://db.cei.gov.cn)),见表1。分别通过传统EDGM(1,1)模型、灰色Verhulst模型、无偏灰色Verhulst模型和无偏灰色Verhulst-Markov组合预测模型进行客运量预测,对各种模型的拟合结果及精度进行对比分析。

表1 2010—2019年客运量原始数据统计

(19)

(20)

(21)

(4)无偏灰色组合预测模型建模过程,即以式(13)无偏灰色Verhulst模型为基础,运用Markov链预测方法进行修正,并称这种模型为无偏灰色Verhulst-Markov组合预测动态模型。首先,根据式(14)和原始数据(表1),将系统划分成3个区域,分别记为⊕1、⊕2和⊕3,各状态曲线如图1所示。

图1 各状态对比曲线

其状态⊕1、⊕2和⊕3分别表示为

(22)

最后,依据式(22)状态转移矩阵与式(17)Markov链预测模型,修正无偏灰色Verhulst模型的拟合结果,建立无偏灰色组合动态预测模型。

3 评价结果分析

(1)运用式(19)~式(22)分别求得传统EDGM(1,1)、灰色Verhulst模型、无偏灰色Verhulst模型和无偏灰色组合动态预测模型的2010—2019年客运量拟合值、相对误差、平均绝对误差和平均相对误差,其结果如表2所示。

(2)为更加直观地反映上述4种模型从2010—2019年的拟合值与实际值的对比情况,绘制出图2。

表2 4种预测模型的拟合结果对比分析

图2 4种预测模型拟合值与实际值对比曲线

由图2可以看出,4种预测模型拟合曲线总体上均保持一致的增长趋势,但在不同年份的4种预测模型的拟合值存在一定的差异,虽然图中显示的差异性较小且不明显,主要是由于纵坐标单位量纲较大,若换算成较小单位的量纲,则可明显反映出它们之间拟合结果的差异性。

(3)根据预测有效性判断标准,对表2与图2中4种模型的拟合结果及精度作对比分析,结果表明,无偏灰色组合动态预测模型的预测精度得到明显提高,由此验证了本文所提模型在预测精度方面更凸显优势。

4 结论

本文集成传统EDGM(1,1)、灰色Verhulst模型与马尔科夫链预测方法的优点,运用优势互补原理,建立无偏灰色组合动态客运量预测模型,主要结论如下。

(1)借鉴EDGM(1,1)模型的改进思想,对传统灰色Verhulst模型进行修正,得到无偏灰色Verhulst模型,消除了传统灰色Verhulst模型自身固有的偏差,明显提高了预测精度。

(2)利用马尔科夫链方法对无偏灰色Verhulst的拟合结果进行修正,同时兼顾原始数据序列具有一定的时效性,提出在预测过程中需不断更新信息数据,反复模拟得到无偏灰色组合动态预测模型。

(3)将本文模型应用于我国兰青铁路兰州站—河口南站区段2010-2019年铁路客运量预测,结果表明,无偏灰色组合动态预测模型比传统EDGM(1,1)、灰色Verhulst模型以及无偏灰色Verhulst模型在铁路客运量预测中更具优越性。

猜你喜欢

客运量马尔科夫原始数据
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
基于三维马尔科夫模型的5G物联网数据传输协议研究
基于叠加马尔科夫链的边坡位移预测研究
受特定变化趋势限制的传感器数据处理方法研究
2018年北京市城市公共交通运行特征分析
2018年北京市城际交通运行特征分析
基于改进的灰色-马尔科夫模型在风机沉降中的应用
2018年北京市轨道交通运行特征分析
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
连续隐半马尔科夫模型在轴承性能退化评估中的应用