APP下载

基于Markov链修正的改进熵值法组合模型及应用

2018-03-21叶雪强桂预风

统计与决策 2018年2期
关键词:过闸货运量船闸

叶雪强,桂预风

(武汉理工大学理学院,武汉430070)

0 引言

长江是我国内河水运最重要、运输规模最大的通航河流。自2003年三峡船闸投入运行以来,过闸货运量快速增长,2014年三峡船闸过闸货运量达到近1.2亿吨。长江三峡船闸过闸货运量常应用于各种经济规划分析中,并作为衡量内河航运发展程度的一项重要指标[1]。

目前,货运量的预测方法主要有时间序列分析法,回归分析法,弹性系数法,平均增长率法,灰色系统预测法等。杜嘉[1]采用弹性系数法、平均增长率法、回归分析法、曲线拟合法分别预测三峡过闸货运量,并根据各种预测方法的特点及适用场合,最终确定四种过闸货运量预测方法的权重系数。赵奇志[2]采用回归分析模型、二次指数平滑法、抽象方式选择模型、增长系数法分别预测广西内河货运总量,最后通过综合比较分析,最终预测出西津水利枢纽过闸货运量。马海峰[3]采用平均增长率法预测三峡船闸过闸货运量。

本文根据三峡船闸过闸货运量的历史数据,建立了GM(1,1)预测模型和线性回归预测模型,并提出了熵值法组合预测模型。由于熵值法确定组合预测权系数不可避免地会碰到一些极端值,如相对误差为零,或者数据出现异常点等,而熵值法确定组合预测权系数要求相对误差必须全部大于零,否则不能求相对误差的熵值,从而提出了改进熵值法组合预测模型,并对三峡船闸过闸货运量进行预测。

1 组合预测模型的基本原理

1.1 组合预测模型

1.2 组合预测模型权系数的确定

1.2.1 基于熵值法的组合预测模型权系数的确定方法[4]

组合预测综合利用各种单项预测方法所提供的信息,以适当的加权平均形式得出组合预测模型。组合预测核心的问题就是如何求出组合预测加权平均系数,使得组合预测模型更加有效地提高预测精度。本文从信息论的观点出发,根据各单项预测方法预测误差序列的变异程度,利用信息熵的概念。计算出组合预测加权平均系数。

设第i种单项预测方法第t时刻相对误差为:

用熵值法确定组合预测加权系数的步骤如下:

(1)将各种单项预测方法预测相对误差序列归一化。即计算第i种单项预测方法第t时刻的预测相对误差的比重:

(2)计算第i种单项预测方法的预测相对误差的熵值hi:

其中k>0为常数。对第i种单项预测方法而言,如果pit全部相等,即,那么hi取得极大值klnN,这里取k=1 lnN,则有0≤hi≤1。

(3)计算第i种单项预测方法的预测相对误差序列的变异程度系数:

(4)计算各种预测方法的加权系数:

(5)计算组合预测值:

1.2.2 基于改进熵值法的组合预测模型权系数的确定方法

传统的熵值法确定权系数不可避免地会碰到一些极端值,如相对误差为零,或者数据出现异常点等。而传统的熵值法确定权系数要求相对误差必须全部大于零,否则不能求相对误差的熵值,或者人为主观的定义0ln0=0,是为了保证数据的完整性和确定权系数的客观性,等于零的数值又不能直接删去,因此需要对该相对误差进行变换,从而对熵值法进行改进。为了缩小极端值对权系数的影响,并保证赋权的客观性,可以对相对误差序列进行变换,然后再按照传统熵值法的步骤(1)至步骤(5)进行计算。相对误差变换公式为:

其中:

2 Markov链模型

Markov链是一种特殊的随机过程[5],其可以根据系统当前时刻的状态推求下一时刻的状态概率分布,进而得到下一时刻的状态。其基本原理是:每个系统的状态可用随机变量表示,并对应一定的状态概率,当某一时刻状态转移到下一时刻状态时,同时在这个过程中存在概率的转移,即转移概率[6]。

假设有个n状态,并且状态的个数是可数的,那么状态Ei经一步转移到状态Ej都有可能发生,则这个过程可能发生的概率称为一步转移概率pij。所有的状态一步转移概率构成一步转移矩阵P(1)。Markov链预测模型[7]可表示为:

其中,P0为初始时刻的概率分布,Pt+1是t+1时刻的概率分布,P(1)为一步转移概率矩阵,其表达式为:

式中:pij为一步转移概率,

根据改进熵值法组合预测模型预测结果,选择适合的指标(这里采用预测结果的相对误差)划分状态空间;计算其一步转移频数矩阵,求出其一步转移概率矩阵;利用Markov链预测模型对改进熵值法的预测结果进行修正。

3 预测实例

本文根据三峡船闸过闸货运量2003—2014年数据的变化趋势,先利用GM(1,1)模型和线性回归预测模型分别进行预测;之后再利用组合预测模型对年过闸货运量进行预测,并对各种方法的预测结果进行对比分析;最后通过Markov链模型对预测结果进行修正。三峡船闸过闸货运量2003—2014年数据(记为y,单位:万吨)见表1所示。

表1 预测方法的预测拟合值

3.1 单项预测模型

3.1.1 GM(1,1)模型

灰色系统建模是通过数据序列建立微分方程来拟合给定的时间序列,从而对数据的发展趋势进行预测[8]。

设为原始数据序列:

将原始序列进行一次累加,得到:

GM(1,1)模型的时间响应序列为:

还原值为:

利用GM(1,1)模型建模可以得出三峡船闸过闸货运量的GM(1,1)模型的时间响应序列为:

利用GM(1,1)模型的时间响应序列进行预测并对预测结果进行一次累减后的数列即为运用GM(1,1)模型对过闸货运量的预测估计值(记为x1),见表1所示。

通过对模型的检验,得出以下结果:

(1)残差检验:相对残差φˉ=6.94%>10%,认为其预测精度较高。

(2)关联度检验:关联度r=0.7243>0.6,认为其模型可以接受。

(3)后验差检验:小残差概率p=1>0.95,认为其模型为小残差概率合格模型。

3.1.2 线性回归模型

一元线性回归模型[9]的数学形式:

其中,ε是随机误差,通常假定ε~N(0,σ2)。

由于过闸货运量数据随年份呈线性趋势,故建立一元线性回归模型:

通过对模型的检验,得出以下结果:

(1)回归系数的显著性检验:β1显著性检验的t值为t=13.6953,其对应的p值p=0<0.05,认为β1显著性不为零。

(2)线性回归方程的显著性检验:线性回归方程的显著性检验的F值为F=187.5624,其对应的p值p=0<0.05,认为线性回归方程显著。

3.2 组合预测模型

3.2.1 基于熵值法确定权系数的组合预测模型

在利用以上两种单项预测模型计算出预测拟合值后,根据熵值法来确定两种单项预测模型的组合权系数,得到的权系数向量为:

ω=(0.4562,0.5438)

从而得到相应的熵值法组合模型为:

利用熵值法组合预测模型(记为组合模型1)得到的预测拟合值(记为x3)见表1所示。

3.2.2 基于改进熵值法确定权系数的组合预测模型

根据改进熵值法来确定两种单项预测模型的组合权系数,得到的权系数向量为:

ω=(0.6054,0.3946)

从而得到相应的改进熵值法组合预测模型为:利用改进熵值法组合模型得到的预测拟合值(记为x4)见表1所示。

3.3 预测模型精度比较

比较两种单项预测模型和两种组合模型的拟合精度,以预测误差平方和作为反映预测精度的一个指标。通过计算两种单项预测模型和两种组合模型的预测误差平方和(结果见表2所示)可以得出,熵值法组合预测模型精度低于改进熵值法组合预测模型精度,但高于两种单项预测模型的精度,由此可见,改进熵值法能有效的减少预测误差,提高预测精度。预测误差平方和公式为:

表2 各种预测模型的预测误差平方和

3.4 基于Markov链模型修正的改进熵值法组合预测模型

计算改进熵值法组合预测模型对过闸货运量的预测相对误差,计算结果见表3所示。根据预测相对误差的具体数值,划分的Markov状态空间间为:(1)状态空间E1为预测相对误差ε∈[-18%,-6%),属于预测偏低状态;(2)状态空间E2为预测相对误差ε∈[-6%,6%),属于预测正常状态;(3)状态空间E3为预测相对误差ε∈[6%,18%),属于预测偏高状态。并以此对改进熵值法组合预测模型的预测相对误差进行状态划分,结果见表3所示。

表3 2003—2014年过闸货运量的预测相对误差及状态分类

由表3可计算出其一步转移频数矩阵Q,从而计算出一步状态转移概率矩阵P(1),其中:

同理,

转移矩阵的不变分布为:

根据Markov链预测模型,由转移概率矩阵可以得出预测值的状态空间及其相对应的概率,从而可以计算出基于Markov链修正的改进熵值法组合预测模型的预测结果。由不变分布可以得出,若干年之后Markov链处于状态E1,E2和E3的概率分别0.5455,0.2727和0.1818。表4(见下页)列出了2015—2020年基于Markov链修正的改进熵值法组合预测模型的预测结果。

4 结论

本文采用了熵值法组合预测模型对三峡船闸过闸货运量进行预测,针对熵值法确定组合预测权系数的不足,提出了改进熵值法组合预测模型,并且预测精度比熵值法组合预测模型的预测精度更高。最后利用Markov链预测模型对改进熵值法的预测结果进行修正,进一步增加了预测的精度和可信度。

表4 改进熵值法组合预测结果的Markov链修正值

[1]杜嘉.长江三峡枢纽水路客货运输量预测[D].重庆:重庆交通大学硕士学位论文,2008.

[2]赵奇志.西津枢纽货运量预测及二线船闸通航条件研究[D].重庆:重庆交通大学硕士学位论文,2013.

[3]马海峰.三峡枢纽过闸货运量预测分析及对策研究[J].中国水运,2015,38(3).

[4]陈华友.组合预测方法有效性理论及其应用[M].北京:科学出版社,2008.

[5]朱新国,张展羽,祝卓.基于改进型BP神经网络马尔科夫模型的区域需水量预测[J].水资源保护,2010,26(2).

[6]景亚平,张鑫,罗艳.基于灰色神经网络与马尔科夫链的城市需水量组合预测[J].西北农林科技大学学报,2011,39(7).

[7]付长贺,邓甦.马尔科夫链在传染病预测中的应用[J].沈阳师范大学学报:自然科学版,2009,27(1).

[8]许国根,贾瑛.模式识别与智能计算的MATLAB实现[M].北京:北京航空航天大学出版社,2012.

[9]何晓群,刘文卿.应用回归分析[M].北京:中国人民大学出版社,2011.

猜你喜欢

过闸货运量船闸
江苏内河航道船舶优先过闸现状与经验
三峡船舶过闸计划的智能编制与优化
抗疫,在三峡两坝船闸水域
船闸
五级运行闸次排序对三峡船闸上行过闸效率的影响
2017年上半年拉脱维亚港口货运量同比增长7%
船闸
见证三峡船闸试通航