灰色马尔科夫模型在旅游人数预测中的应用

2019-02-09杨小芬

宜宾学院学报 2019年12期

杨小芬

（西南大学数学与统计学院，重庆400715）

近年来，旅游业对各国的经济发展，环境保护等有着重要的影响. 随着我国社会经济的高速发展，国际地位的显著提高，我国更加注重旅游业的发展，旅游业已经成为我国第三产业的重要组成部分，许多城市也希望借助旅游业的发展带动整个社会经济的发展. 旅游人数是旅游业的重要环节之一，科学准确地预测旅游需求，能够准确把握其发展趋势，从而制定相应的政策来确保旅游业健康持续发展，进一步提升我国的综合实力和国际影响力，同时也促进我国各地区的经济发展和文化交流.

目前，国内外旅游需求预测的主要方法包括回归模型、时间序列、BP 神经网络、灰色模型，指数平滑法、组合模型等，但是哪种方法更好尚无定论，因此要结合实际问题综合考虑模型的选择，以达到较高的预测效果. 由于灰色GM(1,1)模型的预测图形是一条平滑的指数型曲线，所以它不能充分提取数据的波动性，因而对波动性较大的数据序列拟合较差，且预测精度较低. 而马尔科夫模型的研究对象是一个随机变化的动态系统，它是根据状态之间的转移概率来预测系统未来的发展情况，转移概率反映了各种随机因素的影响程度，反映了各状态之间转移的内在规律性[1]. 所以，把两者进行组合，形成一个灰色马尔科夫模型，其中GM(1,1)模型用来揭示数据序列的发展变化趋势，而马尔科夫模型用来确定状态的转移规律，从而组合后的模型能充分提取数据中的信息，提高拟合和预测精度.

灰色马尔科夫模型已经在粮食产量预测，客流量预测，房价预测等方面得到了广泛应用，但是多数学者在使用灰色马尔科夫模型时并没有对用来划分状态的序列进行平稳性检验和马氏性检验，缺乏严谨性. 关于旅游需求的预测，我国学者主要集中在对我国入境游客量或某一地区旅游人数预测的研究，而对国内游客量的预测研究甚少.因此，本文基于灰色马尔科夫模型，对我国国内游客数进行预测研究，并且在方法的使用上更为科学严谨.

1 实例分析

1.1 模型的建立

选取我国2004-2015 年国内游客数据建立模型，利用2016年和2017年的数据检验模型的预测精度，全部数据来源于国家统计局.

1.1.1 灰色GM(1,1)模型

（1）原始数据的检验及处理[2]

建立灰色模型之前，首先要对原始数据进行级比检验和光滑度检验.

设原始数据序列为：

计算光滑比：

对我国2004-2015年国内游客数据进行级比检验和光滑度检验，发现级比并没有全部落入(e)=(0.8574,1.1663)范围之内，且光滑比不是k 的减函数，因此原始数据没有通过级比检验和光滑度检验，如表1所示.

表1 2004-2015年原始数据级比检验和光滑度检验

对我国2004-2015 年国内游客数据做开方处理，并对开方数据进行级比检验和光滑度检验，级比全部落入(=(0.8574,1.1663)范围之内，且光滑比是k 的减函数（见表2），两种检验都通过，可进一步对开方数据建立灰色模型.

表2 2004-2015年开方数据级比检验和光滑度检验

（2）建立灰色GM(1,1)模型

根据灰色模型的理论，利用R编写程序，对我国2004-2015 年国内游客开方数据建立灰色GM(1,1)模型，并对模型进行残差检验，后验差检验和模型预测.结果如表3所示.

表3 对2004-2015年开方数据建立灰色GM(1,1)模型结果

其中X̂(0)(1)=X(0)(1).

②残差检验中，平均相对误差为1.2668%，模型精度为98.7332%，模型精度较高；后验差检验中，小误差概率P=1 ＞0.95，方差比C=0.0770 ＜0.35,参照表4，可得模型精度等级为优；再计算关联度r=0.6031 ＞0.6，模型较好. 所以该灰色GM(1,1)模型通过了三种检验.

表4 后验差检验判别参照表

将灰色GM(1,1)模型的拟合值还原后，与真实值比较，利用平均相对误差计算公式：

计算拟合平均相对误差为2.5350%，模型精度为97.4650%，模型精度较高.

（3）灰色GM(1,1)模型预测精度的检验

利用灰色GM(1,1)模型预测我国2016年和2017年国内游客数据的开方值，并将其还原后和真实值比较，计算预测平均绝对残差为182.986 4（表5）.

表5 灰色GM(1,1)模型预测精度的检验

1.1.2 无偏灰色模型

灰色GM(1,1)模型的参数估计值为：

计算无偏灰色模型的参数值为：

则无偏灰色模型的序列预测方程为：

利用无偏灰色模型拟合我国2004-2015年国内游客开方数据，并将拟合值还原，利用式(3)和(4)计算拟合平均相对误差为2.5316%，模型精度为97.4684%，模型精度较高.

利用无偏灰色模型预测我国2016 年和2017 年的开方值，将预测值还原后和真实值比较，计算预测平均绝对残差为182.357 0（表6）.与灰色GM(1,1)模型相比，降低了0.629 4.

表6 无偏灰色模型预测精度的检验

1.1.3 灰色马尔科夫模型

灰色马尔科夫模型是利用马尔科夫模型对灰色模型的预测值进行修正，从而提高拟合和预测精度.具体步骤如下：

①对原始数据建立灰色模型，并求出拟合值X̂(0)(k)，计算残差的相对值：

②马尔科夫模型要求用于划分状态的数据序列具有近似平稳的过程，因此，对残差相对值序列进行平稳性检验.

③当残差相对值序列的平稳性检验通过后，对其进行状态划分，并确定原始序列所处的状态.

④计算转移频数矩阵和一步转移概率矩阵，并对序列进行马氏性检验.

⑤如果序列没有通过马氏性检验，则不能建立马尔科夫模型；反之，则计算n步转移概率矩阵来确定下一时刻所处状态.

⑥利用式(6)修正灰色模型的拟合预测值.

其中，X̂(0)(k)为灰色模型的拟合预测值，ε1(k)和ε2(k)分别取序列值所处状态区间的左端点值和右端点值.

（1）传统灰色马尔科夫模型

①利用灰色GM(1,1)模型拟合我国2004-2015年国内游客开方数据，根据式(5)计算出残差相对值序列.

②利用ADF 方法检验得残差相对值序列为平稳序列（α=0.05），所以可以对该序列进行状态划分，如表7所示.

表7 差相对值序列平稳性检验（传统灰色马尔科夫模型）

③残差相对值序列的状态划分为：E1=(-3.1%,-1%],E2=(-1%,1%],E3=(1%,3%]，表8为残差相对值序列所处状态.

表8 残差相对值序列所处状态（传统灰色马尔科夫模型）

④根据残差相对值序列所处状态，计算得转移频数矩阵和一步转移概率矩阵分别为：

对序列进行马氏性检验，首先计算边际概率值：

表9 边际概率值

表10 统计量χ2=2计算表

状态1 2 3合计fi1| |||| |||ln pi1 p∙1 1.212 3 0.597 8 0.087 0 1.897 1 fi2| |||| |||ln pi2 p∙2 0 1.502 3 0.087 0 1.589 3 fi3| |||| |||ln pi3 p∙3 0.200 7 0.310 2 0.200 7 0.711 6合计1.412 9 2.410 3 0.374 7 8.395 9

⑤利用式(6)对灰色GM(1,1)模型2004-2015 年开方数据的拟合值进行修正，将修正值还原后，利用式(3)和(4)计算得拟合平均相对误差为0.8978%，模型精度为99.1022%. 可见，与灰色GM(1,1)模型相比，模型精度提高了1.6372%；与无偏灰色模型相比，模型精度提高了1.6338%.

⑥利用传统灰色马尔科夫模型预测我国2016年和2017 年国内游客数，预测平均绝对残差为11.022 3（表11）. 与灰色GM(1,1)模型相比，减少171.964 1；与无偏灰色模型相比，减少171.334 7.

表11 传统灰色马尔科夫模型预测精度的检验

2016 年和2017 年国内游客数计算的具体步骤如下：

①2015 年的残差相对值所处状态为1，故初始向量为v0=(1,0,0)，由一步转移概率得到2016 年的状态分布为：

由灰色GM(1,1)模型预测出2016年的开方数据为67.875 94，对该值进行修正得：

将此修正值还原后，得到我国2016年国内游客为4 424.840 8百万人次.

②计算两步转移概率矩阵. 因为残差相对值序列平稳，所以可以视为齐次马氏链，n步转移概率矩阵就是一步转移概率矩阵的n次方.

计算得两步转移概率矩阵为：

由两步转移概率得到2017年的状态分布为：

所以2017 年所处的状态为max(0.5556,0.1111,0.3333)，即为状态E1：(-3.1%,-1%].

由灰色GM(1,1)模型预测出2017年的开方数据为72.102 91，对该值进行修正得：

将此修正值还原后，得到我国2017年国内游客为4 993.114 5百万人次.

（2）无偏灰色马尔科夫模型

①利用无偏灰色模型拟合我国2004-2015年国内游客开方数据，根据式(5)计算出残差相对值序列.

②利用ADF 方法检验得残差相对值序列为平稳序列，所以可以对该序列进行状态划分，如表12所示.

表12 残差相对值序列平稳性检验（无偏灰色马尔科夫模型）

③确定划分状态为：E1=(-3%,-1%],E2=(-1%,1%],E3=(1%,3%]，表13 为残差相对值序列所处状态.

表13 残差相对值序列所处状态（无偏灰色马尔科夫模型）

④根据残差相对值序列所处状态，计算得转移频数矩阵和一步转移概率矩阵分别为：

⑤利用式(6)对无偏灰色模型2004-2015年开方数据的拟合值进行修正，将修正值还原后和真实值比较，利用式(3)和(4)计算拟合平均相对误差为0.8838%，模型精度为99.1162%. 与传统灰色马尔科夫模型相比，模型精度提高了0.0140%.

⑥利用无偏灰色马尔科夫模型预测我国2016年和2017年国内游客数（计算方法同传统灰色马尔科夫模型），预测平均绝对残差为7.101 6（见表14）.与传统灰色马尔科夫模型相比，减少了3.920 8.

表14 无偏灰色马尔科夫模型预测精度的检验

1.2 利用相对最优模型预测

通过比较各模型的精度，拟合平均相对误差和预测平均绝对残差，选出相对最优模型为无偏灰色马尔科夫模型（表15）.

表15 各模型精度比较

绘制无偏灰色马尔科夫模型的拟合预测图，发现拟合值与真实值几乎完全重合，无偏灰色马尔科夫模型充分提取了原始数据中存在的波动性.利用无偏灰色马尔科夫模型预测我国2018-2020年的国内游客数分别为5 639.366 8 百万人次，6 363.854 百万人次，7 181.415 7百万人次，表明我国未来三年国内游客数仍呈现增长趋势（图1）.

2 结论

在对我国2004-2015年国内游客数据建模的实例中，与灰色GM(1,1)模型和无偏灰色模型相比，传统灰色马尔科夫模型和无偏灰色马尔科夫模型的建立，都取得了非常高的拟合和预测精度. 尤其是无偏灰色马尔科夫模型，模型精度为99.1162%，拟合平均相对误差为0.8838%，它充分提取了数据的发展趋势和波动性；同时也取得了较高的预测效果，预测平均绝对残差为7.101 6. 因此，在预测旅游人数时可以考虑该模型；同时在研究人口问题，或是数据序列波动比较大的问题时，都可以尝试拟合灰色马尔科夫模型来充分提取已知数据中的信息，还可以对其进行修正以获得更高的拟合和预测精度，从而更好地掌握和解决实际问题.

图1 无偏灰色马尔科夫模型拟合预测图

从预测结果来看，我国2018-2020 年的国内游客数分别为5 639.366 8 百万人次、6 363.854 百万人次、7 181.415 7 百万人次，数据呈现增长态势. 国家统计局最新公布的2018年国内游客数为5 540百万人次，2018 年的模型预测值比实际值高99.366 8 百万人次，相对误差为1.7936%. 因此，无偏灰色马尔科夫模型的实际预测效果很好.