APP下载

基于灰色周期外延的航线客流量区间序列预测模型

2021-07-09鄢仕林

工业工程 2021年3期
关键词:客流量外延航线

汪 瑜,车 通,鄢仕林

(中国民航飞行学院 机场工程与运输管理学院,四川 广汉 618307)

时间序列预测模型被广泛地应用于金融、经济、工程、管理等领域,实践证明该方法也同样适用于航空运输业中的航线客流量预测。针对具有时间序列特征的航线客流量预测问题,目前采用的方法主要包括以下几种。1) 基于自回归移动平均模型(autoregressive integrated moving average model,ARIMA)。如,景崇毅等[1]提出对主体ARIMA模型的残差序列进行二次建模以提高原模型的精度和适应性,并利用航线运量实数时间序列进行建模仿真;王婷[2]、王蓉[3]利用ARIMA模型对航线客流量观测数据进行建模,得到了较好的预测效果。2) 基于灰色系统理论模型。如,郑丽[4]运用灰色模型计算了国际客运量影响因素及其关联度水平,并据此优化了宁波空港运力分配方案;朱佳等[5]针对中国国际航线客运量预测问题,建立了新陈代谢灰色马尔科夫预测模型,并获得了较高的预测精度。3) 基于组合模型。如,张千露[6]利用指数平滑法、ARIMA模型和灰色预测法分别建立了3种单项预测模型,并利用等权法、线性组合模型和贝叶斯组合模型,综合各单项模型结果,获得了更佳的预测效果;郑彦[7]将ARIMA模型和回归分析相结合,为基于月度数据的时间序列定量分析提供了一个有效的方法。

然而,上述预测方法在解决时间序列问题时,所获取的每一期的观测样本均以精确实数表示,忽略了航线客流的随机波动特性,导致丢失部分重要信息,从而使得预测结果难以满足实际管理决策的需要。如,难以为航空运输企业开展诸如航线设计、航班计划编排、航班座位控制等问题的系统优化;难以为风险控制决策提供可靠信息。针对这一问题,统计学方法理论上可以通过采集观测样本获取航线客流的先验分布特征,以解决上述信息丢失问题,但前提是样本容量是充足的。然而,当前中国约有70%的民用运输机场均为年旅客吞吐量不足200万人次的中小型机场,其开辟的航线普遍具有运营周期短、航线客流样本容量小的特点。这一现状导致大量航线客流难以获取其先验分布。三元区间标度法是克服上述问题的有效方法。该方法能够刻画出航线客流的随机波动特性,而且通过获取航线客流特征的上、下界,以及在中间增加一个最可能取值(偏好值),可以尽可能囊括航线客流更多的信息和特点。基于区间标度的航线客流量预测方法目前少见报道,在该方面的研究成果主要集中于预测理论和方法的研究。如,杜康等[8]基于三元区间相似度与诱导广义有序加权对数平均(induced generalized ordered weighted logarithm averaging,IGOWLA)算子形成组合模型实现预测,并探讨了IGOWLA算子对模型精度的影响;李芳芝等[9]、吴潜[10]、戴勇等[11]基于中点及半径的区间数组合模型来提高预测精度,并给出了将中点及半径看做实数序列解决区间预测的新方法;Zeng等[12]提出了一种适用于三元区间数序列的新型多元灰色模型;Wang等[13]提出了基于梯形隶属度的网络分析法(analytic network process,ANP)模型和模糊综合评价模型,并采用区间数形式对项目选择进行评价;曾祥艳等[14]基于灰色模型对三元区间数时间序列进行了预测,并得出了新的参数设置方法使模型能直接对三元区间数时间序列建模。

本文针对上述“小样本、贫信息”且具有随机波动特性的航线客流量预测问题,尝试将三元区间标度法应用到民航运输业航线客流量预测中,借助灰色系统理论在解决“小样本、贫信息”预测问题中的优势[15,16],结合航线客流季节性波动特点,在GM(1,1)模型基础上进一步利用周期外延方法对获取的残差序列进行二次预测,以期提高预测精度。

1 模型的建立

1.1 三元区间数时间序列数据转换

传统利用一个精确实数表示具有随机波动特性的航线客流量,往往只能表达特定时间序列在某个时间节点上的一个可能值(如平均值),但难以反映出客流量在该时间节点上的随机波动特征,如波动的最大值、最小值等信息。构造含有左界点、中间点和右界点的三元区间数(左界点表示波动的最小值,中间点表示波动的平均值,右界点表示波动的最大值),可以实现包含具有随机波动特性的航线客流更多信息的目的。从整个时间序列来看,将三元区间数时间序列转换为左、右半径和中心序列,以形成三个独立的精确实数时间序列并对其开展建模和预测,可以使得整个预测结果更为精确。

1.2 建立灰色GM(1,1)预测模型

灰色GM(1,1)模型通过将离散的实数数据叠加弱化数据的随机性、增强规律性,对小规模、离散性随机数预测时有着较好的效果。

1.3 建立残差序列的周期外延模型

1.4 三元区间数时间序列数据还原

整个还原过程需确保三元区间数中的左界点、中间点和右界点的相对位置保持不变,即由式(1)~(3)可看出,转换后的左、右半径序列及中心序列实际上是三元区间数左界点、中间点和右界点的加权平均。这种加权平均不仅保持了区间数的完整性和区间波动性规律,还减弱了界点的跳跃度,避免了界点大小关系的错乱,从而提高了预测精度。根据式(14)~(16),将灰色周期外延模型下的预测值作还原处理,以获取三元区间数左界点、中间点和右界点的预测结果。

1.5 模型的评价

1) 平均绝对百分比误差(mean absolute percentage error,MAPE)是常用于衡量预测准确性的统计指标。本文三元区间数的平均绝对百分比误差为

2) 均方误差(mean-square error,MSE)能够反映预测值与原始数据的离散程度。三元区间数数据的均方误差为

2 算例分析

研究采集的历史数据来自于中国民用航空局发展计划司提供的《从统计看民航》和《民航行业发展公报》。以每年12个月月度运输量中的最大值、平均值和最小值分别作为三元区间数的左界点、中间点和右界点,通过将三元区间数时间序列转换为左、右半径和中心序列以形成3个精确实数时间序列,并根据式(1)~(16)获取预测结果。

2.1 预测结果

以2004—2016年公布的旅客运输量共计13组数据进行拟合建模。选取2017—2019的3组数据进行预测检验。拟合及预测结果如图1~3所示。

图1 拟合及预测效果Figure 1 Fitting and prediction effect

使用MAPE值和MSE值评价模型的预测精度,结果如表1所示。可以看出,模型的拟合效果和预测效果较优。

表1 拟合及预测效果评价Table 1 Evaluation of fitting and prediction effect

2.2 对比分析

对于时间序列的预测,ARIMA模型和灰色模型预测均为较优的方法。其中,ARIMA模型对长时间、数据丰富的时间序列预测准确性较高;灰色模型对短期、贫数据的时间序列有较好的预测结果。为说明本文方法的优势,与ARIMA模型的计算对比结果如表2所示。各模型计算结果的标准差和平均绝对百分比误差结果如表3所示。

表2 拟合及预测结果对比Table 2 Comparison of fitting and prediction results

表3 拟合效果评价对比Table 3 Evaluation of fitting effect

可以看出,不论是在模型的拟合阶段还是在预测检验阶段,灰色模型的计算结果较ARIMA模型的结果更有优势;灰色周期外延模型的计算结果在灰色模型的基础上有进一步的改善;ARIMA模型与真实值的拟合结果劣于灰色模型和灰色周期外延模型。

在不同样本数下,分别使用ARIMA模型和本文方法对样本进行拟合。为了防止数据差分后小于10的情况出现(Matlab单位根检验限制的数据长度必须大于10),本文将样本数扩大为13个及以上(依次按照年份往前采集数据),不同样本数下各模型的计算结果如表4所示。

表4 不同样本数下的拟合及预测效果评价对比Table 4 Evaluating comparison of fitting and prediction effect under different sample sizes

可以发现,随着样本数目的增多,GM模型和GM周期外延模型的拟合及预测指标值均呈现上升趋势。样本数目低于15组时,灰色周期外延模型的拟合及预测指标值整体低于ARIMA模型的计算结果;样本数目介于15~17组之间时,在灰色周期外延模型的拟合及预测结果中,已有部分指标值高于ARIMA模型的计算结果;样本数目达到18组及以上时,灰色周期外延模型的拟合及预测指标值已全面高于ARIMA模型的计算结果。2种模型的拟合及预测变化趋势符合前文所述的模型的适用性特征。

3 结论

针对“小样本、贫信息”且具有随机波动特性的航线客流量预测问题,本文首先采用三元区间数结构弥补了精确实数包含信息量少的缺陷。通过计算三元区间数时间序列的左、中、右界点,将其转换为3个独立的时间序列。然后,考虑灰色预测模型在“小样本、贫信息”问题预测方面的优势,结合航线客流量季节性波动特性,构建了灰色周期外延预测模型,并分别对上述3个独立的时间序列进行预测,最后通过实例验证了该模型的优势。今后,可以进一步研究能够直接用于三元区间数时间序列航线客流量预测的模型,以提高预测的精度。

猜你喜欢

客流量外延航线
(21)新航线
基于嵌入式系统的商场客流量统计算法
关于工资内涵和外延界定的再认识
入坑
太空新航线
太空新航线
爱情的内涵和外延(短篇小说)
基于AFC数据的城轨站间客流量分布预测
从客流量推算公交出行PA矩阵的方法
新建旅游项目客流量分析方法初探