APP下载

基于熵值-BP神经网络的机场旅客吞吐量预测

2021-11-19殷小曼

计算机仿真 2021年10期
关键词:第三产业吞吐量权重

高 伟,殷小曼

(中国民航大学空中交通管理学院,天津300300)

1 引言

交通运输业是作为国民经济的基础产业和关系国际民生的服务性行业之一。航空运输具有快速、远程、舒适,安全的特点,在政治、经济、文化、社会建设中发挥着越来越重要的作用。民航所具有的特殊地位、特殊价值是其它运输方式不可替代的。在民航界,也长期存在着“民航运输增长率是国民经济增长率的1.5-2倍”的说法,许多学者也将GDP的增长列为影响机场旅客吞吐量的首要因素。叶舟、李忠民、李晓峰(2005)[1],杨松、王威(2006)[2],刘兰娟、董万好(2009)[3]都曾验证讨论了国民经济的增长可带动民航业的发展。而近些年,我国经济形势严峻,个别城市GDP增长缓慢,甚至出现负增长,但机场旅客吞吐量逐年上升,且增长速度远大于经济增速的2倍。在这种情况下,再纯粹的用GDP作为预测机场旅客吞吐量的指标,结果将不尽人意。因此研究一种考虑了各因素的权重下预测旅客吞吐量的发展的预测方法势在必行。

目前,对于旅客吞吐量的预测较多采用的是计量经济法、时间序列法及组合预测法。2001年,Grubb[4]采用Holt-Winters方法分别进行了英国航空旅客运输量的长期预测和首都机场流量的短期预测。Hong jun等人(2011)[5]提出先采用GDP、人口、第三产业生产总值影响等指标预测机场群旅客吞吐量,再建立旅客选择模型,按比例分配至各机场来预测新建机场旅客吞吐量。屈拓(2012)[6]提出了利用灰色模型对线性变化部分进行预测,然后采用BP神经网络对非线性变化部分进行预测,并对预测误差进行补偿的机场旅客吞吐量组合预测模型。黄邦菊等人(2013)[7]根据影响机场旅客的因素建立了多元线性回归预测模型,预测该机场未来年的旅客吞吐量。陈玉宝、曾刚(2014)[8]为了克服了两种单一预测方法的缺陷采用组合加权方法对首都机场2012-2016年的旅客吞吐量进行预测。刘月(2019)[9]根据影响因素对航空市场带动的滞后性,通过随机森林重要度指数确定各因子的滞后期,在此基础上用多元回归的方法预测旅客吞吐量。以上方法多局限于对于算法本身精度的优化,而各指标与旅客吞吐量之间深层关系、影响程度也是需要关注的。本文拟采用偏相关关系,分析剔除了其它因素影响下,GDP与机场旅客吞吐量的纯相关关系,再利用熵值法确定各影响因素的权重,最后使用BP神经网络来预测机场旅客吞吐量。

2 GDP与机场旅客吞吐量的偏相关分析

机场旅客吞吐量受到市场需求与民航运输供给两方面因素的制约,它与所在地区的经济发展水平密切相关;居民收入及生活水平的提高以及空闲时间的增加,也会使人们外出旅游的人次加大,这些都会使航空客运量的需求增长[10]。通过分析,本文认为可能影响到机场旅客吞吐量的相关指标包括:GDP、第三产业增加值、社会消费品零售总额、常住人口、航线数、旅游人数等。以呼和浩特为例,采集呼和浩特市2009至2018年上述指标的统计数据,见表1。

表1 呼和浩特2009-2018年各指标统计数据

下文中以Ci,i=1,2…6分别表示GDP、第三产业增加值、社会消费品零售总额、常住人口、航线数、旅游人数。如表2所示,仅通过皮尔逊相关系数检验可知,各指标与机场旅客吞吐量相关性系数大于0.5,显著性水平也均小于0.05,可认为各指标与机场旅客吞吐量显著相关。

表2 各指标与机场旅客吞吐量的皮尔逊相关系数

为了研究GDP与机场旅客吞吐量的关系,就必须消除其它指标对机场旅客吞吐量的影响,用偏相关系数来来表示两个指标间的纯相关程度。偏相关系数建立在皮尔逊相关系数的基础上。

rxy表示x与y的皮尔逊相关系数,以三个指标为例,当指标3为控制变量时,指标1和指标2之间的偏相关系数为[11]

(1)

一般认为随着国民收入水平的不断提高,居民消费需求也会更加旺盛。GDP的增长离不开社会消费品零售总额数据的支持,同时第三产业是拉动经济增长的主要动力。将社会消费品零售总额和第三产业增加值作为控制变量,分析GDP与机场旅客吞吐量的偏相关系数,结果见表3。

表3 机场旅客吞吐量与GDP的偏相关系数

通过剔除社会消费品零售总额与第三产业增加值对机场旅客吞吐量和GDP之间相关性的影响,可得到两者的纯相关性。偏相关系数-0.114<皮尔逊相关系数0.754,且P值0.788大于0.05。由此可以看出,如果去掉社会消费品零售总额和第三产业增加值的影响,呼和浩特机场旅客吞吐量与GDP的增长关系是微弱的。

3 熵值-BP神经网络建立

3.1 熵值法计算指标权重

常用于确定权重的方法有德尔菲法、层次分析法和熵值法等,其中层次分析法和德尔菲法属于主观赋权法,无法克服主观随意性较大的缺陷,同时聘请专家会产生很大的工作量,而熵值法属于客观赋权法,能使评价结果更具有科学性和说服力[12]。

设有m个评价方案,n个评价指标,熵值法步骤:

1)计算第j个指标下第i个方案指标值的比重fij

(2)

2)计算第j项指标的熵值ej

(3)

3)各指标的权重

(4)

通过计算,可得到每个指标权重

表4 熵值法得到的各指标权重ωj

GDP所含信息熵占权重最低,再一次验证了前文关于呼市GDP与机场旅客吞吐量关系的讨论。

3.2 BP神经网络建立

人工神经网络是一个由大量简单的处理单元广泛连接组成的非线性系统,用来模拟人脑神经系统的结构和功能,具有良好的非线性映射能力、自适应学习能力和并行信息处理能力[13]。如图1所示的神经元模型,将输入值通过加权求和再经过激励函数的映射,可以得到相应的输出。BP神经网络是一种多层前向神经网络,也是人工神经网络模型中使用最广泛的一种模型。

图1 神经元模型

通过每年各指标数据预测当年机场旅客吞吐量,以各指标统计数据乘以权重后的数值NCi为输入,当年机场旅客吞吐量为输出,则输入层单元数为6,输出层单元数为1。隐层单元数由4~13试算所得,选取网络运作效率高、输出误差较小的隐层单元数11。即采用6-11-1的BP神经网络模型。输入层到隐层函数及隐层到输出层函数都选用tansig,训练函数为trainlm,该网络结构如图2所示。

图2 熵值-BP神经网络

经过Matlab仿真,可得到预测旅客吞吐量,2009-2018年白塔国际机场实际旅客吞吐量、BP神经网络预测值及熵值-BP神经网络预测值对比及其相对误差如表5,图3所示。

表5 2009-2018 白塔国际机场旅客吞吐量预测值对比

图3 实际旅客吞吐量、熵值-BP神经网络法及BP神经网络法预测对比

由预测结果可以看出,经过熵值法确定权重后的输出结果误差更小,与实际旅客吞吐量的最小相对误差是-0.12%,最大误差是-6.48%,训练结果令人较满意。这表明熵值-BP神经网络方法可有效降低误差,应用于机场旅客吞吐量预测是可行的,并且具有准确性。

4 机场旅客吞吐量预测

本文是研究基于熵值-BP神经网络相结合的方法预测机场旅客吞吐量,根据文中建立的预测模型可预测得到呼和浩特白塔国际机场未来年旅客吞吐量。

首先根据该机场历史数据以及该地区的“十三五”规划。采用趋势外推法等较优的预测方法得到未来年呼和浩特市的GDP、第三产业增加值、社会消费品零售总额、常住人口、航线数、旅游人数,如表6所示。

表6 2019-2025年各指标预测值

利用熵值法计算未来年各指标的权重,再建立BP神经网络模型,将各指标预测值作为输入,可得到2019-2025年机场旅客吞吐量。为了验证熵值-BP神经网络预测的准确性,分析2009-2018年白塔国际机场旅客吞吐量的增长趋势,采用时间序列法进行预测,将两者进行比对,如表7。

表7 2019-2025 呼和浩特白塔国际机场预测旅客吞吐量

对比两种方法得到的预测值,相差较小。熵值-BP神经网络所得结果偏大,是由于该方法考虑了各种指标的影响,且对于各指标值乐观预测后得到机场旅客吞吐量,而时间序列法仅考虑了数据序列本身的变化,通过数据自身增长的规律性所得数值,较为保守。总的来说,熵值-BP神经网络法通过预先设定的各指标重要性系数,对各统计数据进行处理,使神经网络更好地收敛到最优结果,预测较为合理。

5 结语

本文通过探究旅客吞吐量的影响因素,创新地采用了熵值-BP神经网络法对机场旅客吞吐量进行预测。利用各指标所携带信息的熵值,定量与定性分析相结合,求得各指标权重,再进行后续神经网络预测。研究表明,该结合方法在机场吞吐量预测上是可行有效地,并且由于对案例的选取并无特殊要求,所以该方法具有一定的普适性;机场旅客吞吐量受到GDP、旅游人数、第三产业增加值等指标的影响,且具有较强的关联性,该预测方法综合考虑了各指标的影响,不受数据本身增长变化的限制,所以该方法可用于中长期预测。

猜你喜欢

第三产业吞吐量权重
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
权重常思“浮名轻”
为党督政勤履职 代民行权重担当
权重涨个股跌 持有白马蓝筹
第三产业完成投资增长2.9%
2017年3月长三角地区主要港口吞吐量
2016年10月长三角地区主要港口吞吐量
2016年11月长三角地区主要港口吞吐量
第三产业完成投资增长6%
第三产业完成投资增长6.7%