突发公共事件下的飞行量BP神经网络预测方法

2023-06-08陈华群王玉珏柳藴栖

运筹与管理 2023年4期

陈华群, 王玉珏, 柳藴栖

(中国民用航空飞行学院空中交通管理学院,四川广汉 618307)

0 引言

突发公共事件是指突然发生,造成或者可能造成严重社会危害的灾害或灾难。由于事件的发生、防控和造成的破坏程度都具有不确定性,众多历史事件表明重大突发公共事件扰乱正常的航班飞行量运行次序甚至使整个民航行业都陷入低迷。如:美国911恐怖袭击事件导致美国航空连续3个月在20%以上降幅,持续约3年才恢复到事发前水平;08年5月,汶川地震导致成都双流机场临时关闭,全国所有往返成都的航班备降或取消;11年日本地震引发海啸导致福岛核电站泄露影响长达数年的对日航班运行;2020年爆发的新冠疫情导致全球旅客运输航班量呈现断崖式下跌,当年2月我国单日客座率降至39.45%,比去年同期减少89%,随着疫情扩散,全球近20家航空公司申请破产,整个行业低谷徘徊。因此,有必要深入分析突发公共事件对航空运行的影响关联,运用现代信息技术,建立一套智能的飞行量预测体系,安全、高效地调配运力资源,为后续制定航空运行调整策略提供参考。

当前信息化、数字化和智能化融合技术已经广泛运用到突发公共事件对行业的影响分析和未来趋势预测,主要有:王欣欣运用SPSS软件对突发公共事件的舆情主体、客体、本体、媒体的样本进行分类,构建了网络舆情预测模型和方法,指出了突发公共事件发生时政府、媒体及其他相关企业或部门根据不同事件舆情的不同特点,采取针对性对策,有助于提高处理效率[1];李秋霞构建了 PHEEI-CGE 模型测算城市突发公共卫生事件对我国宏观经济和行业产出的影响,指出了从运行、整合、保障三方面系统和科学地应急处置协同机理[2];肖梦黎等从民众认知与专家知识之间认知差异的视角下,提出了在治理公共突发危机中的风险沟通模式,该研究思路可借鉴为航空运输预测时需纳入社会大众心理认知和行业专家意见[3];武昭原等利用ABM建模方式解决了不同市场主体的行为决策下的不平衡资金分配机制,该研究提出的将市场化程度、可再生能源渗透率和免考核区间等外围影响因素,纳入资金分配平衡预测[4];甘国育提出基于长短期记忆网络和深度学习机制的航线的客运量和航班票价预测方法,引入神经网络有效处理了航班和票价在时间维度上复杂的非线性、非平稳性关系[5];倪超等采用ARIMA、人工神经网络和机器学习三种基于时间序列的预测方法对高空管制区航班流量进行拟合对比,得出人工神经网络的随机森林的预测方法准确度最高[6];陈彦晖等针对波动性上升或下降的时间序列,建立了基于广义等高线的灰色波形预测模型和方法,分别以我国民航客运量预测进行上升趋势和近期原油价格作为下降趋势预测验证,引入样本内数据建模和样本外数据预测的模式,实现了较小样本数量的发展变化预测[7];万连成等分别使用了传统、新信息和新陈代谢GM(1,1)灰色预测模型对新冠肺炎疫情期间的飞机利用率、确诊人数、治愈人数等做灰色短期预测,由于仅选取了10天的数据,使得预测结果不能完全体现疫情发展的生命周期[8];杨璐等构建了基于多元线性回归法和灰色GM(1,1)模型的后疫情时期机场起降量组合预测法[9],该方法较依赖基于时间序列的历史数据,且未充分考虑疫情发展的不确定性,可能会导致预测结果抗外界干扰能力较弱。

通过现状分析发现针对突发公共事件对航空业影响大多集中在定性管理策略,运用数据关联分析、深度定量挖掘和智能预测的研究较少。因此,本文拟运用斯皮尔曼等级相关方法定量公共突发事件发展态势对航空运输的影响关联,拟构建人工神经网络飞行量预测模型,明确公共突发事件对航空运行的正向传播的影响波及范围,由飞行量预测趋势反向计算公共突发事件下各项策略的影响权重和激活方式。

1 基于ABI机制的影响要素构建

突发公共事件包括自然灾害、事故灾难、公共卫生事件和社会安全事件,根据人类社会对事件现有的认知和处理能力,分为可预控和不可预控[10～12]。上述特性对航空出行者即具有一定的心理影响效应,也属于社会公共行为,本文引入ABI(Agent Based Index)机制,将突发公共事件作为个体引导特征,最终输出造成影响的不同运营范围和起降架次的ABI指标,具体流程如图1所示。

图1 基于ABI机制的突发事件下的飞行量预测

预测流程充分运用ABI的另一个核心要素“代理人”的特性,使之与突发公共事件的发展生命周期的相互融入,构建了突发公共事件下的影响航班预测的要素。

由图1可知:根据历史经验数据,若突发公共事件属于可防控类,则进入ABI的主动“代理模式”,判断事件属性确定事件发生的阶段和预计持续的周期,确定突发公共事件的各要素对飞行量预测的影响指标。

2 斯皮尔曼相关性检验

为确定突发公共事件与航空飞行量变化趋势之间的关联,分别设置两个变量集(X,Y)。X代表突发公共事件的等级集,设为X={x1,x2,x3,x4},分别表示Ⅰ级(特别重大)、Ⅱ级(重大)、Ⅲ级(较大)和Ⅳ级(一般),属于有序等级变量。为了实现横向和纵向的航班数量与突发公共事件发生的关联分析,设飞行种类变量集Y={Y1,Y2},Y1代表与去年同期运行种类数量的比例变化,Y2为当年不同事件等级下的运行种类比例变化,均属于连续变量。上述变量符合斯皮尔曼等级相关性检验的要求。

选取研究周期内m天各类运行种类数量为样本容量n,根据应急管理部门公布的信息,确定突发公共事件等级的变化;利用归一化处理方法将研究周期内的各种类型分别取n个原始飞行种类数据被转换成连续比例变化。依据原始飞行种类数量在总体数据中平均的降序位置,被分配了一个相应的等级。两者之间的相关系数ρ计算如式(1)所示:

(1)

式中,Δdi表示被观测的各类运行两两变量的等级差值。

利用SPSS数据分析技术,统计分析历史公共突发事件对各种运行类别数量的影响,利用机器学习挖掘两类数据之间的斯皮尔曼关联性,采取样本如表1所示,每一行两个变量集取值代表研究周期内每日的数据,选择斯皮尔曼相关性检验。

表1 变量的数据采样

表1:i=1,2,3,4表示突发公共事件的4种等级;t=0,1表示上年度和本年度;j=1,2…m表示研究周期内的每一天;变量Y按照各类航班分别按式(2)和(3)计算横向和纵向占比。

3 改进的神经网络模型与算法

依据公共突发事件与飞行量变化的历史数据实现了二者相关性检验,定量了两者直接的正负关联,排除了不相关的要素。同时将历史数据所反映的趋势可作为输入样本,通过样本数据的训练,不断修正网络权值和阈值使误差函数沿负梯度方向下降,逼近期望的预测值。由此建立的基于BP神经网络的飞行量预测改善模型,即利用了时间序列预测的数据趋势,又充分考虑了外界条件发生重大变化影响航空运行的动态约束,使预测结果更加贴近实际。

3.1 BP神经网络预测模型

基于BP神经网络的正向传播和反向计算的数据训练方式,飞行量预测网络由输入层、隐藏层、输出层组成[13～15]。输入层包括研究周期内的各类运行的起降量和突发公共事态的统计,隐含层代表突发公共事件下的运行约束,输出层输出l维各种运行的预测量,具体BP神经网络预测结构如图2所示。

图2 航班预测BP神经网络结构

上图可知:输入层将他们作为给定训练D={(x1,y1),(x2,y2),…,(xn,yn)},其中xn∈Rd,yn∈Rl,表示输入的各类运行的起降架次由d个属性组成;隐含层根据专家经验和输入输出数据关联,将国际事态、国内防控、地区协调、行业规划和公司运营作为5个神经元;设置两层输出,第一层为各类运行起降架次的预测量,第二层为的1个神经元代表总起降量。

3.2 预测算法训练

上述建立的飞行量预测BP神经网络是一种多层前馈网络,为求得预测输出值,关键需要确定输入层与隐含层、隐含层与输出层的权值和各神经元的阈值。

将研究周期内的国内、国际、港澳、台湾地区、客运和货运起降架次与突发公共事件变化趋势的关联作为输入,因此建立15×6的输入层到中间层的权值矩阵。突发公共事件通常较难确定其完整的生命持续周期,影响未来飞行量的各类约束也是随时动态变化的。本文基于Matlab的神经网络训练能力使用随机的方式,通过历史数据的关联性学习,以此进行训练突发事件与飞行量的未来变化规律,确定各层神经元之间的权重矩阵参数。为增加梯度下降收敛到较低训练错误的几率,按照各类飞行量进行自适应降序方式取值。

设θi为各神经元的阈值,根据生物学中的知识,只有当神经元接收到的信息达到阈值是才会被激活[16]。本文采用Sigmod函数作为神经元激活,利用它可以把输入从负无穷大到正无穷大的信号变换成0到1之间输出,不但有利于直观呈现飞行量变化的趋势,也能实现某一时间段内航班随疫情的非线性映射,激活函数如式(4)所示:

本文通过改进Matlab自带的BP神经网络的输入关联,以突发公共事件生命周期的飞行量趋势变化作为训练函数确定权值和阈值,实现各层神经元的连接,通过学习计算实现预测输出;将输出数据与实际输出比较,误差反传,不断调整权值和阈值,直至达到设置的最大迭代次数或者预期的误差区间。具体算法步骤:

Step1生成飞行量预测的BP神经网络结构,并完成变量的初始化。设置训练循环次数即net.trainParam.epochs=T,初始化网络结构,给定误差ε=0.01。

Step2样本xi输入预测网络。根据设定的研究周期,输入突发公共事件和飞行量的数据变化,以此进行关联训练后,将信息输入Matlab平台建立的预测网络,即data=xlsread(‘数据’,‘Sheet1’,‘研究周期第一天:研究周期最后一天’)。

Step3各层之间的网络训练。通过各节点间的连接情况正向逐层处理后,调用train和test反复训练和测试,完成神经网络的实际单向输出。

Step4计算实际输出与期望输出的误差。按最小误差准则来不断调整网络结点的权值,直至误差。

Step5误差的反向回传。将误差逐层反向回传至之前各层,并按一定原则将误差信号加载到连接权值ωjk上,使整个神经网络的连接权值向误差减小的方向转化。

Step6预测结果输出。使用matlab的神经网络工具训练重复以上步骤,直到整个训练样本集的误差减小到符合要求为止,否则转入Step3。

为更直观体现飞行量受突发事件影响的波动,本文引入归一化处理的方式,读取的训练样本数据都归一化到[0,1]之间。

4 算例分析

为验证模型和算法的可行性和预测效果,以当前全球新冠疫情事件下的民用运输类航班运行为例,运用大数据处理技术可知:疫情的发展和航班量的变化存在相关性;疫情逐渐走向可控化阶段,航班量逐步恢复到疫情前的水平。

4.1 全年起降总量同期对比

2020年的航班实际起降次数较2018年和2019年不仅是总起降次数、国内国际以及港澳台地区均有所减少,运用Matlab三年按月纵向统计对比结果如图3所示。

图3 我国近三年航班量纵向对比

通过数据分析可知:自2020年2月份疫情爆发后,航班量骤减至1月份的27%,同比2018、2019年同期分别减少67.9%和70.4%。随着疫情的不断控制,航班量逐渐恢复至同期水平,为分析新冠疫情的事态与航班变化的关联趋势,运用SPSS对2020年两者每月的横向对比进行分析,对照结果如图4所示。

图4 2020年新冠疫情变化与航班总量对照

通过Matlab关联分析可知:2020年由于新冠肺炎原因造成航班量减少,2月为全年最少,在之后的十个月随着疫情逐渐控制,航班量呈波动上升趋势,且逐渐恢复到疫情前的水平。

4.2 疫情爆发高峰时期的航班变化

2020年1月底我国疫情大量爆发,对航班量振幅巨大。本文以2020年1月20日到3月12日53天爆发高峰期期内的国际和国内航班量与每日新增病例的变化趋势为研究对象,通过归一化处理,分析全球主要国家和我国新冠确诊人数与我国国际国内航班数量变化趋势的对照,分析结果如图5所示。

图5 我国疫情爆发高峰期与航班量变化趋势对比

通过图5分析可知:国内疫情刚爆发时,航班总量与往年同期变化不大,体现了面临未知的公共卫生事件,航空运输具有一定的延迟效应;国际航班在国内某一区域疫情爆发期却呈现不降略增的逆势,体现了国际航班主要受全国和全球疫情事态的影响。

4.3 相关性检验

为分析我国新冠疫情发展状况与航班量动态变化的趋势特征,运用SPSS数据关联性处理对2020年全年数据的发展态势进行对照分析,分析疫情国内每日新增确诊人数、全球每日新增确诊人数和国内航班量、国内航班量以及港澳台航班量的斯皮尔曼相关性结果分别如图6所示。

通过数据相关性分析,可知:全球新增确诊人数和国际航班量的斯皮尔曼相关系数为-0.149,二者为负相关呈反比函数,全球每日新增病例数量限制了国际航班量架次;国际航班量也受我国国内疫情影响,国内新增确诊人数和国际航班量的斯皮尔曼相关系数为0.477、与国内航班量的斯皮尔曼相关系数为-0.328,表明存在显著相关。相关系数为负说明二者呈反比例函数,每日确诊人数作为独立变量,国内航班量为依赖变量,当每日新增确诊病例增加时,国内航班量减少;当每日确诊病例减少时,国内航班量增加。

4.4 神经元训练和结果预测

基于Matlab.net对3层航班预测BP神经网络进行训练,输入神经元为2018、2019、2020以及2021年前10个月的每月航班量与之对应的新冠疫情事态关联事件,隐含层神经元个数设定为15个,输出层的神经元国内、国际和客货总计预测航班量4个。

样本选取了46个月航班总量,为了避免过拟合,设置数据中的70%划分为训练集进行训练,15%的数据作为验证集进行验证,15%的数据作为测试集进行测试。利用本文提出的改进net.iw进行训练,得到如表2所示的输入层至隐含层的权值矩阵。

设置最大训练次数为1000次,自回归结束为3,运用本文提出的基于突发公共事件生命周期的航班预测BP训练机制,Matlab平台运行代码共计迭代23次并得到国内、国际和客货航班未来8个月的预测结果,分别如图7至图10所示。

图7 未来8个月国内航班预测结果

图8 未来8个月国际航班预测结果

图9 未来8个月客运航班量预测

图10 未来8个月货运航班总量

由上述预测结果可知:随着2020年国庆假期之后的新冠疫情的全国范围内小幅度爆发,2020年11月和12月份有所减少,月航班总量预计为30万架次左右;2022年1月后的未来4个月我国月航班总量会维持在40万架次。

4.5 预测结果误差分析

对总量、国际、国内和客货航班进行预测,选取总航班量对模型预测误差进行分析,经过神经网络的23次的迭代,将未来航班量进行预测,其中存在预测误差,最佳的验证集在第17次迭代时出现,此时模型平均误差最小为415423915.9959,训练集、验证集和测试集平均误差如图11所示。

图11 训练集、验证集、测试集平均误差

同时把神经网路输出值和实际值放入一个图中能表现出模型的训练集验、证集以与实际航班量之间的误差,反映出模型建立是否得当,具体误差分布如图12所示。

图12 预测误差分布图

从误差图中可知:在46组数据中,该模型出现3次输出与实际误差较大情况,43组输出误差与实际值基本一致。

5 结论

以突发公共事件作为航空运行的外界干扰,构建基于ABI机制的突发事件下的飞行量预测特性,利用SPSS数据分析技术确定了突发公共事件与起降架次变化的关联性,运用Matlab神经网络的数据训练和计算,建立了非线性飞行量预测改善模型。以2020疫情防控与国内外运输航班量作为给定的输入值,通过疫情与航班变化规律的关联性训练,学习运输航班受境内外疫情防控的约束限制规则,将各种约束条件设定为隐藏层的神经单元,模拟一定程度内的任意复杂非线性映射的计算搜索技术,得到最接近期望输出值的未来飞行量预测结果。

本文建立的飞行量预测模型和算法充分考虑了外界因素的干扰,通过调整输入对象和对应的隐含条件,上述方法也适用于低空通航飞行量的需求预测。由于篇幅和取材限制,本文只选取了国内疫情的数据作为独立变量参与相关性分析,并未完全统计国外疫情的相关数据。因此,在选取样本期间呈单调递减趋势,斯皮尔曼相关系数为正相关,相关性分析存在一定的偏差。