APP下载

一种新型航班延误组合预测模型

2011-11-27丁建立李华峰

中国民航大学学报 2011年3期
关键词:检测器航班危险

丁建立 ,李华峰 ,3

(1.中国民航大学计算机科学与技术学院,天津 300300;2.中国民航大学天津市智能信号与图像处理重点实验室,天津 300300;3.唐山师范学院计算机系,河北 唐山 063000)

如何建立准确的航班延误模型一直是世界民航业的重大课题,而解决这一问题的关键是如何准确的预测不同时段的航班延误的数量,也就是如何有效的利用相关的数据信息去预测未来的延误情况,由于航班在飞行时,天气等相关条件都会有相当大的影响,而且近年来中国民航的运输量得到了极为迅速的增长,航班延误对整个民航运输业的发展的制约问题已经极为明显。

目前,针对航班延误的预测模型问题已经引起了世界各国的极大注意,研究的学者们已经将很多方法用于航班延误的预测中,如免疫算法,马尔科夫过程,贝叶斯网络等,这些预测模型各有优缺点和自己的适应条件。一些研究通过对各种不同的情况进行对比发现,这些单一的预测模型并不能在所有的情况下都取得较好的预测精度。所以应用单一模型对复杂的延误问题进行处理,显然有些力不从心。若采用多个不同的预测模型并加以适当的有效组合,或多个变量的科学综合,则可以充分地利用各种信息达到提高预测精度的目的。

本文基于组合预测模型的思想,针对不同的情况,组合模型执行选择了灰度预测和免疫算法两种预测方法进行组合预测,该模型的最后结果将所有参与预测的模型结果进行加权,权值的选取直接影响在组合模型的预测精度,本文采用动态改变权值的方法。

1 基于危险模式的航班延误免疫识别算法

1.1 模型中符号的定义

危险模式理论和传统理论的根本区别是免疫应答的触发信号不同。在使用危险模式对机场航班延误进行预测,本文定义了三种抗原识别信号[1]:

危险信号(SignalA):当待检测的抗原航班为延误航班时,该信号被激活。

协同刺激信号(SignalB):当检测的抗体航班的累积延误率超过阈值时,该信号被激活。

抗原活化信号(SignalC):当危险信号和协同刺激信号同时激活时,该信号被激活,对应的抗体航班完善,进入记忆检测器。

危险模式机场航班延误预测模型的信息集合:

整个机场的航班可以抽象为一个集合U,U={u|u=<flight-no,t-a,t-p> |flight-no是航班号,t-a为该航班的实际离港时间,t-p为航班的计划离港时间}。

待检测航班的信息集合即抗原A。

检测器集 D={<flight-no,age,d-count,ratio>|flight-no为航班号,age是检测器的年龄,d-count为延误匹配数,ratio为累积延误率}。而D=M∪R,其中R={x|x∈D,x.ratio>θ}为记忆检测器,它有无限的生命周期,θ是延误率阈值。M是成熟检测器,其由不与自体匹配且延误率未超过延误率阈值的免疫细胞组成[2]。

1.2 航班延误抗原识别算法

基于危险模式免疫算法的航班抗体检测的主要思想就是首先检测抗原航班是否在“延误危险区域”中,并送入训练集中对抗体进行训练。当被训练抗体超过一定阈值时,该抗体完善。其中“延误危险区域”的划分是由是否所有满足(at-a-xt-p>=t)的航班确定的[3]。

初始化阶段,在这个阶段要建立一个初始的延误识别集,根据先前的航班记录取一定数量的数据经过编码和预处理后,形成一个最初的抗体集抗体耐受。

运行阶段,在这个阶段要通过对新的航班抗原进行分类处理。

步骤1:读取航班(抗原)信息。初始SignalA,SignalB,SignalC 为 false;

步骤2:针对该航班(抗原)是否处于延误区域,如果为真,则危险信号SignalA=true,否则,危险信号SignalA=false;

步骤3:输入检测器集,与抗体群体中的所有抗体进行抗原匹配,如果与其中抗体匹配,则该抗体ratio++;

步骤4:对应抗体age++;

步骤5:该抗体亲和力是否达到阈值,如果亲和力达到阈值,则协同刺激信号SignalB=true,否则协同刺激信号SignalB=false;

步骤6:抗原活化信号SignalC=SignalA∩SignalB,如果SignalC=true,则确定该危险数据抗原,将该抗体加入到记忆检测器中,并产生免疫应答;

步骤7:更新危险抗体数据库。

1.3 航班数据预处理

按照非平稳时间序列分析模型的特征,数据序列一般由趋势数据、周期数据、随机数据组成,变化趋势分析很难反映出数据序列的周期性和随机性变化;用该模型对机场航班进行逐时段预测时,将随机性较大的数据除去,其中包括去除临时航班的数据、货机数据、有政治要员的航班、出现临时恶劣天气所影响的相关航班的数据、每个月飞行任务少于10次的航班数据,这样更有利于航班延误规律性的体现[4]。

1.4 机场航班抗原算法实现

记忆检测器和成熟检测器算法如图1和图2所示。

图1 记忆检测器算法Fig.1 Algorithm of memory detector

图2 成熟检测器算法Fig.2 Algorithm of mature detector

2 包络灰预测方法

2.1 包络灰预测概述

灰预测是20世纪80年代发展起来的一门新学科,由于其理论简洁、不涉及具体模型,仅对数据进行处理,因而适用面广,已被成功地应用到经济、社会、工程等领域。灰预测能用表示系统行为特征的、较少的、离散的原始数据序列作生成变换后建立灰模型,用微分方程描述的灰模型能较完整地描述被研究对象的运行行为,揭示系统内部事物的连续发展变化过程。

2.2 包络灰预测模型

设有原始数列

经过级比可建立GM(1,1)模型。作一阶累加生成数列

式中:a、u为待定参数,将式(1)离散化即得矩阵形式:Y=BA。式中

用最小二乘法求解灰参数A

则微分方程(1)的解为

2.3 灰预测法预测航班延误模型的预测步骤

通过某一时段航班延误的数量曲线做出x序列:

步骤1:做出序列x的上下包络线。对序列x曲线做上下包络轮廓曲线。以国内某大型机场7日内13:00~14:00时段航班延误数据为例,如图3所示。

步骤2:作等间隔上、下包络序列。在上、下包络线上等间隔选取数据,对于上包络,必须包括的峰点(不必是所有峰点);对于下包络,必须包括的谷点(不必是所有谷点)。这样就可得到上包络序列

下包络序列为

步骤 3:对上、下包络序列作 GM(1,1)建模并预测。按照GM(1,1)模型的建模计算步骤,建立上包络序列u、下包络序列的GM(1,1)模型,经检验合格后,做出上、下包络序列的预测值,进而得到原始序列的灰色预测区间。

步骤4:对原始序列X建模并预测。建立原始序列GM(1,1)模型,经检验合格后,计算原始序列预测值。

步骤5:对包络中轴建模并预测。包络中轴指包络区内的中心所联的轴线。其序列可按下式计算建立序列的GM(1,1)模型,经检验合格后,计算包络区中轴序列的预测值。

步骤6:预报。总结包络灰预测的预测区间、原始序列的预测值、包络区中轴序列的预测值,检验其是否可用[5]。

3 组合预测模型

3.1 组合预测

组合预测方法就是先利用两种或以上不同的预测方法对同一预测对象进行预测,组合预测方法是对同一个问题,采用两种以上不同预测方法的预测。实践中更多的则是利用定性方法与定量方法的组合。组合的主要目的是综合利用各种方法所提供的信息,尽可能地提高预测精度。因此,本文尝试采用均方误差确定加权系数,将这两种方法进行加权组合,求得最终的下一个时段的延误航班数值[6]。

3.2 加权系数的确定及预测结果计算

对第t+1时段进行预测,首先,计算每种方法在每个时段的预测值和在该时段内的实际值之间的均方误差 MSE(t)(t=1,2,…,30)

由式(7)可得,危险模式预测方法的加权系数为

灰预测方法的加权系数为

最终预测结果即为

其中:fdm(t)为危险模式预测的第t时段延误的航班数;fgm(t)为灰预测方法预测的第t时段延误的航班数。

4 仿真实验结果

表1和表2的实验数据来自国内某大型机场夏秋航班的运行数据。首先依据机场从前20天航班的运行数据可得航班免疫检测的成熟检测器和记忆检测器,然后用后20天航班的数据去训练检测细胞,动态调整检测集,以适应时间的变化。随机选择与训练检测器所用的数据日期较接近的机场某一天的航班状态进行预测。

表1 训练后的成熟检测集合Tab.1 Collection of mature detector after training

表2 训练后的记忆检测集合Tab.2 Collection of memory detector after training

计算均方误差的结果是MSEdm=0.330633,MSEgm=0.669366。

计划航班进行组合预测的预测结果如图4所示。图4中,横轴共表示15个时间段,即07:00~08:00……21:00~22:00;纵轴表示在某个时间段内延误的航班数值。由图4可以看出组合预测有较好的预测结果。能够及时地反映出延误的趋势。

5 结语

近年来,航班延误的分析和预测是一个非常重要的问题。由于危险模式和灰预测模型在对一些问题的预测上有其各自相对的优势,但其对于复杂的、不稳定的时间序列都不是最优的模型。本文利用这两种模型形成组合预测模型。通过实证研究表明了预测模型在预测上的有效性,能总体把握航班延误的趋势,达到更准确地对航班延误进行预测的目的,验证了组合模型比单一模型的预测结果更合理、更可靠,该预测模型是一种有效的航班延误时间序列预测模型。

[1]MATZINGER P.The danger model:A renewed sense of self[J].Science,2002,296:301-305

[2]DING JIANLI,TONG GUANSHENG.Real-time Sub-time Early Warning of Airport Scheduled Flight Delay Base on Immune Algorithm[C]//Los Alamitos:IEEEComputerSociety,2008:430-435.

[3]TU YUFENG,MICHAEL O BALL,WOLFGANG S.Estimating flight departure delay distributions a statistical approach with long-term trend and short term pattern[J].Journal of the Amerian Statistical Association,2008,103(481):112-125.

[4]CAO WEI-DONG,DING JIAN-LI,LIU YU-JIE.Analysis of flight departure delay and warning based on Bayesian networks[J].Application Research of Computers,2008,25(11):3388-3390.

[5]DENG J L.The law of grey cause and white effect in GM (1,1)[J].The Journal of Grey System,1999,11(3):257-262.

[6]HUANG YUE,ZHU LI-PING,ZHANG WEI.From clone selection to danger model[J].Acta Academiae Medicinae Sinicae,2002,296;301-305.

猜你喜欢

检测器航班危险
全美航班短暂停飞
山航红色定制航班
山航红色定制航班
山航红色定制航班
基于二次否定剪切选择的入侵检测方法*
喝水也会有危险
车道微波车辆检测器的应用
一种柱状金属物质量检测器的研究
口腔综合治疗台水路回吸检测器的研制与应用
拥挤的危险(三)