APP下载

基于深度学习的机场能见度预测研究

2021-12-02千月欣王永忠李佳骏徐天羿

关键词:能见度卷积神经网络

千月欣,王永忠,李佳骏,徐天羿

(中国民用航空飞行学院 空中交通管理学院,四川 广汉618307)

1 研究背景及现状

1.1 研究背景及意义

社会经济的快速发展往往伴随着人们对生活的高质量追求.在交通运输方面,安全、经济、高效、便利一直是行业发展的主旨,然而,一些运输如高速公路运输、航海运输和航空运输的运行常受到自然环境的影响.大雾是一种主要因空中悬浮的大量水滴导致的能见度降低的恶劣天气,在低能见度条件下运行常会导致一系列不必要的损失.研究机场能见度,预测大雾发展趋势,提前对强雾天气进行预报对机场运行安全、提高航空效率具有重大的意义.

当前对雾的研究主要包括卫星监测[1]、数值预报、雷达监测[2]3个方面,基本上都是以“监测+气象学知识分析”的形式来进行预测.卫星和雷达监测都是通过反馈出来的云层信息与气象学原理结合的方式实现,但由于云层信息易受噪声干扰,气象条件自身具有不确定性等特点,在一定条件下,大雾监测能力大大降低.数值预报[3]是一种数值方程与气象学原理结合来实现雾天气预测的方法.使用数值预报方法一方面在计算过程中会产生大量时间成本,另一方面预报受限于气象员的经验判断,结果具有很大的不确定性.所以,无论是使用卫星、雷达监测还是数值预报方法,都需要考虑多种因素,加上雾的产生和消散过程复杂多变,对雾的预测存在很大的不稳定性.

另外,从2012年Alex和Hinton在ILSVRC比赛中以Alexnet夺得冠军后[4],深度学习再次引起社会各界研究高潮.深度学习算法[5-6]是一种基于样本数据进行训练学习的方法,通过对训练数据的训练不仅能学习出数据的内在规律和表示层次,还能准确的对未知数据进行预测,具有良好的泛化性.借于深度学习方法的这一优点,在气象领域对雷电、暴风、降水等强对流天气预测中也有应用.使用深度学习方法[7-8]一是可以减少预测雾所需的计算时间,二是可以减少观测中问题错误率,实现人工智能预测.但是目前对雾的预测上采用深度学习方法的研究却很少,大部分是以实况场要素为基础对本时刻大雾进行研究和预报.

1.2 国内外研究现状

近年来,气象学者针对能见度预测问题的探索繁多,越来越多的学者把焦点放在人工智能检测技术上.例如国内学者徐锦涛[9]等通过图像来对能见度进行测量.张琼雄[10]等针对当前日间气象能见度观测手段和方法,提出使用视频监控实现能见度测量的想法,同时设计出基于神经网络的能见度检测算法,获得了与前向散射能见度仪相近的测量效果,可以有效测量气象能见度.郑显明[11]等提出了一种大气红外能见度的计算与测量方法,并研制了一套大气红外能见度测量仪器.郄岩[12]对雾天能见度的预测方法进行了研究,尝试使用了多元回归模型、天气图分析、图像预测等方法,建立BP神经网络能见度预测模型,基于遗传算法对各网络层参数进行优化调整.

文献[13]中使用自适应神经模糊推理系统,对印度德里大雾期间能见度的可预测性进行估计.还有很多学者选取少量视频、截取图像中的某些固有特征[14-15],或基于Koschmieder定律[16-17]对能见度进行估计.Mondal[18]提出了一种湿实验室算法,通过DNA原理计算并预测辐射雾下的能见度.印度学者Debashree Dutta[19]使用人工神经网络(ANN)模型对印度加尔各答机场雾霾期间的空间能见度进行预报,并使用决策树算法确定影响雾能见度的主要参数.Goswami S等[20]尝试使用自适应的神经模糊推理系统(ANFIS)估计印度德里机场在雾期间能见度的可预测性.作者从评估模糊隶属关系开始,将数据分类到不同范围.把模糊隶属度的输出变量用作人工神经网络的多层感知器模型的输入.在这种混合计算系统中,使用2000年至2010年的数据对ANFIS进行了训练,估计德里机场大雾期间能见度的可预测性.Han等[21]将地面观测气象要素的时间序列数据转换为2D图像格式,然后训练一个简单的卷积神经网络来预测短时雾.Jianping Z[22]采用2011—2016年合肥地区高时空分辨率的能见度观测数据,分析能见度空间分布特征及大雾生消过程中的能见度变化特点.

2 数据来源及预处理

2.1 数据来源

本文基于机场摄像头实时传来的视频图像,通过图像处理、边缘检测、对比分析后计算当前机场能见度,并使用深度学习理论对历史大雾数据进行学习训练后,掌握大雾发展规律,对未来短时能见度变化趋势进行预测.

机场视频数据和能见度数据要满足以下要求:

1) 视频数据与能见度数据所反映的时间、地点要一一对应;

2) 机场视频要连续,以便准确地截取一段时间间隔的连续机场图像;

3) 无论是视频还是能见度数据,数据量要大,能满足实验要求.

为在能高效探索出能见度预测方法的同时降低研究难度.本文选用“华为杯”第十七届中国研究生数学建模竞赛E题中给出的数据,选择“机场视频2”和“机场AMOS观测”2个文件中的数据作为初始数据.其中“机场视频2”中提供的是2020年3月13日00∶00∶00—11∶47∶48某机场受大雾影响下的跑道实时连续视频.“机场AMOS观测”中包含此摄像头下的跑道每间隔 15 S 的风向、风速、VIS、RVR、MOC、灯光等数据.

2.2 数据预处理

截取该机场大雾条件下此摄像头下的一段视频作为初始数据,并收集同时间段的机场能见度数据,包括跑道视程(RVR)、气象光学视程(MOR)、主导能见度(VIS)、光照强度、风、温度、湿度等.为了便于分析,需要把视频按帧截取图像,设定 15 S 采集一张,与能见度数据频数相对应.通过计算机逐帧截取,截取到01∶30∶00—07∶30∶00这一时间段内每 15 s 一张,共 1 438 张视频图像.

3 模型筛选及建立

3.1 模型筛选

一方面,对图像中表现出来的能见度进行预测,实际上就是对其所含物体进行识别.在相同的目标识别方法下,能见度越高,目标识别率越大;反之则反.另一方面,只有把图像目标识别精确度达到最大,才能使能见度预测值的阈值达到最小,从而达到能见度可预测范围最大化的目的.所以,模型筛选是能见度预测的重中之重,一般可从预测准确度和运行时间(效率)2个角度来衡量模型好坏.

在深度学习系统中,有Alexnet、VGGnet、Resnet、Squeezenet、Darknet等不同网络,在不同领域都发挥了重要作用.本文选择深度学习的目的主要是通过对已剪裁视频图像的学习,包括图像视觉特征(颜色、形状、纹理等)和统计特征(直方图、频谱等),结合实时能见度数据,进行图像拟合,实现对未来短时间能见度的预测.

文中选择使用深度卷积神经网络[23].轻量化卷积神经网络主要通过对卷积方式的改变来使网络参数减少的同时保证其性能[24],大大提高了网络的计算效率.

表1所展示的是使用6种深度神经网络对同一组视频数据做出的目标识别效果对比表,包括其网络深度、运行时间和精确度.其中,Darknet-53和Squeezenet网络的目标识别精确度最高,均达到了87.02%.但是考虑到模型深度和运行速度,Squeezenet以Darknet-53网络约1/3的网络层数和约1/5的运行时间达到了与其同样的精度,Squeezenet模型的识别效果明显更优.

表1 不同神经网络下的图像目标识别效果对比表

3.2 Squeezenet迁移学习模型理论介绍

2016年由伯克利和斯坦福一起研究完成的Squeezenet网络[25]是一种轻量又高效的CNN模型,参数少,模型性能高.与大模型相比有很多优势:

1) 数据训练为分布式排布,使网络通信量大大减少;

2) 模型小,使客户端程序的更新变得更加方便;

3) 有利于部署在特定硬件如FPGA上.

Squeezenet网络的卷积方式与传统方法不同,关键在于其提出了Fire module.每个Fire模块包含squeeze层和expand层2部分:squeeze层采用1×1卷积核,并且卷积核数要少于上一层feature map数;expand层混合使用1×1和3×3卷积核.这2层各自带上Relu激活层,在expand层后将1×1和3×3卷积输出的feature map在channel维度拼接起来.

迁移学习[26]是2005年由杨强提出的一种基于大数据知识和方法在各领域泛化应用的理论.它可以利用数据、任务或模型之间的相似性,将旧领域已学到的知识或模型应用到新的领域.深度迁移学习是深度学习和迁移学习的融合体,把深度学习的强数据拟合能力、强特征表达的学习能力与迁移学习对领域无关的特征表达的学习能力相结合,可同时利用两者的优势[27].在这里可以通过使用Squeezeset网络迁移学习模型把图像特征学习与能见度数据训练学习结合在一起建立关系,以便实现用视频图像直接预测能见度变化趋势的目的.

3.3 15层深度神经网络介绍

15层深度卷积神经网络是在充分借鉴已有的Squeezenet、Alexnet、VGG、GoogLenet、Resnet等网络后,根据本文所选数据的特征,自建的一种兼备性能和效率2方面的网络模型.之所以将网络层数定为15层,是因为在神经网络中,网络性能随着网络深度的增加虽会大大提高,但同时存在效率问题[28],若要使这2方面得到平衡,就需要设计合适的网络层数.

在15层网络中,图像输入后用卷积做降维处理,之后进行批量归一化处理,同时引入ReLU非线性激活.最大池化后重复进行卷积,归一化处理.随着操作的重复,维度下降,通道增加,最后使用全连接来实现图像分类后输出.表2中详细说明了15层深度卷积神经网络每一步的运行作用.

表2 15层深度卷积神经网络运行作用说明表

3.4 建模及实验结果

为更好地构建模型,得到更优的结果,把预处理过程中得到的1 438张截屏图像和对应时间段的能见度数据选择前70%作为训练样本,剩下的15%作为测试样本,15%作为验证样本.分别使用上述的2种深度神经网络模型,设x轴为截屏图像,y轴为同时间点能见度,在计算机软件中,用训练样本进行图像拟合.之后再使用剩下的样本完成测试和验证.可以得到如下图1~4所示的训练结果图.

图1 Squeezenet网络迁移学习模型训练RMSE图

图2 Squeezenet网络迁移学习模型训练损失函数图

图3 15层深度卷积神经网络训练RMSE图

图4是使用Squeezenet网络迁移学习模型和15层深度卷积神经网络模型的训练结果.图中,蓝红浅实线分别代表的是训练样本在迭代过程中的RMSE和损失值,深实线则为平滑化处理后的对应值.黑色虚线为用剩余15%验证样本数据运行的变化状况.把在模型中预测出来的能见度值与样本真实能见度值对比,最终得到15层深度卷积神经网络模型预测准确率达到89.7% ,而Squeezenet网络迁移学习模型的准确率只在70%左右.

图4 15层深度卷积神经网络训练损失函数图

另外,Squeezenet网络迁移学习模型训练曲线波动大,一定程度上说明该模型在能见度预测上具有很大的不确定性.相比之下,15层深度神经网络模型更具有优势,它能在使用较少的迭代次数后得到更为稳定准确的预测效果.

除此之外,比较2种深度神经网络模型在本文使用中的优劣,使用RMSE指标来进行衡量.RMSE指均方根误差,对于广泛的值,可定义为:

在这里用来评价深度神经网络模型的好坏.一般上,当RMSE<180时,可认为模型好;若RMSE值比较高,意味着需要更改模型的功能或调整参数.本文经过实验得到Squeezenet网络迁移学习模型的RMSE值为229.74,在15层深度卷积神经网络中,RMSE=85.012.显而易见,15层深度卷积神经网络模型更适合本文中对能见度的预测.

4 结论与分析

4.1 结论

在不考虑多摄像头角度,外界干扰(水滴、冰晶),参照物参数(大小、颜色、形状),光照强度等因素影响的基础上,对样本视频和数据进行筛选处理后,使用Squeezenet迁移学习模型和15层深度卷积神经网络2种模型分别进行数据训练,完成了数据与视频的关系对应,同时对未来短时能见度的预测进行了验证.通过实验结果对比,从模型上来说,15层深度卷积神经网络的RMSE值为85.012,远远小于Squeezenet网络迁移学习模型中的229.74,意味着15层深度卷积神经网络模型更加稳定.从能见度预测效果来看,使用同样的样本数据,Squeezenet迁移学习模型的能见度预测准确率在70%左右,而15层深度卷积神经网络模型的预测准确率可达89.7%,比Squeezenet迁移学习模型的准确率高近20%.综上所述,15层深度卷积神经网络模型的预测能见度效果更佳.另外,在实验中发现,当雾大于一定值时,摄像头中显示的是一张白色无像图,不能对视野内的实物进行识别和监测.只有当雾的浓度降到一定阈值以下,摄像头才能捕捉到可供参照的实物画面,通过对参照实物的清晰度判断进而推测能见度大小.

4.2 误差来源分析

在现有机场能见度预测研究中,几乎没有100%的预测准确性.总的来说,产生预测误差的来源主要有以下几个方面:①因机器或仪表不精确产生的误差;②因气象、环境变化造成的误差;③人为因素造成的误差;④预测方法或模型本身可能存在的误差.

使用15层深度卷积神经网络还存在10%左右的误差,分析其误差来源可能是:

1) 摄像头可能受外界环境(大气温度、湿度、水滴等)影响,获得的视频图像本身不清晰;

2) 所截取的样本数据基本处于夜间,没有充分考虑到光照强度对机器学习产生的影响;

3) 所选视频来源单一,使参照物受到限制,所以也没有充分考虑参照物形状、大小、颜色等因素对机器学习产生的影响;

4) 所选用的深度神经网络模型本身就存在性能与效率之间的矛盾,在追求运行效率的同时可能对能见度预测的结果产生影响;

5) 视频中截取到某些高浓度雾下的白色无像图,由于无法对图片进行识别检测,可能会影响能见度的预测准确度.

5 结语

本文从摄像头视角出发,截取大雾气象条件下的机场视频进行定时截图,获得具有时间序列特征的一系列图像.之后从运行速度和预测准确度两个衡量标准出发,尝试使用多种深度神经网络进行模型筛选,在6种网络中选出最优模型Squeezenet网络.然后根据所选数据特征和神经网络特性,自建兼备性能和效率的15层深度卷积神经网络.最后分别使用这2种方法对已有的实时图像和机场同时间段能见度数据进行训练,获得其两者之间按时间变化的对应关系,进而预测机场未来短时能见度的变化趋势.经过模型测试及验证后,我们得到15层深度卷积神经网络模型的稳定性最好,能见度预测准确度最高的结论,其准确率达到89.7%,比Squeezenet网络迁移学习模型的准确度高约20%.此外,在实验中发现:当雾的浓度大于一定阈值时,截取到的是一张白色无像图,无法对图片进行识别检测,影响了能见度的预测准确度.

机场能见度预测对保证航空安全,提高机场运行效率起着举足轻重的作用,尤其是在新技术的支持下实现更高精度和更便捷的能见度预测意义更为非凡.本课题着重实现机场摄像头中实时图像与实际能见度的相互转换,以便便捷快速地得到机场能见度数据.为达到更高的预测精度,后续还要做更深层次地探索,把各种气象要素(温度、压强、湿度、风、云等)、外界干扰(水滴、冰晶等)、参照物特征(形状、大小、颜色等)及光照强度等因素充分考虑到图像能见度预测中.

猜你喜欢

能见度卷积神经网络
基于全卷积神经网络的猪背膘厚快速准确测定
基于神经网络的船舶电力系统故障诊断方法
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
能见度与NOx、NO2日变化关系分析研究
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
浅析常州市PM2.5对能见度干扰