APP下载

基于深度学习的天气雷达异常数据识别技术

2023-11-27雁3施丽娟孙康远

应用气象学报 2023年6期
关键词:降水天气准确率

张 林 吴 蕾 李 峰 李 雁3) 施丽娟 孙康远

1)(中国气象局气象探测中心, 北京 100081 )

2)(南京气象科技创新研究院 中国气象局交通气象重点实验室, 南京 210041)

3)(中国气象科学研究院, 北京 100081)

引 言

天气雷达异常数据包括硬件故障、电磁干扰等。硬件故障通常包括发射机、接收机和伺服系统等故障,电磁干扰是指雷达信号处理器异常、或信号受到外部同频干扰时观测到的非气象回波。

天气雷达观测数据质量是天气雷达数据应用的基础,只有对天气雷达观测数据进行有效的质量控制,才能保障天气雷达观测数据的可靠性,满足各种业务应用需求,为改进预报方法提供科学依据[1]。天气雷达观测的非气象回波包括地物/超折射、电磁干扰、故障、海浪和晴空等。业务中针对非气象回波的识别,包括基于模糊逻辑法的多普勒天气雷达非气象回波识别,如故障数据识别[1-2]、地物/超折射回波[3-6]、电磁干扰回波[7]、海浪回波识别[8]、晴空回波识别[9-12]、速度场数据质量控制[13-14]等,以及基于偏振参量的双偏振雷达非气象回波识别[15-22]。

实时业务检验中发现,因雷达故障导致的异常数据通常无规律可循,模糊逻辑算法漏判率相当高。基数据中的异常数据直接影响气象回波数据的可靠性,影响预报员分析和判断天气系统的发生发展。中国气象局气象探测中心业务中增加人工值班对雷达产品的实时监控,一旦发现因硬件故障或电磁干扰等异常数据生产的“雷达坏图”,立即经过人工勘误环节消除异常数据,确保高质量、可靠的数据输出,这是实时监控业务的重要工作内容之一。

深度学习作为一种人工智能算法,需要从大量历史数据中学习规律[23]。相比传统预测算法,处理非线性问题时效果更理想。深度学习网络模型学习能力的增强有效推动其在气象领域的广泛应用[24-28],在雷达数据分析方面也取得了一系列成果,如雷达数据质量控制、雷达定量降水估测、雷达回波外推方面等。尹晓燕等[23]利用深度学习算法对雷达遮挡区域进行填充,有效提升了雷达数据质量。Nawal等[29]将人工智能方法应用于天气雷达数据质量控制中,实现地物杂波滤除并提高了定量估测降水准确率。皇甫江等[30]将双偏振雷达低仰角3个参量(ZH,ZDR和KDP)作为输入因子,利用深度学习算法构建定量降水估测模型,取得较好效果。

本研究以雷达观测中的故障、电磁干扰等异常数据为研究对象,构建卷积神经网络、图像语义分割网络两种模型架构,分别训练R-ResNet和R-LinkNet两种模型,应用于单站雷达异常数据检测与识别,不仅可以从基数据端直接消除故障等异常数据,提高天气雷达网观测数据质量,还能降低人工勘误环节的工作量。

1 天气雷达异常数据分类

2020年全国布网运行的天气雷达观测数据质量评估表明:天气雷达数据质量问题主要有电磁干扰、地物回波、设备故障导致的错误数据、标定异常引起的回波偏强或偏弱4类。在所有数据质量问题中,电磁干扰出现的频次最多,占91.9%,地物回波占比5.6%,设备故障和标定异常分别占2.3%和0.2%(图1)。通过业务集成多种算法后,可较好地滤除大多数地物回波和径向电磁干扰回波[3]。但一些螺旋状或径向分布较宽的电磁干扰以及设备故障或标定异常等引起的异常数据,因通常无规律可循,采用传统气象方法难以识别。

图1 2020年全国布网运行天气雷达数据质量问题占比Fig.1 Proportion of weather radar data quality problems in China in 2020

全国天气雷达观测数据质量评估分析了各种型号天气雷达异常数据占比。CINRAD/SA型号和CINRAD/CC型号天气雷达电磁干扰问题较为明显,占比分别为37.2%和37.0%(图2,时间为北京时,下同)。设备故障会导致错误数据输出,标定不准确反映在雷达基数据导致回波偏强或偏弱,CINRAD/SA型号和CINRAD/SC型号雷达设备故障或标定问题引起的异常数据较为常见,占比分别为41.45%和32.17%(图3)。

图2 全国各型号天气雷达电磁干扰占比及个例 (a)各型号天气雷达电磁干扰占比,(b)2022年7月16日01:25:58山东滨州雷达电磁干扰(相邻距离圈间隔为50 km,下同)Fig.2 Proportion of electromagnetic interference of various types of weather radar(a)proportion of electromagnetic interference,(b)a case of electromagnetic interference of Binzhou radar in Shandong at 012558 BT 16 Jul 2022(the distance between adjacent rings is 50 km,similarly hereinafter)

图3 全国各型号天气雷达设备故障、标定异常数据占比及个例(a)各型号天气雷达设备故障、标定异常数据占比,(b)2022年4月11日11:21:10新疆图木舒克雷达异常数据Fig.3 Percentage of abnormal data of equipment failure and calibration of various types of weather radar in China(a)proportion of abnormal data of equipment failure and calibration,(b)a case of abnormal data of Tumxuk radar in Xinjiang at 112110 BT 11 Apr 2022

全国天气雷达观测数据中,设备故障和标定异常数据均不可用,统一称为故障数据。宽电磁干扰数据与故障数据为本研究深度学习算法重点解决的问题,根据其在雷达图像中的表现特征分为两类:一类是大面积故障异常、分布在整幅雷达图像中,称为第1类异常数据;另一类仅体现在雷达图像的局部即仅在固定位置出现,称为第2类异常数据。

2 数据与方法

2.1 第1类异常数据

针对第1类异常数据,收集2020年1月—2022年12月全国各雷达站点的典型宽电磁干扰图像(1381张)、故障数据图像(508张)及正常降水图像(2850张)(雷达图像均为png格式)。第1类异常数据图像与正常降水图像特征明显不同,对每张图像设置标签数据,正常降水图像标签为0,电磁干扰图像标签为1,故障数据图像标签为2。通过构建卷积神经网络模型训练学习,并随机划分数据集中90%为训练集,10%为测试集。

2.2 第2类异常数据

第2类异常数据可与降水混在同一张图中,因此需要在图像中按像素标记正常数据和异常数据,而不是每张图像设置标签。标记方法根据专家经验和雨量站数据进行核实,无回波数据标记为0,异常数据标记为1,降水数据标记为2。对2022年7月1—31日黑龙江黑瞎子岛雷达观测图像进行标记,共6622对原始图像与标签数据(均为png格式)。通过构建图像语义分割模型进行训练学习,并随机划分数据中90%为训练集,10%为测试集。

图4为2022年7月20日08:15:02黑瞎子岛雷达观测原始图像与标签数据。

图4 第2类异常数据原始图像与标签数据(a)2022年7月20日08:15:02黑龙江黑瞎子岛雷达观测图像,(b)标签数据Fig.4 Observation image and label data of the second kind of abnormal data(a)observation image of Heixiazi Island radar in Heilongjiang at 081502 BT 20 Jul 2022,(b)label data

2.3 数据集

本研究中,第1类异常数据共1889张图像,第2类异常数据共6622对图像。

但训练集样本无法包含实时业务中的所有情况,可利用深度学习中的数据增强技术(图像翻转、平移)扩充样本量,使模型能更加兼容实时业务中的各种样本。

2.4 方 法

2010年邵楠等[2]提出基于图像处理技术的异常回波自动识别,通过提取异常回波特征,引入迭代学习器自动判别异常产品,该方法也是一种计算机智能识别方法。随着人工智能技术的飞跃发展,可将更精准、更高效的智能模型用于异常数据识别,为业务带来正贡献。

人们利用传统方法尝试识别雷达硬件异常数据,并取得一定成效。赵瑞金等[1]基于模糊逻辑法自动识别硬件故障导致错误数据,通过提取故障异常数据不同于降水回波的特征量,对这些特征赋于相同权重,得到表明每个距离库中受故障异常影响可能性的量化数值,最终识别出错误数据,评估后总体识别率达到90%以上。但传统方法存在两方面缺点:①特征量和阈值选取存在局限性。虽然故障异常数据与降水回波存在较大差异,但当特征量提取不恰当或阈值选取不合适时,会造成对降水回波的误判或对异常数据的漏判。②缺乏足够的样本量作为数据支撑。模糊逻辑法统计数据过程中需要大量样本以确定各特征参量的隶属函数,但样本量有限,不足以覆盖业务中所有情况。

基于深度学习的算法能有效克服传统模糊逻辑算法的局限性,一方面可人工制作较多样本,再利用数据增强技术将样本量扩充至数万量级;另一方面,深度学习构建的模型中具有上千万个可训练参数,包括权重、偏置等,这些参数基于输入样本和目标值进行学习,有助于模型更好地拟合训练集。深度学习算法能够进行各特征间复杂关系的学习,对样本具有超强的学习和泛化能力,可兼容业务中各种样本。即便遇到新样本模型未能准确识别,也可将新样本重新置入训练集再次训练后更新权重,以提高模型对新样本的认识能力[31-32]。

深度学习的迁移学习技术指将一个在已有大型数据集预训练的模型迁移至目标数据集进行训练和微调[33]。本研究采用基于大型数据集ImageNet的ResNet预训练模型,训练后的ResNet50模型在ImageNet验证集的准确率可达92.1%[34]。利用迁移学习技术可将该模型应用于雷达图像分类,通过训练和微调后达到较高准确率,在业务中发挥重要作用。

3 模型构建

3.1 ResNet简介

2015年ResNet的发明不仅影响了学术界深度学习的发展方向,而且在图像检测、图像分割和图像识别等领域获得广泛应用[34-36]。

ResNet基本原理是通过设计多个残差模块结构,该结构不仅能解决神经网络中出现的退化、梯度消失和梯度爆炸问题,训练深层神经网络,加速模型收敛,提高整个模型的表达能力和性能;而且使用该结构可以保留原始特征,使模型学习更加顺畅和稳定,进一步提高模型的精度和泛化能力,在ImageNet数据集上获得了良好的分类结果。

3.2 R-ResNet的异常数据识别模型

ResNet轻巧且分类准确,受到人们青睐。根据层数分类,常用的有ResNet18,ResNet50,ResNet101等。本文在ResNet50模型基础上,通过迁移学习、微调等方式提高模型对第1类异常数据的适应能力,并改进权重参数初始方案,设计了R-ResNet雷达异常数据识别模型。具体步骤如下:①划分第1类异常数据的训练集和测试集。②搭建ResNet50模型,基于第1类异常数据进行训练,得到模型权重参数等。③将训练后的模型及权重应用于业务对实时数据进行勘误、识别。④对模型实时的勘误结果进行人工检验,若正常数据被勘误为异常,或异常数据被勘误为正常,则该数据勘误错误,将其重新打标记后置入训练集中再次训练,更新模型权重,再应用于实时业务,达到训练、勘误、检验、训练的闭环链路,不断提高模型识别异常数据的准确率。

3.3 LinkNet简介

现有主流的语义分割技术(如Unet等)主要使用池化索引或全卷积恢复丢失的空间信息,但这种方式易造成额外的参数量增多以及大量内存的浪费。2017年Abhishek等[37]为了使像素级语义分割在效率上与实时视觉场景分析应用更加匹配,提出一种新的深度神经网络结构LinkNet。

LinkNet使用非常轻便的ResNet18作为编码器,由跳跃连接的编码-解码器结构构成。使网络无需增加大量的参数和操作即可解决大分辨率图像的实时视觉场景分析任务,在多次实时视觉分析测试中表现良好[38]。将每层编码器的输入与对应层级的解码器输出进行连接,这种结构设计使解码器在与编码器共享数据的基础上,使用较少参数对丢失的空间信息进行恢复,提高精度的同时显著缩短处理时间,从而提高模型效率,同时这种结构可以更好地保留编码器的原始空间信息,即使重新学习丢失的信息也不会增加额外的参数和操作。该网络结构总体上高效且轻量,可更好地应用于实时业务[38-40]。

3.4 R-LinkNet的异常数据识别模型

本文结合第2类异常数据特点,设计R-LinkNet模型。在LinkNet基础上,扩充1组编码器和解码器,增加1个跳连结构,并将ResNet50作为编码器结构,以增强网络的表征能力,进一步提高精度。

R-LinkNet也采用闭环链路策略,步骤如下:①将第2类异常数据划分为训练集和测试集;②搭建R-LinkNet模型,基于第2类异常数据进行训练,得到模型权重参数等;③将训练后的模型及权重应用在业务中对实时数据进行识别,分离异常数据(一般为电磁干扰)与降水回波。④对模型实时识别结果进行人工检验,针对模型识别错误的样本,重新标记后置入训练集中再次训练并更新权重等,不断提高模型识别的准确率。

4 模型评估

4.1 模型评估指标

模型评估常用指标包括准确率(Acc)、损失率(Los)和交并比(Iou)等。

Acc为正确预测的样本量(或像素点数量)占总样本量(或像素点数量)的比例,总样本包括正确预测的样本(或像素)与错误预测的样本(或像素)之和。

Los是评估模型输出的预测值同真实标签的偏差程度,为非负实数。对于本文的三分类问题,模型输出的是类似(0.2,0.3,0.8)的概率分布,而实际的标签是(0,0,1),对于这种概率分布类型的问题,一般采取交叉熵损失函数更为有效[34]。交叉熵相比均方误差更适合度量概率分布损失,当概率分布差异较大时,它可以输出更大的损失值,从而使模型参数更新更快、学习速度更快。

Iou(intersection over union)用于衡量预测提取结果与真实结果的相关度[40],称为交并比。

4.2 R-ResNet评估

通过搭建ResNet模型并在第1类异常数据完成训练,得到ResNet18,ResNet50和ResNet101 3种基础模型的准确率、损失率(表1)。3种模型在训练时准确率均超过99%。测试时,将标签数据预测是否准确作为评估指标,若标签数据预测值与实际值一致,则模型预测正确,正确预测的样本量占总样本量的百分比为准确率。结果表明:470张测试样本全部预测正确,测试准确率为100%。

表1 ResNet基础模型准确率(单位:%)Table 1 Accuracy of ResNet models(unit:%)

ResNet模型层数越多,可获得的准确率越高,但训练时长也成倍增加。本文将ResNet50作为基础模型,通过迁移学习后在第1类异常数据集上训练,再通过微调后继续训练一定轮次直至模型收敛,最后将改进后的模型权重参数应用于实时业务,得到R-ResNet雷达异常数据识别模型。

如图5所示,前100轮为模型迁移学习的结果,大概10轮训练后可达到拟合,训练时准确率达到96.5%,损失率为0.4%;测试时准确率达到96.4%,损失率为0.4%;第100~200轮为微调后的模型继续训练,模型经过微调后,训练时准确率达到100%;损失率为0;测试时准确率达到了99.98%,损失率为0.1%。测试表明:微调后的模型训练时的准确率提升3.5%,测试时的准确率提升3.58%。

图5 ResNet50在第1类异常数据的准确率和损失率Fig.5 Accuracy and loss of ResNet50 model on the first kind of abnormal data

4.3 R-ResNet实时业务测试

R-ResNet训练和测试均取得了超过99.9%的准确率。但训练集和测试集均为从业务数据中遴选的典型个例,该准确率并不能代表对所有业务数据的准确性。为了检验模型在业务数据上的应用效果,2022年7月11日—9月30日将模型部署在中国气象局气象探测中心中试服务器中,对天气雷达拼图系统V3.0输出的全国单站雷达图像进行为期3个月的实时测试,考察模型对所有业务数据应用效果。实时业务测试分为4个阶段,每阶段大约20 d。检验方法为对模型输出的全国单站雷达电磁干扰(每日约2000~3000张)、故障数据(每日约300~600张)进行人工检验,人工检验识别正确的图像数量占模型总输出图像数量的百分比,即为模型在业务数据中的准确率。

第1阶段为经过训练后的模型在实时业务中的测试,准确率为96.6%。从第1阶段模型错误识别的图像(1708张)中遴选典型个例并重新制作标签数据后置入训练集中再次训练,更新模型权重后应用在第2阶段,准确率提高至98.9%。同样的方法应用于第3、第4阶段测试后准确率达到99.2%和99.6%。本次实时业务测试将电磁干扰与降水混合的图像作为正常降水图像,这部分个例在一定程度上影响了R-ResNet的准确率。

在第4阶段(2022年9月10—30日)测试过程中,统计了模型对不同型号雷达异常数据的准确率。结果表明:模型在CINRAD/SA,SB,SAD型号雷达输出的电磁干扰异常数据最多,在CINRAD/CC,CCD型号雷达输出的故障异常数据最多。在第4阶段测试中,R-ResNet模型在各类型号雷达异常数据的识别准确率均超过99%。

4.4 R-LinkNet评估

图6为R-LinkNet在第2类异常数据的准确率和损失率,经过10轮训练后模型即可达到拟合,训练和测试时准确率均为98.6%,损失率为0.4%。表2为R-LinkNet在该数据的评估结果,在训练和测试时交并比分别为83.4%和83.2%。模型在训练时交并比更高,表明模型在训练集预测结果与标签数据的相关度更佳。评估数据表明,改进后R-LinkNet的准确率、损失率和交并比均优于LinkNet。

表2 模型准确率、损失率和交并比评估(单位:%)Table 2 Accuracy,loss and intersection over union of model(unit:%)

图6 R-LinkNet在第2类异常数据的准确率和损失率Fig.6 Accuracy and loss of R-LinkNet model on the second kind of abnormal data

以上R-LinkNet评估的训练集及测试集均来自2022年7月,为了得到模型在其他月份的应用效果,本文人工标注2000张2022年8—9月黑瞎子岛雷达观测图像。以7月数据为训练集,将8月或9月数据作为测试集,评估R-LinkNet的模型准确率。结果表明,8月和9月的准确率分别为98.2% 和98.0%。

表3为R-LinkNet以8月或9月数据作为训练集的准确率。结果表明:当某一月份数据作为训练集时,则模型在该月份数据上的准确率明显提升,模型测试时的准确性依赖于测试集与训练集的相关程度,相关程度越高,准确率也越高。当将7—9月数据均作为训练集时,模型在每个月份数据的准确率均为98.5%。表明训练集数据量越大时,其整体识别准确率更优,但具体到单一月份,只将该月份数据作为训练集后的模型准确率更高。

表3 R-LinkNet模型准确率检验评估(单位:%)Table 3 Evaluation of R-LinkNet model accuracy(unit:%)

图7为R-LinkNet应用于分离黑瞎子岛雷达电磁干扰和降水示意图,分别选用2022年7月8日、8月5日和9月8日3个观测个例。从主观上分析,模型保留了降水回波轮廓,并滤除电磁干扰杂波。客观评估过程将降水回波错误识别的像素占降水回波总像素的百分比作为误判率[21],3个个例的电磁干扰识别准确率分别为99.3%,99.8%,99.0%,降水回波的误判率分别为2.6%,1.2%,3.8%。

图7 R-LinkNet分离黑龙江黑瞎子岛雷达观测电磁干扰和降水回波(a)2022年7月8日20:03:34观测图像,(b)2022年7月8日20:03:34质量控制后图像,(c)2022年8月5日10:03:35观测图像,(d)2022年8月5日10:03:35质量控制后图像,(e)2022年9月8日09:02:33观测图像,(f)2022年9月8日09:02:33质量控制后图像Fig.7 R-LinkNet model discriminate electromagnetic interference and precipitation of Heixiazi Island radar in Heilongjiang(a)observation image at 200334 BT 8 Jul 2022,(b)image after quality control by R-LinkNet model at 200334 BT 8 Jul 2022,(c)observation image at 100335 BT 5 Aug 2022,(d)image after quality control by R-LinkNet model at 100335 BT 5 Aug 2022,(e)observation image at 090233 BT 8 Sep 2022,(f)image after quality control by R-LinkNet model at 090233 BT 8 Sep 2022

续图7

5 结 论

本文提出深度学习技术消除电磁干扰、故障等异常数据的方法,可作为传统气象算法的补充,应用于天气雷达数据质量控制实时业务中,自动识别和勘误异常数据,也可应用于业务实时监控雷达产品,对正常降水图像、电磁干扰及故障等图像进行自动分类,得到以下主要结论:

1) 第1类天气雷达异常数据分布在整幅雷达图像中,电磁干扰或故障数据特征非常明显;第2类天气雷达异常数据仅在雷达图像的局部体现,如电磁干扰在固定位置上出现,可与降水回波混在同一张图像中。

2) 针对两类异常数据的特点,分别制作训练集,并构建和训练R-ResNet和R-LinkNet两种模型。评估表明:R-ResNet对第1类异常数据的识别准确率超过99%,R-LinkNet对第2类异常数据的识别准确率超过98%。当发现模型勘误存在问题个例,可将数据重新人工标记后置入训练集中训练,形成从训练到勘误、检验,再回到训练的闭环链路,不断提高模型的准确率。

3) 两种模型可定制化应用于适合的雷达站,在实时业务中自动勘误电磁干扰、故障等异常数据。当R-ResNet判识为第1类异常数据时,则丢弃该数据;R-LinkNet可对第2类异常数据进行自动勘误,且保留图像中的降水信息。除此之外,R-ResNet也可应用于实时业务中对各种雷达图像进行自动分类。

猜你喜欢

降水天气准确率
黑龙江省玉米生长季自然降水与有效降水对比分析
天气冷了,就容易抑郁吗?
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
谁是天气之子
盛暑天气,觅得书中一味凉
Weather(天气)
高速公路车牌识别标识站准确率验证法
为什么南极降水很少却有很厚的冰层?