APP下载

基于卷积神经网络的典型雷暴云下地面电场识别研究

2022-08-30孙中华傅正财刘亚坤毕晓蕾

电瓷避雷器 2022年4期
关键词:阴雨天雷暴电场

孙中华, 傅正财, 刘亚坤, 陈 坚, 毕晓蕾, 刘 娟

(1.上海交通大学电力传输与功率变换控制教育部重点实验室,上海 200030;2.中国石化青岛安全工程研究院化学品安全国家重点实验室,山东 青岛 266101)

0 引言

雷暴云在形成到消亡的过程中,云中电荷聚集和释放会使得地面电场发生剧烈变化,因此,可基于地面电场特征开展雷电预警和雷电防护研究[1-2]。雷暴个体特征差异明显,基于传统电场阈值分析原理的雷电预警方法存在适应性差、命中率低等问题。为提高雷电预警的准确度,相关学者采用时序差分[3]、快慢抖动分析[4]、集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)[5]、希尔伯特黄变换(HHT变换)[6]等方法对大气电场数据进行处理,也有学者将地面大气电场与雷电定位和气象雷达资料相结合[7-8],实现了雷电预警效果的改善。

雷暴云发展过程中地面电场特征变化复杂,基于地面电场观测数据的雷暴云信息提取方法仍需研究。已有学者应用BP神经网络处理地面电场信息并进行雷电预警[9-11],但存在可用数据量少、训练不易开展的问题。深度学习方法能在大数据中自动学习,认识复杂样本的深层次特征信息,已在图像识别、语音处理等领域展现出了巨大的优势。将深度学习算法应用在雷暴环境下地面电场大数据研究中是一种有效挖掘雷暴云信息、提高雷电预警效率的方法。

笔者基于雷暴云的偶极子模型,研究不同天气情况下地面电场的特征,通过卷积神经网络模型训练大量地面电场数据样本,提出基于深度学习的雷暴云地面电场识别方法和雷电预警等级划分方案,讨论卷积神经网络模型在地面电场特征识别和雷暴区域信息获取中的应用可行性,所建卷积神经网络模型实现了含噪地面电场的学习和识别。

偶极子雷暴云模型下地面电场分析

雷暴云的电荷结构主要有偶极子模型[12]、三极模型[13]、多极模型[14-15]等多种模型,其中,偶极子模型电荷结构明晰、可较好地模拟典型雷暴云电荷特征,并有大量观测结果验证。因此,笔者采用偶极子模型研究雷暴云的地面电场特征。

依据图1所示,典型雷暴云电荷结构中正电荷中心QP和负电荷中心QN距离地面的高度分别为hP和hN,设定雷暴云电荷中心的垂直投影为(x0,y0)。考虑大地的电场镜像作用,被监测区域(xi,yi)处的地面电场[16]可由公式(1)计算可得。

(1)

式中,Enoise(xi,yi)表示被监测区域(xi,yi)处的背景噪声电场。

图1 雷暴云的偶极子模型Fig.1 Dipole model of thunderstorm cloud

由式(1)可知,当Enoise=0时,偶极子模型雷暴云下地面的电场由正、负电荷中心及其距离地面的高度参数共同决定,与正电荷中心QP和负电荷中心QN成线性关系。以两组实例化数据来观察荷电参数对雷暴云下地面电场的影响,得到不同电荷参数下距雷电云电荷中心地面投影±20 km区域内的地面电场分布,计算结果见图2。对比图2(a)和2(b)可以发现,偶极子雷暴云正负电荷的高度差越大,雷暴云在地面投影处产生的电场值就越大,其幅值能从-3.8 kV/m变到-17.7 kV/m;地面电场分布中电场陡升区域的面积则会变小,其半径从12 km减少至5 km。

2 地面电场数据训练样本

基于地面电场观测的雷电预警系统多采用少数观测点上的测量数据进行分析和处理,易出现雷暴云空间电场分布特征部分丢失的问题,并存在由背景电场干扰引起的虚报和漏报的现象。提高雷电预警的效果需要全面获取整个监测区域内的电场信息及其特征,因此,所提深度学习算法基于整片监测区域内的电场数据样本开展训练。

2.1 地面背景电场模拟

考虑如图3所示的被监测区域,图3中不规则图形表示需要雷电监测预警的区域,如油库、化工厂等。采用二维几何逼近方法将所监测区域规则化为图3所示的正方形虚框,其尺寸为6 km×6 km,依据0.5 km的水平距离将其划分网格,得到13×13的子监测区域,并将各子监测区域的电场进行矩阵数组处理。依据与被监测区域中心(原点O)的距离,将雷暴云判断目标区域划分为R0=5 km和R1=10 km、R2=20 km 3个等级,分别命名O~R0、R0~R1和R1~R2为A1、A2、A3。

图3 电场监测区域示意图Fig.3 Schematic diagram of the electric field monitoring areas

根据已有学者研究得到的晴天地面大气电场特征及其变化规律[17-18],本研究选取陆地晴天情况下大气电场的典型值19~310 V/m作为晴天地面电场的参考值。不同地区阴雨天情况下地面电场的变化范围较大[19-21],受积雨云下部负电荷影响,阴雨天情况下地面电场多呈现负值,可选取0至-3 kV/m作为阴雨天地面电场的参考值。此外,地面电场会受到周围建筑物等环境的影响,可采用偏移倍率0~0.4进行修正[22-23]。依据不同天气情况下地面电场的峰值范围,整片被监测区域某时刻t的电场均值可由式(2)确定,其中被监测区域各地点的电场值由式(3)确定。在实际环境中,若存在大功率的电力设备等,会出现局部地面电场的畸变现象,此特殊情况下,电场畸变偏移范围可以2~3 kV/m示例。综上,模拟晴天、阴雨天和特殊情况下被监测区域某一时刻t的背景电场见图4(a)、(c)和(e)。

Et=rand(Emin,Emax)

(2)

式中,Et表示t时刻被监测区域的电场均值,Emin表示地面电场的最小值,Emax表示地面电场的最大值。

Et(xi,yj)=E(t)·(rand(0,0.4)+1)

(3)

式中,Et(xi,yj)表示t时刻位置(xi,yj)的电场。

其后,对不同情况下地面电场数据进行归一化处理,在数据归一化处理过程中,雷暴云下被监测区域的电场数值分布范围大,电场数据离散性强,因而,对每个模拟背景电场样本进行独立的归一化处理,处理方法如式(4)所示。同时,对电场样本进行了可视化处理,将被监测区域的电场信息转化为规格为13×13、色彩取值范围为0~255的二维灰度图,见图4(b)、(d)和(f)。

(4)

式中,Et,s表示被监测区域的位置(xi,yi)处的地面电场,Et,s表示t时刻被监测区域的第s个样本数组。

图4 不同情况下地面电场及其二维灰度图Fig.4 Electric fields in different conditions and the associated 2-D grey images

2.2 雷暴云下地面电场区域特征

研究设定(QP,QN,hP,hN,x0,y0)的取值范围对应为(30~60 C, -30~60 C, 8~15 km, 1~7 km, 0 km2≤x02+y02≤202km2),随机雷暴云相关参数,计算得到不同雷暴云参数下被监测区域的地面电场训练样本。根据式(1)将雷暴云参数分别实例化为例1(50, -49, 15, 7, 2,3)、例2(30, -32, 10, 2, -7, 7)、例3(40, -38, 8, 4, 15, 10),得到不同雷暴云参数实例化下被监测区域的地面电场分布,见图5。

图5 随机雷暴云参数实例在被监测区域的地面电场及其二维灰度图Fig.5 Ground electric field of monitored areas in randomly selected thunderstorm cloud examples and the associated 2-D grey images

在图5中,参数实例1、参数实例2和参数实例3分别对应雷暴云位于图3所示区域A1、A2、A3的情形,其中,参数实例1的雷暴云地面电场考虑了阴雨天的环境影响,参数实例2的雷暴云地面电场考虑了阴雨天和特殊背景的环境影响,参数实例3考虑了晴天的环境影响。分析图(5)可以发现,雷暴云位于不同区域时被监测区域的地面电场差别明显,在A1区域时,被监测区域的地面电场在偶极子下部负电荷的影响下整体呈现负值,电场变化的梯度较大;在A2区域时,雷暴云与被监测区域的距离增大,被监测区域的地面电场值整体逐渐减小,甚至个别位置出现电场极性反转的现象;在A3区域时,雷暴云与被监测区域距离进一步增大,地面电场受偶极子上部正电荷的影响逐渐增强,被监测区域的地面电场呈现正值。在地面电场二维灰度图中,雷暴云在被监测区域产生的地面电场可视化图像出现白→黑均匀过渡现象,与图4所示不同情况下地面电场相比,表现出了明显的灰度过渡特征。

2.3 地面电场训练样本

研究设计了基于不同情况下地面电场样本的约束随机生成算法,产生包含不同情况下地面电场的随机综合训练样本,总样本量为30 000个地面电场矩阵组。对于雷暴云训练样本,首先随机初始化雷暴云参数,同时叠加随机的晴天或阴雨天背景电场,并变随机概率耦合特殊背景电场,从而得到雷暴云下被监测区域的地面电场样本集。对于晴天或阴雨天的训练样本,以变随机概率模式叠加特殊背景电场,得到晴天或阴雨天下被监测区域的地面电场样本集。在总样本量的雷暴云所处区域考虑中,根据雷暴云与被监测区域中心的距离(如图3所示划分区域),在各区域内(A1,A2,A3)共随机生成了15 000个考虑特殊背景电场存在情况下的雷暴云下被监测区域的地面电场样本、7 500个考虑特殊背景电场存在情况下的晴天地面电场样本和7 500个考虑特殊背景电场存在情况下的阴天地面样本。

3 地面电场识别

卷积神经网络(CNN)是一种前馈型的神经网络,卷积层提取数据特征,池化层完成数据局部子抽样,具有可高效滤除无关信息和关联识别局部数据的优点。依据本研究对象特点,所处理的数据为大量地面电场矩阵组,并需考虑局部电场数据的空间梯度关系,适合用卷积神经网络处理识别。

3.1 卷积神经网络结构

依据前述对不同情况下地面电场的特征分析,分类处理样本,将不包含雷暴云信息的晴天和阴雨天的地面电场样本(即对立样本)的标签设为0,将包含背景噪声的A1、A2、A3区域内的雷暴云下被监测区域的地面电场样本的标签分别设为1、2、3。其后,建立基于LeNet模型[24]的CNN网络训练结构,见图6。在图6中,C1由32个不同的2×2的卷积核和2×2的最大池化组成,C2由64个不同的2×2的卷积核和2×2的最大池化组成,C3由64个不同的2×2的卷积核组成,这3层主要用来对电场数据的特征进行提取。在分类时,利用flatten层完成卷积数据的一维数组转化,再对其进行两个全连接层处理。其中,隐藏层D1含有64个神经元,D2由softmax函数激活且完成含4个输出的样本分类识别。卷积神经网络结构的损失函数选择分类交叉熵,采用RMSProp优化算法更新网络的权重。

图6 CNN网络结构Fig.6 The network structure of CNN

以位于A1区的雷暴云下被监测区域的地面电场样本数据为例,将其输入到所建卷积神经网络结构进行训练,得到C1卷积核的2通道和32通道的特征见图7,从图7中可以发现,2通道主要对中心区域的数据特征进行提取,32通道主要对边缘及4个边角上的数据特征进行提取。

图7 训练模型中间层的可视化Fig.7 Visualization of the middle layer in training model

3.2 电场数据分类结果

本研究训练的样本由27 000个地面电场矩阵组组成,包含了A1、A2、A3区的雷暴云下被监测区域的地面电场样本各4 500个,晴天和阴雨天的背景电场样本各6 750个。验证数据集由3 000个地面电场矩阵组样本组成,其中,A1、A2、A3区的雷暴云样本各500个,晴天和阴雨天的背景电场样本各750个。图8和图9分别是训练集的损失值下降曲线和验证集的准确率。依据图8可以发现,训练次数达到180次左右时,训练集的损失值下降减缓,对应的验证集准确率也达到相对稳定的位置,稳定值高于93%,表明所提CNN方法能够较好地区分背景地面电场样本与雷暴云下地面电场样本。

在分类识别中,采用精确率Precision和召回率Recall作为检验指标,其计算方法如式(5)和式(6)所示。

Precision=TP/(TP+FP)

(5)

Recall=TP/(TP+FN)

(6)

式中,TP表示预测为正、实际为正的样本,FP表示预测为正、实际为负的样本,FN表示预测为负、实际为正的样本。

图8 训练集损失值Fig.8 Loss of the training set

图9 验证集准确率Fig.9 Accuracy of the validation set

验证后所得的混淆矩阵见表1,计算得到各类别的精确率和召回率见表2。在表2中,类别0表示非雷暴云样本(即环境样本)的精确率和召回率分别是98.47%和96.73%,各个区域地面电场样本识别的精确率分别为98.20%、90.20%和77.80%,表明所提CNN方法可准确地区分雷暴云与非雷暴云下的地面电场样本并进行区域分类。分析混淆矩阵可见,500个类别1的样本中有491个样本被正确识别,识别错误的9个样本处于A1与A2的交界处。23个类别0的样本被误识别为类别3,50个类别3的样本被识别为类别0,这些误判主要是受到阴雨天背景电场的影响。

表1 验证集的混淆矩阵Table 1 Confusion matrix of the validation set

表2 验证集的精确率和召回率Table 2 Precision rate and recall rate of the validation set %

3.3 基于电场识别结果的雷电预警等级划分

根据雷暴云与监测区域中心之间的距离范围划分雷电预警等级,将A1、A2和A3区域内识别出的雷暴信息分别划分为第一、二和三级的雷电预警等级。采用探测概率(Percent of Doom,POD)、虚警率(False Alarm Rate,FAR)和临界成功指数(Critical Success Index,CSI) 评价雷电预警效率,其计算公式见式(7)-(9)。

(7)

(8)

(9)

式中,X为实际发生闪电并准确预警的次数;Y为实际发生闪电而未预警的次数;Z为预警而无闪电发生的次数。

依据本研究划分的雷电预警方法,得到基于CNN地面电场识别结果的雷电预警效率评价指标分别为POD=88.73%,FAR=8.21%,CSI=87.39%。对比已有文献中基于电场绝对值判定的雷电预警方法,得到如表3所示的不同阈值下预警效率的评价指标。依据表3可得,电场阈值越低,POD就越大,但对应的FAR就会增大。权衡POD和FAR结果,以CSI指标的最大值来选取阈值,得到表3中4 kV/m电场阈值对应的POD、FAR和CSI分别为64.00%、4.48%和62.11%。与CNN方法相比,本研究所提方法对地面电场样本的识别更精准。

表3 验证集在不同阈值下的预警效率Table 3 Warning efficiency of the validation set under different thresholds %

图10中,在t1时刻雷暴云刚进入预警范围,此时判定被监测区域施行第三级预警;在t2时刻,雷暴云进入A2区域,判定被监测区域施行第二级预警;在t3时刻,雷暴云进入A1区域的边界,判定被监测区域施行第一级预警。

4 结论

笔者研究了基于偶极子电荷结构模型下雷暴云的地面电场特征,训练了27 000个随机的地面电场样本,建立了可识别地面电场的CNN网络结构,对各类地面电场样本进行了区分识别,得到:

1)所提CNN方法区分各类地面电场样本的整体准确率高于93%,区分雷暴云和非雷暴云样本的精确率和召回率分别为98.47%和96.73%。

2)基于CNN识别的雷电预警探测概率POD、虚警率FAR、临界成功指数CSI分别可达88.73%、8.21%和87.39%。

3)所提方法对雷暴云所处区域识别的精确率分别为98.20%、90.20%和77.80%,召回率均高于85%,据此可划分雷电预警等级,为局部区域的雷电预警提供参考。

猜你喜欢

阴雨天雷暴电场
新德里雷暴
巧用对称法 妙解电场题
求解匀强电场场强的两种方法
天津市滨海新区塘沽地域雷暴日数变化规律及特征分析
治风湿性头痛
阜新地区雷暴活动特点研究
脑筋急转弯
电场强度单个表达的比较
电场中六个常见物理量的大小比较
鄂温克族自治旗雷暴气候特征分析