APP下载

基于小波分析对地面电场信号的去噪及闪电信息提取

2020-05-04张廷龙刘文杰潘家利

关键词:自动识别频数雷暴

余 海,张廷龙,刘文杰,潘家利,陈 洁

(1.海南省南海气象防灾减灾重点实验室,海南 海口 570203;2.海南省气象灾害防御技术中心,海南 海口 570203;3.海南大学 生态与环境学院,海南 海口570228)

大气电场仪常被用来监测晴天大气电场和雷暴活动引起的电场,晴天电场强度通常为100 V·m-1左右,而雷暴电场要远大于晴天电场.因此,雷暴电场通常被认为是叠加于晴天电场上的扰动[1-3].但雷暴扰动电场显著高于背景的晴天电场,在具体讨论雷暴电场时,通常不考虑晴天电场的贡献.组网大气电场仪由于探测范围更大、多站信号可综合分析等优势,常常用来对雷暴过程或雷电的监测和预警.随着雷暴过程的靠近和远离,地面电场不仅会出现强度增强和减弱,还会发生电场极性的反转,另外,闪电发生时,地面电场表现为快速的跳变,这些信息在一定程度上都可作为预警信息参量.受大气电场仪自身的灵敏度和安装环境等因素的影响,实测的大气电场信号中常夹杂着一些其他非雷暴电场信号,也就是噪声信号.如外场架设的大气电场仪易受周边植被的影响,当雷暴过境时,随风摆动的植被给电场信号造成不同程度的信号“污染”.此外,还有来自工频噪声、地物反射噪声以及其他辐射源信号等的干扰,这给后期资料的分析及应用造成很大的困难.在具体应用大气平均电场时,需要对原始信号进行去噪处理,保留雷暴大气电场的变化趋势和闪电引起的电场变化.目前,小波去噪应用较为广泛,其原理是首先将原始信号进行小波分解,然后对分解得到的系数选择一个合适的阈值,最后对降噪处理后的系数进行小波逆变换,得到降噪后的信号.苟学强[4]等对地面电场资料的分析发现,闪电引起的较大的电场变化具有强烈的奇异性和明显的多重分形性.余蓉[5]等以双指数衰减脉冲信号上叠加高斯白噪声来仿真大气电场信号,并计算去噪前后仿真信号与实测大气电场信号的均方误差,对比分析不同小波函数、阈值分析方法和小波分解层数的去噪效果.李鹏[6]等对比了加权平均滤波、FIR数字低筒滤波器和小波阈值去噪方法对闪电瞬态电场信号的去噪效果,发现小波阈值去噪方法优于其他2种方法,并且确定小波分解层数应为5~7层.李艳[7]等、陈红兵[8]等、李振亚[9]等都利用了小波技术对地面大气电场数据进行滤波或去噪处理.

雷暴云产生的闪电可以分为云闪和地闪,而云闪所占比例约为总闪电的2/3[3].由于地闪活动给社会生产生活造成的危害更大,目前多省份建立的闪电定位系统都为地闪监测系统,而对雷暴进行全闪电(云闪和地闪)监测的较少.对于雷暴而言,云闪通常要早于地闪发生且云闪的频率要高于地闪[3].因此,在缺少云闪观测的前提下,利用地面电场信号提取总闪电频数特征有利于雷电的临近预警.笔者将采用小波分析方法开展地面电场观测资料去噪处理,并在此基础上,研究地面大气电场波形中闪电信号包括闪电频次及极性等提取方法,实现对雷暴总闪电频数的评估.目前,国内利用大气电场仪进行雷电预警业务应用时[10],一般采用设定多级电场强度阈值来划分雷电预警等级,在实际业务化运行中容易出现漏报及误报.利用小波技术处理地面大气电场数据并提取相关闪电信息,结合地闪定位网,可以得到雷暴的云闪的时间演变特征,以此表征雷暴在不同发展阶段的闪电活跃度,较为准确地对地闪活动进行预警.海南岛对流活动频繁[11],闪电活动频发[12-13],雷电预警预报技术的提升十分必要.海南岛目前已布设50多部地面大气电场仪,以期通过本研究能够为组网电场仪观测业务应用及雷电预警预报提供的关键技术和指标.

1 资料与方法

1.1 资料本文分析的资料为2013年和2014年6~9月自行布设的大气电场仪获取的雷暴电场部分个例.该大气电场仪采样频率为125 Hz,电场强度探测范围为±100 kV·m-1,探测范围为10~15 km.其中,电场的正、负极性定义为:当地面电场受雷暴云内的正电荷控制时,地面电场为正,反之为负.

1.2 小波分析方法小波分析方法用于电场信号的去噪原理,对原始时间序列的电场信号作小波变换,通过伸缩平移运算对信号逐步进行多尺度细化,达到高频处时间细分,低频处频率细分,而噪声信号一般处于高频处,而电场信号处于低频处.通过多尺度的频率细化,基本将噪声细分至高频部分,电场信号细分至低频部分,然后选择合适的阈值对各部分进行阈值处理,完成电场信号与噪声信号的区分.其具体过程可分为3个部分:1)分解过程.选定一种小波,对原始信号进行指定层数的小波分解,分解得到低频近似信号和高频细节信号.2)阈值过程.对分解得到的各层系数选择一个合适阈值,并对细节系数作阈值处理.3)重建过程.将降噪处理后的系数进行小波逆变换,重建恢复原始信号[14].

1.2.1 小波分解层数对大气电场信号进行小波分析时,首先应确定小波分解的层数,以便合理地对大气电场数据波形进行分析.计算电场信号的功率谱,能够更好地找出电场信号的能量主要集中在哪一频段范围内.具体方法是对电场信号进行快速傅里叶变换,然后取其幅值的平方除以信号样本长度,其值即为该信号样本的功率谱.选取2014年8月的一次雷暴地面大气电场信号为样本,经计算得出如图1所示的功率谱图.

图1 大气地面电场数据序列功率谱

图1所示,该信号功率谱能量主要集中在0.06 Hz以下,处于非常低的频段范围内.小波分解是将原始信号分解成一低频近似信号和一高频细节信号,多层分解的过程就是不断的将低频近似信号再分解成一低频近似信号和一高频细节信号.本文中的电场信号采集频率为125 Hz,根据采样定理可知小波分解的频段区间,通过7层小波分解后低频近似信号可以逼近至0.5 Hz以下并结合多层分解中不同层低频近似与原始信号的对比情况发现,第七层低频近似信号与原始信号变化特征基本相似.因此,拟对原始电场信号作7层小波分解,以期提取其电场波形的主要变化特征.

1.2.2 小波函数选取考虑到计算的功率谱以及选定的分解层数情况,在选取小波函数方面采取了较为简单的对比方法,即选取不同小波函数,对比分析7层分解后的第七层低频近似信号与原始电场信号的异同性,以此来验证不同小波函数在分析电场信号方面的去噪效果.

随机选取了7种小波函数(db5,db10,sym5,coif4,bior3.5,bior4.4和haar)进行对比实验.为了分析函数的处理效果,引入均方误差(MSE)以及信噪比(SNR)参数来衡量电场信号处理前后的误差及效果,MSE及SNR计算公式

(1)

(2)

其中,N为信号样本数,s1和s2为小波处理前后的信号,k表示信号样本中第k个样本.MSE值越小,表示分解后的低频近似信号与原始信号相似性越高;SNR值越大,效果越好.

表1给出了7种小波的信噪比、均方误差计算值.由表1可以看出,均方误差最小的小波函数和信噪比最大的小波函数均为db10小波函数,表明原始电场信号经db10小波处理后,信号均方误差较小,数据的离散程度较小,数据的可靠性较大,另外信噪比值最大,系统的随机噪声处理较好.因此,地面大气电场信号分析可以采用db10函数.

表1 选取的7种小波的信噪比、均方误差计算值

1.2.3 阈值函数选取为进一步探讨选用函数的适用性,选用5种信噪比较大和均方误差较小的小波函数(db10,db5,sym5,coif4和bior 4.4)和4种阈值分析法(Rigrsure,Sqtwolog,Heursure和Minimaxi)对各自的去噪效果进行对比分析.

Rigrsure阈值法是一种基于stein的无偏似然估计原理的自适应阈值选择.对一个给定的阈值t,得到似然估计,再将非似然t最小化,得到了所选的阈值.Sqtwolog阈值法采用的是固定的阈值形式,产生的阈值大小是信号长度的对数的开方.Heursure阈值法是Rigrsure阈值法和Sqtwolog阈值法的综合,如果信噪比很小似然估计有很大的噪声,出现此情况,就采用固定的阈值.Minimaxi阈值法采用的也是一种固定的阈值,产生一个最小均方误差的极值,而不是无误差[14].

图2 不同小波函数与阈值分析方法去噪后电场信号均方误差

由图2可知,在4 种阈值分析法中,Rigrsure阈值分析法的均方误差是最小的,即降噪效果是最好的,其次是Minimaxi阈值法.Rigrsure阈值分析法下小波变换的信号均方误差最小是sym5小波函数,其次是db10小波函数.综上所述,采用db10和sym5小波函数都能取得较好的去噪效果,但结合阈值分析方法,sym5小波配合Rigrsure阈值方法,去噪效果更优.

2 实例结果分析

选用sym5函数作为用于小波变换的小波函数,并采用Rigrsure阈值分析方法实现地面电场信号的去噪.此次选取2014年8月20日的地面电场数据,该过程闪电活动较为频繁,且信号上叠加有一定的噪声(图3a),采用上述去噪方法进行测试,得到去噪后的波形(图3b).

硬件实力支撑的同时,新科空调也没有忽视软实力的提升。舒乐华透露,在2019年,新科空调将继续坚持“人才”、“创新”和“品牌”三大战略,坚持“渠道为王,客户为尊”的经营理念,不断开拓进取。

图3 地面电场波形图

由图3可见,电场信号在进行去噪处理后,波形重叠部分明显减少,波形更为平滑且突出显示了闪电活动的主要变化趋势.表明采用该方法可以较为显著的降低信号中的噪声,为数据的后期分析和处理起到质量控制的作用.该雷暴过程地面电场波形从样本从1.6×105序列点开始振荡,电场强度急剧变化的时间大约持续了33 min.地面电场急剧变化过程中,电场强度主要集中在-20~25 kV·m-1,这一时段内闪电活动频发,电场波形主体为正极性,闪电引起的电场变化主要为负极性.

为了进一步验证sym5 小波函数在Rigrsure阈值方法下对地面大气电场数据的处理效果,还选取了3 次伴有闪电活动的地面电场数据进行小波去噪处理,如图4所见.

图4 地面电场原始波形及去噪后的电场波形

由图4可见,3个样本个例原始波形的噪声相对较为明显,经去噪处理后,波形的重叠度明显降低,即噪声信号显著得到抑制,电场变化更为清晰.对于有闪电活动的电场信号而言,经sym5小波函数和Rigrsure阈值方法处理后,不仅能较好地保持原信号中电场波形强度陡增或者电场极性突变的部分,且能够较为清晰地辨识出不同极性闪电放电次数等信息,对于后续开展大气电场相关研究提供了有利的条件.

上述观测实例的分析结果表明,采用Rigrsure阈值分析方法和sym5小波函数对地面大气电场波形进行去噪处理,在保留闪电波动信息的同时对信号也进行了较好的平滑处理.

3 闪电信息提取方法

大气电场信号去噪是为了更为精确地分析该信号的电场特征,并在分析该信号特征的基础上,分析其代表的物理意义及闪电活动特征.地面电场波形的快速跳变能够指示当前时段闪电活动的规律,利用小波分析方法,对地面电场波形进行去噪处理并分析其大气电学层面的特征,包括电场强度、闪电频数以及极性等闪电特征.

一次完整的闪电活动(地闪或者云闪)持续时间从几十毫秒至1秒左右[3],尤其是电场快速跳变的地闪回击放电和云内电荷击穿过程时间更为短暂(微秒级).另外文中电场数据的采样率和数据记录存储速率分别为125 Hz和10 Hz(即1 s内存储采样数据中的10个电场值),意味着记录的电场波形中快速跳变部分可以表示为一次闪电.快速跳变的部分在波形上表现为脉冲形式,识别这些脉冲需要计算电场波形中峰值和谷值点,然后求解该峰值或谷值点附近波形的上升沿或下降沿的斜率k.因此,本文采用差分计算方法来识别电场波形中的跳变部分,具体公式

ΔE=Ei+1-Ei,

(3)

其中,ΔE为相邻电场数据的差值.

根据式(3)对整列电场样本作差分计算,得出电场样本的差分值.根据已识别的电场波形中峰值和谷值点,分析该点前后各5个差分值,计算该段上升沿或下降沿的斜率k(k=ΔE/Δt),根据k值的变化情况确定该点是否是闪电放电引起的电场变化,如果是,则记为1次闪电,并同时记录极性.以此类推,识别出整列电场样本中闪电频次及相应极性.

在自动识别闪电的算法中,判断k值的变化是其中的重点,对应到式(3)中即差分值ΔE的取值.ΔE的绝对值的取值大于某个阈值时,是判断该脉冲是否为闪电的关键.一次闪电持续时间大约在1 s以内,而考虑到本文中电场数据的记录频率为10 Hz(即1 s记录10个样本点),电场波形序列相邻差分值的显著差异可以表征为闪电脉冲.以2014年8月20日的地面大气电场资料为例,详细分解了电场阈值的取值方法.样本序列在1.6×105开始振荡,电场强度急剧变化的时间大约持续了33 min,在此期间电场强度在-30~+30 kV·m-1.

图5 2014年8月20日电场波形电场快速反转变化部分(红色圆点为闪电脉冲尖峰或脉冲起始点)

图5是当天雷暴天气下的大气电场波形(晴天电场部分未在图中给出).从图5中可以看出,地面电场主要受正电荷区控制,当电荷积聚到一定程度时,闪电通道被击穿,通道内正负电荷瞬间中和,引起地面电场波形出现极性反转变化.电场波形中出现了脉冲尖峰,共计41个尖峰,其中电场负极性变化的有38个,正极性的3个.通过分析41个尖峰持续时间、上升沿和下降沿斜率推断电场仪在其探测范围内采集了41次闪电的信息,闪电频数为1.2 fl·min-1.此处正、负极性仅仅是针对波形中脉冲尖峰的变化方向定义,与正负极性闪电的定义无关.本文中为与自动识别闪电方法区分开,将这种通过观察电场波形、逐一分析尖峰脉冲持续时间与上升沿斜率的方法称为人工识别方法.

设计自动识别电场波形中闪电频数算法时,对比计算了不同电场判断阈值下,算法自动识别的结果与人工识别的结果的误差.

图6 不同阈值下自动识别的总闪电频数与人工识别的闪电频数间误差

图6给出了不同阈值下算法自动识别出与人工识别的总闪电频数的误差计算结果.由图6可知,不同阈值下,两者的误差计算结果先减小,至ΔE=1.5 kV·m-1时,误差降至最低.随着阈值的增大误差随之增大,表明电场判断阈值越小,算法识别的脉冲就越多,会导致部分非闪电脉冲的电场波动也被识别为闪电脉冲,从而导致误差增大;电场判断阈值越大,算法识别的脉冲就越少,导致部分电场幅值较小的闪电脉冲被过滤,从而导致误差增大.仅考虑总闪电频数的误差计算结果,电场阈值ΔE=1.5 kV·m-1时,算法自动识别闪电频数的误差最小.

为确保阈值选择的合理性,还计算了人工识别与不同阈值下算法自动识别下每5 min时段内闪电频数的统计结果,如图7所示.

图7 每5 min内人工识别闪电频数与不同阈值下闪电频数对比情况

图7为有闪电过程的电场波形区段(晴天电场部分波形未显示)人工识别与不同阈值(ΔE分别为1.0,1.3,1.5,1.7,2.0,2.5,3.0,4.0,5.0,6.0)下算法自动识别的结果.每5 min的闪电频数的曲线总体变化特征相似,但在具体时段闪电频数有所不同.为进一步查看具体的差异,对不同时段的闪电频数与人工识别的闪电频数做了相关性计算.根据图7的统计结果和选取的10组电场阈值ΔE,分别计算不同阈值下每5 min时间序列下自动识别结果与人工识别结果的相关系数,计算结果如表2所示.

表2 每5 min内不同阈值下算法自动识别的闪电频数与人工识别闪电频数相关性计算结果

由表2可知,每5 min内不同阈值下算法自动识别的闪电频数与人工识别闪电频数相关性计算结果整体上呈现阈值越大、相关性越差的规律特征,且阈值越小,算法识别的闪电频数相对偏高(ΔE分别为1.0和1.3时),阈值越大,部分时段漏掉的闪电过程可能越多(ΔE分别为5.0和6.0时).因此,在选定阈值时,应当综合考虑总闪电频数误差以及分时段内两者间的相关性结果.在本文中综合两者计算结果,选定电场阈值为1.5 kV·m-1.

此自动识别方法在实际应用中,应当对地面电场数据进行多样本计算,以此来确定此类地面电场仪获取的电场波形的电场判断阈值.由于云闪先于地闪发生[3],通过上述方法自动识别电场波形中的总闪电信息,再结合地闪定位监测网的数据,能够获取地闪发生前的闪电活动情况(主要是闪电发生时间及频次),这将大大提前雷电预警的时效.

4 结束语

利用小波分析技术研究了地面大气电场资料的去噪技术以及提取去噪电场信号中闪电频次、极性等信息的方法,分析方法与结果能够在分析不同天气系统下地面大气电场特征以及获取雷暴天气系统下闪电活动信息等方面起到关键性作用,为后期开展海南岛电场仪组网观测及基于此网络的雷电预警技术研发奠定了良好的技术基础.

通过算法自动识别并提取电场波形中的闪电频数等信息时,电场仪数据记录存储频率的高低以及电场强度幅值大小都会直接影响闪电频数识别误差.此外,电场仪的探测范围有限,部分发生距离较远的闪电或雷暴云靠近或远离电场仪站点时引起的幅值较小的脉冲波形也会导致算法识别的误差增大.下一步工作将着重研究多部大气电场仪组网观测结果.综合考虑不同电场仪站点环境及地形等因素,利用本文方法对电场仪观测网内不同电场资料进行小波分析,分析不同测站的差分阈值,提取同一天气系统下不同电场仪识别的闪电频数等信息,综合多站结果确定该天气系统下总闪电频数等信息,为雷电预警提供关键参数及提前量.

猜你喜欢

自动识别频数雷暴
基于数据挖掘的船舶航迹自动识别系统
新德里雷暴
基于VR技术的X射线图像安检危险品自动识别
船舶自动识别系统对船舶救助的影响
牙克石市图里河地区雷暴特征统计分析
频数与频率:“统计学”的两个重要指标
一种基于卷积神经网络的人脸表情自动识别方法
阜新地区雷暴活动特点研究
中考频数分布直方图题型展示
学习制作频数分布直方图三部曲