APP下载

基于多源资料的中国星载闪电探测数据质量控制技术

2022-11-04朱杰程攀唐顺仙王炳赟

科学技术与工程 2022年27期
关键词:阈值观测雷达

朱杰, 程攀, 唐顺仙, 王炳赟

(1.中国气象局大气探测重点开放实验室, 成都 610225; 2.南京气象科技创新研究院, 南京 210041;3.中国气象局中国遥感卫星辐射测量和定标重点开放实验室/国家卫星气象中心(国家空间天气监测预警中心), 北京 100081;4.许健民气象卫星创新中心, 北京 100081; 5.辽宁省气象灾害监测预警中心, 沈阳 110166)

闪电是自然界十分壮观的天气现象之一,每年爆发的闪电数量,可以达到百万量级,给人民生活和经济生产,造成不同程度的困扰与危害。此外,高频次的闪电活动,往往是强对流过程的“示踪器”[1],对于极端天气的监测和预警有着举足轻重的作用。长久以来,闪电观测为人类对闪电特性的认识,提供了重要的数据保障,只有优质的闪电观测数据,才能为相关业务和科研提供值得信赖的资料。因此,闪电数据质量控制,是一项系统、基础且关键的工作,直接关系到数据应用的效果。

闪电成像仪(lightning mapping imager,LMI)是中国首枚、世界上第二枚静止轨道星载闪电观测设备,搭载于中国新一代静止气象卫星——风云四号A气象卫星(FY4A)上,能够覆盖地面3 200 km(纬度)×4 800 km(经度)幅宽的区域,星下点空间分辨率可达7.8 km[2],直接实现对视场范围内爆发的闪电初生、发展、迁移、消亡全过程不间断跟踪观测,是大尺度空间范围闪电监测的理想手段,其数据应用前景广阔。然而,恶劣且未知的宇宙辐射环境、仪器自身性能的衰退或不稳定、固有的一些设计缺陷等,都会使其获取的数据中,包含大量的虚假数据[3]。此外,由于LMI是从云顶自上而下地对闪电产生的高强度、大面积“光斑”进行光学成像识别[4],而云作为一种光学介质,对闪电产生的光学信号的能量、持续时间以及时空特性等都会产生极大的干扰,进而直接影响到卫星闪电探测与定位的精度。在数据处理层面,由于LMI在设计上对标国际上首枚静止轨道星载闪电观测仪(geostationary lightning mapper,GLM),同样采用Event、Group、Flash三层级联树状结构的数据聚类处理方案[5],数据结构复杂,因此对其质量控制的方法,较以往常规气象观测资料有所不同,需要有针对性地开展研究。

对LMI广泛应用于闪电及强对流过程监测业务的Group数据(LMIG)开展基于多源数据多层次阈值判识技术的数据质量控制方法研究,通过个例分析与文献调研,定量研究LMIG数据与强对流天气过程云顶亮温、地基雷达回波强度间的关联关系,动态设定判识阈值。通过实例检验,并与第三方数据迭代比对,优化质控效果,有效提升LMIG数据质量。有助于推动中国星载闪电探测技术的探索和后续同类仪器的研制,促进LMIG数据的高质量应用,同时促进闪电与强对流过程、天气气候变化等领域的交叉研究。

1 中外研究现状

由于目前很难建设能够表征大尺度空间内全部闪电活动准确发生时间和地点的“绝对真值”数据集[6],因此主要利用多个不同闪电探测系统数据间的交叉比对,来开展闪电探测数据“相对”质量评估与控制工作。

国外学者在这方面开展了一定研究。Ushio等[7]发现传统的低轨道星载闪电探测仪(lightning imaging sensor,LIS)探测到了42个地面闪电当中的24个,同时发现其云闪平均定位误差为4.3 km,而地闪的平均定位误差为12.2 km;Lay等[8]从探测到的闪电回击发生的时间、地点和峰值电流强度三个方面,以巴西本地的一个地基闪电探测网络为参照,比对分析了WWLLN(world wide lightning location network)在巴西的探测效率;Zhang等[9]以星载OTD/LIS系统为参照,对比研究了2013年美国国家雷电探测网(national lightning detection network,NLDN)系统升级完成前后半个月内的闪电探测数据,发现NLDN的探测效率从42.9%提升到48.7%,并分析了原因;Thompson[10]以2010年1月1日—2011年6月30日(共18个月)期间,以WWLLN、地球总闪探测网络(earth networks total lightning network,ENTLN) 和星载OTD/LIS 系统在39°S~39°N,164°E~17°W期间的探测数据为研究对象,从季节、年份、闪电回击电流峰值三个维度,研究了它们的数据一致性关系和探测效率的差异;Thomas等[11]发现LIS探测到了新墨西哥研究机构128个放电当中的108个,且当他们向北移动LIS的定位位置6 km时,获得了最优的空间一致性;Finke等[12]认为空间间距不大于10 km,时间间距不大于700 ms的地基闪电回击(stroke)可以聚类为闪电(flash),进而开展星地数据综合比对;Boccippio等[13]研究了LIS和NLDN的数据得出结论:星地数据在分析闪电的时空分布特征上保持相对较稳定的对应性,且星载闪电探测系统,在探测云闪以及地闪后期放电能力上,优势更突出;Rudlosky等[14]以TRMM LIS数据作为参照,对商业化运行的GLD360(global lightning dataset)全球雷电探测网络的性能做了评估,发现在2012—2014年中,两套数据集年际间的匹配度逐年上升,且雷电定位精度之间的差异逐年缩小,能够与GLD360数据匹配的LIS flashes持续的时间往往更长(平均值达到了18.6 ms),闪电辐射覆盖的范围也更广(平均值达到了379.3 km2),而未能与GLD360数据匹配的LIS flashes,往往持续时间较短,而且闪电辐射覆盖的范围也更小,两项数值分别为6.1 ms和251 km2;Douglas等[15]对GLD360系统在网络升级及数据重处理算法优化后,相对于NLDN的闪电探测能力做了评价,如图1所示,升级后的GLD360探测的闪电密度远远高于NLDN,前者是后者的5倍多,且其平均数据获取延迟仅为35 s,平均定位精度1 km,误差在 0.5 km范围内;Maribel[16]综合分析GLM、NLDN和GLD360系统,针对flash(闪电)级别的数据,在气候学尺度强风暴和非强风暴较小样本中进行了比较。结果表明:GLM的总闪探测效率在其视场边缘有明显的下降,且在强风暴中,GLM的探测效率降低明显,同时分析了光辐射能量及卫星平台姿态角等因素,对GLM探测效率的影响。

中国星地闪电数据质量控制的相关研究起步较晚。崔逊[17]以江苏省闪电定位系统、国家雷电监测网、星载OTD/LIS系统的数据为比对参照,分析了全球闪电定位系统WWLLN在江苏省、全国,甚至是全球的闪电探测效率和探测精度;邓雨荣等[18]基于2005—2010年间OTD/LIS闪电探测数据,评估了同期WWLLN在全球和三大闪电高发区(非洲、南北美洲和东南亚地区)的探测效率,并对其变化趋势进行了讨论;惠雯等[19]利用OTD/LIS系统和全国雷电定位系统的资料,分析了两者在2008—2013年间观测到的中国西南地区闪电时空分布特征差异。姚尧等[20]基于鄂西三峡一带LIS探测数据,对相应的地基电网雷电探测系统性能做了分析,结果表明,星地两套系统在研究区间内数据一致性良好,对于地闪的定位误差平均为11 km,且两者对于不同位置发生的闪电,具有不同的探测能力。高慧婷等[3]针对LMI L0级数据中不同类型的噪声,分别提出了不同的滤除方法,最终形成了一套LMI闪电事件虚警滤除的系统方法,并在两次典型雷电过程中,通过与地基数据比对进行了验证。陈亚芳[21]依据不同的空间像元分辨率,将LMI观测区域进行细分,确立了不同的闪电数据聚类方案,并通过和相应的WWLLN数据、风云二号E星(FY2E)云顶亮温资料比对,探讨了LMI在不同时空分辨率区域的探测效力;张晓黄等[22]基于贝叶斯概率判识原理,设计了一种通用的、高效的LMI L0级数据虚假信号滤除算法,并与2017年8月8日一次典型雷暴过程中的同期WWLLN数据、FY2E云顶亮温数据、雷达回波资料进行了交叉比对验证。

图1 系统升级与数据重处理算法优化后,GLD360系统与NLDN系统探测到的闪电密度对比Fig.1 Comparison of lightning density detected by GLD360 system and NLDN system after system upgrade and data reprocessing algorithm optimization

从以上中外的相关研究可以看出,对于以LMI为代表的中国静止轨道星载闪电成像仪观测数据系统的质量控制方法探索,依然任重道远。在此背景下,对于LMI广泛应用于强对流天气临近预警业务、中国地区闪电活动特征监测业务的L2 级1 min定量Group数据(LMIG),开展质量控制技术研究。

2 质量控制技术

海量的LMI星载闪电观测数据,首次提供了卫星“视角”下中国及周边海域内的闪电活动特征信息,为相关业务应用与科学研究,提供了重要的资料保证。这些新资料的质量,是其有效应用的前提和基础[23],因此,对其开展系统的质量控制,尤为重要。

如前所述,卫星闪电观测系统的特点,决定了星载闪电资料的质量控制难度较大,且与以往气象观测资料质量控制方法有所不同[24],因此需要有针对性地开展研究。基于LMI的数据结构组织关系,对于LMIG数据,依托闪电活动与强天气过程间的耦合关系,通过典型实例,构建判识阈值集合,提出了基于多源气象资料的多层次质量控制方法。此外,将质控后的数据与商业第三方数据比对,对质控效果评估及优化,进一步剔除误差数据,更全面、更系统地提升LMI数据和产品的质量。同时挖掘了星载闪电数据对强对流天气预测的指示意义,更好地促进对LMI数据的认识和应用,更好地推动我国星载闪电观测数据的高质量应用。

2.1 质量控制技术框架

基于“星地两种大尺度空间闪电观测手段的关联性”“强对流天气云顶亮温的分布特征与其所伴随的闪电活动之间的关联性”“雷达回波强度变化特征与闪电发生的关联性”等依据,遵从“相同时空区间关联气象资料内部一致性检查”的总体思想,结合文献研究与实例分析,选取强对流天气过程多源资料一致性判识阈值,设计基于多源资料的多层次LMI数据质量控制技术框架,如图2所示。

首先,依据不同的存储路径,依次读取所需多源资料:LMIG数据、国家雷电监测网地基闪电观测数据、新一代多普勒天气雷达回波强度数据、FY-4A卫星多通道扫描成像辐射计(advanced geosynchronous radiation imager,AGRI)L1级数据(分辨率4 km)中提取的云顶亮温(temperature of brightness blackbody,TBB)数据、维萨拉GLD360全球闪电探测中国区域资料(DEMO版)。其次,完成数据预处理。在星地海量观测数据中,完成时区统一、卫星资料行列号与经纬度的转换,提取“一致性分析”时空区间内的数据和关键信息。基于敏感度实验,选取星地闪电探测数据时间间隔≤1 s,空间经度间隔≤0.2°、纬度间隔≤0.2°,作为两者一致性分析的时空窗口,即在此范围,认为星地是对同一次闪击过程的探测,具有比对研究价值。

图2 基于多源资料的多层次LMI数据质量控制技术框架Fig.2 Multi-level LMI data quality control technology framework based on multi-source data

将时间间隔前后10 min之内,空间间隔为0.05°×0.05°网格,作为TBB资料、雷达回波强度资料与LMI资料一致性分析的区间。上述工作完成后,开展三个层次的LMI数据质量控制进程。第一次质量控制,将LMI资料,与国家雷电监测网地基闪电资料按时空窗口,进行逐一滑动比对,若两者匹配成功,则认为该闪电同时被星地闪电探测系统捕获,LMI探测的数据是真实的闪电数据,否则启动第二层次质控进程;第二次质量控制,为减少星地闪电探测系统的差异性产生的“漏检”现象,需要在行列信息与经纬度的转换后,将星载闪电数据与同期FY-4A AGRI提供的对流云团TBB信息进行叠加比对,通过阈值判识,识别出被漏检的真实闪电数据;第三次质量控制,将星载闪电数据与同过程雷达回波强度资料进行比对,若满足判识阈值,则认为是真实闪电数据;若不满足阈值的数据,暂定为虚假闪电数据。最后,因维萨拉GLD360全球闪电探测系统数据是独立的商业化雷电探测数据,拥有严苛且稳定的质量把控流程,且与LMI一样,能够实时不间断地探测所覆盖的网络内部全部闪电类型(总闪),故将其作为比对的参考真值,认为其能够获得相对所有的真实闪电信息。将第三层次质控后,被暂定为虚假的闪电数据,与同期维萨拉GLD360数据比对。若依然有匹配成功的数据,则返回第二层次和第三层次,调整TBB资料和雷达回波强度资料进行闪电判识的阈值,经过不断的迭代比对,直至LMI数据与维萨拉数据匹配稳定,则质控算法收敛,完成星载闪电数据质量控制全部进程。

2.2 多源资料判识阈值选取

如前所述,基于多源资料的多层次LMI数据质量控制技术框架中,FY4A TBB资料和雷达回波强度资料与真实星载闪电数据关联判识阈值的选取,至关重要,直接关系着数据质控的科学性。

因此,为了更科学地设定判识阈值,基于一次典型天气过程中,星地闪电观测数据、同期FY4A AGRI TBB数据、雷达回波数据,通过综合分析,挖掘它们之间的“一致性”关联,同时结合大量文献研究,综合设定适当地判识阈值。

以2018年6月13日发生在山东北部地区的一次降雹过程为例开展综合分析。2018年6月13日5:00—23:00(北京时间,下同),受华北冷涡影响,环流低层暖湿高层干冷,山东出现一次大范围强对流冰雹天气过程:8:00时500 hPa冷涡中心位于河北北部,山东处于冷涡的东南象限,冷涡随后从内蒙古中部经山西和河北,携带强烈的干冷空气侵入山东;850 hPa温度脊位于河北东北部,经山东进入河南境内,20 ℃的暖中心位于鲁、豫、皖、苏四省交界处。受其影响,西北部、中部和山东半岛南部出现大范围8级以上的雷雨大风,其中青岛站最大风速达12级(极值风速34.8 m/s),并观测到10次冰雹过程。

图3给出了此次强对流过程中6个时次FY4A TBB分布与该时刻前后各30 min内,星载闪电数据的叠加。可以看到,TBB分布的变化趋势,与闪电活动有着较强的关联。在TBB≤-32 ℃的小范围区域,对流活动初生,同期的闪电活动零星发生,且星地探测到的闪电活动发生位置基本一致。随着对流强度的进一步增加,当TBB≤-55 ℃时,北部对流云逐渐增多,对流活动逐渐旺盛,闪电活动频次也明显增加,同时地面开始观测到冰雹,地面降雹处(山东省滨州市无棣县)位于TBB梯度较大且地闪密集区域。随着对流活动区域逐渐南移,山东省滨州市阳信县观测到地面降雹,TBB低值范围进一步扩大,同期闪电活动也更加频繁,其中卫星闪电密集区位于地闪密集区东侧。随着对流天气系统逐渐向东南方移动,对流云团面积进一步扩大,TBB更低,最低极值达-60.3 ℃,可以看出,-40 ℃以下的TBB低值区连成NE-SW向的深对流活动带,此阶段对流活动最为活跃,降雹过程最为显著,共观测到8站次冰雹,主要集中于闪电密集区内部或周边。随后,对流系统继续向东南移动,TBB≤-42 ℃的面积不断减小,对流活动也逐渐减弱,相应的闪电活动也开始减少。

“○”为星载LMI观测的闪电次数;“+”“-”分别为地基观测的正负地闪次数;“◇”为冰雹发生处图3 FY-4A云顶亮温TBB与其前后30 min内星地观测的闪电分布Fig.3 FY-4A Temperature of brightness blackbody and the lightning distribution satellite-based and ground-based within 30 minutes

图4给出了6个典型时刻的多普勒雷达回波强度叠加对应时刻前 6 min内的闪电活动分布,可以发现二者之间存在较好的关联关系。降雹发生前,滨州西北部地区约50 km处,有一块对流云团快速向东北方向发展,最大回波强度>55 dBz,星地观测到的闪电活动分别位于强回波中心的前方和中心位置处。降雹期间,滨州西北部阳信县雷达回波强度超过60 dBz,且向东北方向移动的强回波强中心前端的回波强度梯度增大,此时星地观测到的闪电频数均显著增加,阳信县开始出现冰雹;随着高于45 dBz的雷达强回波区域不断加强并向南移动,60 dBz以上的超强雷达回波区面积继续加大,星载LMI观测的闪电活动密集地出现在强回波中心的前方。随着降雹过程进入尾声,强雷达回波带逐渐移出滨州,高于45 dBz的强回波区也随之移出潍坊,此时星地观测的闪电活动频数呈明显下降的趋势。

“○”为星载LMI观测的闪电次数;“-”为地基观测的负地闪次数;“+”为地基观测的正地闪次数图4 雷达回波强度与星地观测的闪电分布间的关系Fig.4 The relationship between radar echo intensity and lightning distribution satellite-based and ground-based

此外,如图5所示,分别对2019年8月9日LMI数据中,10:00—11:00、17:00—18:00、22:00—23:00(均为北京时间)三个典型时段对应的TBB小时累积概率变化进行分析,发现90%以上的闪电活动,都分布于小于或等于-33 ℃(240 K)云顶亮温的区间内。

因此,结合典型个例分析与大量文献成果,本文将240 K作为基于TBB对LMI质量控制的判识阈值,若小于等于该值,则判定同期观测的LMI闪电数据真实,否则判定为虚假;将35 dBz作为基于雷达回波强度对LMI质量控制的判识阈值,若大于该值,则判定同期观测的LMI闪电数据真实,否则判定为虚假。此外,考虑到不同天气过程个例间的差异性,本文确立动态阈值方案,通过不断地迭代,灵活修正阈值,实现阈值的定制化调整,以提升质控算法的科学性和适应性。

图5 不同时段小时TBB值累积概率变化曲线Fig.5 Cumulative probability change curve of hourly TBB value at different time periods

3 质量控制实验

以2019年8月9日17:00—18:00(北京时间,下同)LMI探测的中国闪电LMIG L2定量数据(共计3 759个样本数据)为例,依据前文述质量控制技术框架及判识阈值,开展基于多源资料的多层次数据质量控制实验,其结果显示:针对3 759个LMI闪电观测样本数据,第一次质控,保留了2 885个闪电数据,认为其同时被中国星地闪电观测系统观测到,为真实的闪电数据,有效闪电探测数据占比76.75%;;第二次质控,在第一次质控剔除的虚假数据中“找回”漏检的133个真实闪电数据,有效闪电探测数据占比提升至80.29%;第三次质控,在第二次质控剔除的虚假数据中“找回”漏检的46个数据,满足相应的雷达回波强度判识阈值,因而重新被判定为真实闪电数据,有效闪电探测数据占比上升为81.51%。

将上述三次质控的结果(共计3 064个真实闪电数据),与独立运行的商业化网络——维萨拉GLD360全球雷电定位系统同时空区间的探测数据进行比对,对质控效果不断迭代优化。

将两类闪电观测数据经过时区统一、经纬度与行列号转换等一系列预处理后,不断调整质控判识条件的阈值,按照时空一致性区间,进行匹配分析。通过分析6次迭代过程,两种闪电数据的分布比对情况可以看出,随着TBB与雷达回波强度判识阈值的不断调整,经过6次迭代后,两套系统闪电探测数据匹配成功的比例从开始的41.48%稳步提升,直至达到81.33%时,匹配成功的比例不再随着判识阈值的改变而变化,算法收敛。收敛时,采用的TBB质控判识阈值为242 K,雷达回波强度质控判识阈值为37 dBz。即经过多源资料的多层次质量控制,识别并剔除了LMI观测数据中约18.67%的虚假数据。此外,可以看出,算法收敛时,LMI最终所保留的有效闪电数据与维萨拉数据在中国境内的匹配度较高,而匹配失败的数据,主要分布于中国境外周边区域,这与LMI探测效率在视场边缘有所下降有一定的关系。

4 结论与讨论

可信赖的闪电星载观测数据,是相关气象科学研究、业务应用的首要保证。由于LMI是中国首枚、世界领先的星载闪电光学观测载荷,其数据级别的复杂性和特殊性,需要开展有针对性的质量控制研究。基于LMI的数据组织关系,对于其LMIG L2级数据,提出了一种基于多源气象资料的多层次质量控制方法。通过典型个例分析与大量文献调研,确立多源资料不同的判识阈值,再分别基于同期地基国家雷电监测网闪电观测资料、FY4A卫星云顶亮温(TBB)资料、新一代多普勒天气雷达回波强度资料,构建星地多源资料三层次LMI数据质量控制技术框架,避免了“过度质控”。并通过与第三方数据比对,不断调整判识阈值,不断优化算法,直至收敛。此外,通过实例,验证了该质控技术的有效性和可行性。

当然,由于不同个例间的差异性较大,所确立的质控判识阈值仅仅适用于本研究的样本数据,为了提高算法的灵活性和科学性,通过修改程序参数,质控判识阈值可以根据不同天气过程的数据特征进行自主设定并辅以验证。

本文工作为中国星载闪电探测数据质量控制提供了思路,为下一代卫星闪电成像仪研制技术的提升提供了参考,有助于推动中国星载闪电探测技术的发展和多源数据综合应用。

猜你喜欢

阈值观测雷达
浅谈雷达导引系统
改进的软硬阈值法及其在地震数据降噪中的研究
国外智能化对地观测卫星发展研究
土石坝坝体失稳破坏降水阈值的确定方法
基于小波变换阈值去噪算法的改进
隐形飞机哪里躲
改进小波阈值对热泵电机振动信号的去噪研究
基于“地理实践力”的天文观测活动的探索与思考
2018年18个值得观测的营销趋势
班上的“小雷达”