APP下载

Bland-Altman法在湖南省区域站降水一致性分析及应用

2022-04-11钟艳雯朱亮夏正龙朱宏武欧阳计跃

电脑知识与技术 2022年5期

钟艳雯 朱亮 夏正龙 朱宏武 欧阳计跃

摘要:“天擎·湖南”的区域站降水分钟数据存在多个获取途径且数据不完全相等,测试选取了不同来源、不同数据频次、相同数据频次的3组降水数据,使用Bland-Altman、数值比较等方法,检测了天擎中不同来源的降水分钟数据一致性及完整性,为数据的应用提供参考与依据。结果显示所有接口小时数据完全一致,逐小时累加值与日值完全一致;分钟数据大部分样本值处于95%置信区间内,一致性较好,但是达不到完全一致。数据完整性仅有第二组完整性良好。

关键词:降水1;一致性2;Bland-Altman3;天擎4

中图分类号:TP311          文献标识码:A

文章编号:1009-3044(2022)05-0028-04

准确的降水资料对于气象业务至关重要,目前中国气象局气象建立了大数据云平台(“天擎”)为气象部门提供统一数据服务,天擎提供的降水数据中包括了分钟级降水数据,高频次、低时延的分钟级降水数据对于预报预警、防灾减灾作用尤为明显,同时也是业务应用与大气科学深入研究的基础。但是分钟降水数据存在与小时数据、日值数据不一致情况。多位学者或从地面气象测报业务软件、降水测量仪器、风场变形与微量降水等方面对降水误差进行分析与处理研究 [1-5],或是通过将测站降水与TRMM估测降水、卫星、雷达等对比进行评估校验 [6-8]。但是基于气象大数据云平台进行的降水一致性研究还较少。

2020年12月湖南省气象大数据云平台即“天擎·湖南”(以下简称天擎)正式上线投入业务试运行。天擎为用户提供了统一、便捷的数据服务,同时还提供兼容接口,保障使用CIMISS(全国综合气象信息共享平台)接口的业务应用平滑过渡、无缝对接。但是在使用过程中发现天擎接口、天擎兼容接口(以下简称兼容接口)的区域站降水分钟数据存在多个获取途径且数据不完全相等,因此本文选取了同一时段同一站点不同来源、同一时段同一来源同一站点不同数据频次、同一时段同一来源同一站点同一数据频次3组降水数据,对天擎的湖南省区域站降水数据进行一致性分析。

1 数据与方法

1.1 数据选取

按照国際惯例,气象观测数据采用协调世界时(UTC),因此本文涉及的数据样本时间为UTC。降水量单位为mm,取一位小数[9-10]。时间选取原则为时间段在某日00时00分至次日00时00分之间,并且该时间段内有降水值。数据选取原则为分钟数据无长时间缺测;小时数据与日值数据无缺测、无更正报且质控码为正确。

对比参照数据为进行了质量控制的区域站1小时降水数据与08-08时降水量日值数据。小时降水来源为天擎接口SURF_CHN_MUL_HOR(中国地面逐小时资料)PRE_1h(过去1小时降水量)要素值;日值降水来源为天擎接口SURF_CHN_MUL_DAY(中国地面日值资料)的PRE_Time_0808(08-08时降水量)要素值。

1.2 数据对比

1) 不同来源对比

本组测试选取天门山站点(P1801)2021年8月12日00时至8月13日00时天擎接口与兼容接口降水数据进行对比, 测试不同数据来源不同接口的数据一致性。兼容接口无SURF_CHN_MUL_MIN(中国地面分钟数据),因此进行4组样本的对比。

样本1:逐小时降水量,来源为兼容接口SURF_CHN_MUL_HOR(中国地面分钟数据),要素名:PRE_1h。

样本2:逐分钟降水量1小时累加,来源为兼容接口SURF_CHN_PRE_MIN(中国地面分钟降水实时资料),要素名:PRE,每小时数量:60。

样本3:逐5分钟降水量1小时累加,来源为天擎接口SURF_CHN_MUL_MIN(中国地面分钟数据),要素名:PRE,每小时数量:12。

样本4:逐分钟降水量1小时累加,来源为天擎接口SURF_CHN_PRE_MIN(中国地面分钟降水实时资料),要素名:PRE,每小时数量:60。

逐小时降水值与对应时次的分钟累加降水值如下:

2) 不同数据频次对比

本组测试选取马迹塘镇百乐村站点(P2842)2021年8月24日00时至8月26日00时降水数据进行对比,测试不同数据频次的数据一致性。

样本1:逐5分钟降水量1小时累加,来源为天擎接口SURF_CHN_MUL_MIN(中国地面分钟数据),要素名:PRE,每小时数量:12。

样本2:逐分钟降水量1小时累加,来源为天擎接口SURF_CHN_PRE_MIN(中国地面分钟降水实时资料),要素名:PRE,每小时数量:60。

3) 相同数据频次对比

铜官站点(P5114)已经实现了1分钟观测数据接入,本组测试选取天擎接口该站点2021年8月12日00时至8月13日00时、8月24日00时至8月25日00时降水数据进行对比,测试同一数据频次的数据一致性。

样本1:逐分钟降水量1小时累加,来源为天擎接口SURF_CHN_MUL_MIN(中国地面分钟数据),要素名:PRE,每小时数量:60。

样本2:逐分钟降水量1小时累加,来源为天擎接口SURF_CHN_PRE_MIN(中国地面分钟降水实时资料),要素名:PRE,每小时数量:60。

2 结果分析

2.1 一致性

Bland-Altman法是近年来在定量数据一致性评价方面得到广泛认可的方法之一,它将一致性界限的定量分析与散点图分布的定性描述相结合, 能够直观地定量和定性地考察数据间的一致性。以下分析图中横坐标为参照值与样本的均值,纵坐标为参照值与样本的差值。Mean为差值的均值,差值的±1.96倍标准差(±1.96*SD)之间为置信区间[11-13]。

一致性测试方法为:剔除无降水时次后,使用Bland-Altman法对小时降水量与对应时次60分钟累加降水量进行一致性检验;以日值为参照值与24小时累加降水量、1440分钟累加降水量进行对比。

1) 不同来源对比

由上图可见样本1与参照值完全一致,样本2-4均有偏倚值,样本2、4一致性较好。11个时次中,小时降水一致性:参照值=样本1>样本4>样本2>样本3。

日值与逐小时累加值、分钟累加值对比结果如下:

由测试结果可见日值与逐小时累加值完全一致,日值与分钟累加值样本2、3、4均有偏差,其中与样本3偏差较大。一致性:参照值=样本1>样本2>样本4>样本3。

2) 不同数据频次对比

由上图可见样本1、2均有不一致值;样本1完全一致率仅有9.1%,在降水较大时偏倚较大。22个时次中,小时降水一致性:样本2>样本1。

日值与逐小时累加值、分钟累加值对比结果如下:

由测试结果可见日值与逐小时累加值完全一致,日值与分钟累加值样本1、2均有偏差,其中与样本1偏差较大。一致性:参照值=天擎小時降水>样本2>样本1。

3) 相同数据频次对比

由上图可见样本1、2均有不一致值;29个时次中,小时降水一致性:样本2>样本1。

日值与逐小时累加值、分钟累加值对比结果如下:

12日日值数据为29.6与天擎小时降水、样本2累加值相等,13日为142.6,与天擎小时降水累加值相等、与分钟累加值样本1、2均有偏差。一致性:参照值=天擎小时降水>样本2>样本1

2.2 完整性

完整性计算公式为:

S=(∑X/∑Y)*100%

其中,S为完整率,X为样本实际数量,Y为样本应收数量。各组测试结果如下:

3 结论与应用

3.1 结论

1)所有接口小时数据完全一致,逐小时累加值与日值完全一致。分钟数据大部分样本值处于95%置信区间内,一致性较好,但是达不到完全一致。不仅兼容接口分钟降水数据与天擎接口分钟降水数据不完全一致,天擎接口之间的分钟降水数据也不完全一致。总体一致性逐分钟降水高于逐5分钟降水。

2)数据完整性仅有第二组完整性良好。其中天擎接口SURF_CHN_MUL_MIN(中国地面分钟数据)分钟数据缺失较多。

3)综合比较结果,天擎接口SURF_CHN_PRE_MIN(中国地面分钟降水实时资料)的分钟降水数据一致性、完整性较好。

4)由于兼容接口仅提供最近10天的分钟降水数据,天擎接口仅在2021年7月5日之后能获取31站1分钟的降水数据,同时要综合考虑降水、缺测、质控、更正等因素,样本的选取范围受到一定限制。本研究还需要大量的、长序列的数据对结果进行进一步验证。

3.2 应用

分析结果已应用于湖南省气象业务内网平台(简称内网平台)中。内网平台在计算任意时段分钟降水累加时尽量使用小时或日值数据替换对应时次的分钟降水值以提高准确性;同时在降水数据展示与分析时,结合每个要素的质控码,提供“正确”“可疑”及“错误”数据质量组合选项,满足用户在总结汇报、形势分析、预警发布等不同的应用场景的需求。以天门山站点为例,8月12日00时00分至13日00时00分的分钟累加降水、小时累加降水、08-08时日值降水均为103.3mm,详见图10。

本研究检测了天擎中不同来源的降水分钟数据一致性,为降水分钟数据的应用提供参考与依据,同时希望研究成果能够助力分钟降水数据的完整率、可用率的提高,依托“天擎·湖南”提供更加客观、准确的高质量地面气象观测数据。

参考文献:

[1] 丁善文,王玉河,朱霞.OSSMO软件数据维护中降水不一致现象分析与处理[J].山东气象,2013,33(2):36-38.

[2] 吴宜,刘西川,张军,等.Parsivel激光雨滴谱仪与雨量计观测降水的一致性分析[J].气象科技,2020,48(2):147-153.

[3] 何纯丽,肖斌.自动站降水误差存在的原因和处理方法的探讨[C].广西气象学会2014年学术年会.广西气象学会, 2014.

[4] 李娜,李毅,张文萍.湖南省降水量观测误差分析及其校正[J].水电能源科学,2017,35(2):21-23,57.

[5] 谭玉坤.降雨资料一致性检验实例计算分析[J].科技创新与应用,2016(3):223.

[6] 罗布坚参,翟盘茂,假拉,等.西藏高原测站降水与TRMM估测降水一致性评估[J].气象,2015,41(9):1119-1125.

[7] 杨星,王永前,刘志红.四川省2013年夏季卫星降雨数据的对比研究[J].高原气象,2016,35(4):1039-1049.

[8] 李雁,张乐坚,梁海河,等.天气雷达与地面自动站降水观测一致性校验分析[J].气象科技,2013,41(3):436-442.

[9] 中国气象局.地面气象观测规范[M].北京:气象出版社,2003.

[10] 中国气象局监测网络司.气象信息网络传输业务手册[M].北京:气象出版社,2006.

[11] 宁铮美.Bland-Altman分析法在两种化学发光仪器一致性评价上的应用案例[J].运动精品,2018(2):52-54.

[12] 万毅,潘峰,杨喆,等.自动血压计测量值一致性评估方法的应用[J].医疗卫生装备,2010,31(1):17-18,24.

[13] 朱令宇,李永杰,张蒙生,等.Bland-Altman法在烟草测量仪器一致性评价中的应用[J].中国仪器仪表,2009(5):82-84.

【通联编辑:梁书】

收稿日期:2021-08-24

基金项目:湖南省气象局2017年气象业务内网平台项目

作者简介:钟艳雯(1976—),女,广西柳州人,高级工程师,硕士,研究方向为气象信息技术应用;朱亮(1986—),女,湖南双峰人,高级工程师,硕士,研究方向为气象信息技术应用;夏正龙(1980—),男,江苏省建湖人,高级工程师,硕士,研究方向为气象信息技术应用;朱宏武(1978—),男,湖南常德人,高级工程师,博士,研究方向为气象数据处理;欧阳计跃(1970—),女,湖南冷水江人,高级工程师,学士,研究方向为气象信息技术应用。