APP下载

应用AdaBoost 提升Boosting 算法的专业气象集合预报系统

2019-11-22郭海峰刘瑞琪廖春花

海峡科技与产业 2019年5期
关键词:格点气温气象

郭海峰 刘瑞琪 陈 浩 廖春花

1.湖南省气象服务中心,湖南 长沙 410118

2.气象防灾减灾湖南省重点实验室,湖南 长沙 410118

3.国网湖南省电力公司,长沙 410014

气象数值预报是在当代大气科学理论成果、当代计算机技术与大气遥感技术基础上建立起来的现代气象预报技术,是气象预报向定量、定时、定点方向发展的一种方式,从而满足国家与社会各种需求的科学途径,对国家经济建设与社会发展有重要意义[1-2]。

经过近一个世纪的发展,数值天气预报取得了巨大的进步,预报准确率有了很大提高,并且由传统的单一确定性预报向集合数值预报方向发展。如今集合数值预报应用的领域不断拓宽, 从最初的全球中期集合预报延伸到有限区短期天气预报、月季年短期气候预测、台风(飓风) 路径预报、中小尺度极端天气预报等方面[3]。同时, 在洪水预报、空气质量预报等专业预报领域也开展了集合数值预报的应用研究[4-5]。

Boosting 是提高预测学习系统预测能力的有效工具,也是组合学习中最具代表性的方法[6-10]。 其代表算法可分为Boost—by majority 和AdaBoost 两个系列。Boosting 操纵训练例子以生成一系列互补型的专家模型,从而建立通过投票结合的预测器集合,然后通过AdaBoost 算法来计算各个专家占有的权重,通过迭代修正各专家权重的方式让预测结果无限接近实况值。这些专家相当于各个数值预报模式,因此该方法在多模式集成预报方面有很好的性能。为了更好地发挥精细化气象格点预报业务产品的作用,依托本地天气预报数据库(LWFD)、全国综合气象信息共享系统(CIMISS)等系统,为专业气象预报人员提供基于数值预报结论的学习素材预报平台,设计建立应用AdaBoost 提升Boosting 算法的专业气象集合预报系统(以下简称“专业气象集合预报系统”),实现各数值预报模式和集合后的精细化格点、要素的流域、交通、旅游等专业气象预报的实时显示、调阅、查询、订正以及质量检验功能,并保证作为业务系统的安全可靠,性能稳定,功能扩充。

1 系统设计

专业集合预报系统应用AdaBoost 算法提升Boosting算法的性能,将欧洲中期天气预报中心(以下简称EC)、日本气象厅(以下简称JAM)、华东区域气象中心(以下简称华东模式)、华南区域气象中心(以下简称华南模式)、全国智能网格(以下简称智能网格)5 种数值预报的模式预报结果,根据各自的预报准确性给予不同的权重进行集合,提高预报准确率。专业气象预报员可选择任意时次、任意范围或任意行政区划来对集合结果进行订正,订正时只需修改所选范围内的最大值和最小值,系统会自动根据比例匹配到各个格点值,同时自动修改与之关联时次的格点值。简单易操作,并且能进行实时检验评分,可以实时查看单模式、多模式集合以及预报员订正后的预报结果,有利于预报员订正预报数据、检验预报结果、提高预报质量。

专业集合预报系统包括数据处理、预报产品制作和后台管理3 个部分,数据处理实现预报产品数据的整合、处理和入库;预报产品制作实现EC、JAM、华东模式、华南模式、智能网格5 种预报模式预报的集合、查询、修正、产品制作生成和评分管理;后台管理实现站点和用户信息的增加、删除和编辑功能,系统业务功能如图1 所示。

图1 专业气象集合预报系统业务功能图

2 系统实现

2.1 数据采集与处理

数据信息采集主要是通过构建动态的基础数据信息采集工作机制、采集地理信息数据、社会经济信息数据、气象服务产品、业务产品等资料。 支持文件、XML、数据库、FTP(文件抓取协议)、HTTP(超文本抓取协议)等多种接口方式的数据采集。根据采集规则、数据类型、采集周期,自动采集到数据后,按规则存储到基础数据库或文件服务器上,实现按规则和类别自动化采集相应数据的目的。

服务信息采集主要是针对来自预报系统的预报结果和各类报文进行采集和加工。通过读取国家气象局的指导产品,主要是发布的预报结果和报文,分析预报结果、解析报文,形成产品的制作内容。

反馈信息采集主要是针对来自上级发布渠道的反馈信息和本地发布结果数据,以及预警发布效果信息的汇总和预统计。对气象部门内部的各类观测资料和数据进行采集和分类,将观测和测报业务中常见现象进行自我统计和预处理存储并入库。

2.2 组合行算法集合预报

专业集合预报系统通过AdaBoost 方法进行数据迭代,模式占有的权重算法流程如图2 所示。

图2 集合预报实现流程

Boosting 方法是一种用来提高弱分类算法准确度的方法,这种方法通过构造一个预测函数系列,然后以一定的方式将他们组合成一个预测函数,流程如图3 所示。通过对样本集的操作获得样本子集,然后用弱分类算法在样本子集上训练生成一系列的基分类器。用来提高其他弱分类算法的识别率。主要为两个部分,更新采样权重值D 和计算分类器权重α,前者使得原来分错的样本再下一个分类器中能够有较大的概率出现,从而提高原来分错样本之后分对的概率;后者根据分类器的表现,赋予不同弱分类器不同权值,最后得到一个加权的强分类器。不断地迭代更新能使得最终的结果无限接近最优分类。

图3 Boosting 的流程图

通过以上组合行算法,将EC、JAM、华东模式、华南模式、智能网格以及湖南省智能网格单要素进行集合预报模拟,最终输出结果如表1,该算法能够准确地对各单个模式权重及权重系数进行智能化调整,使得最终的集合预报结果误差率最大仅为7.1%。

表1 组合行算法集合预报例

2.3 精细化格点预报修正编辑功能

通过与LWFD 的对接,实现预报底稿下载和修正过后的预报数据上传,数值支持Micaps 第4 类和grib2格式。实现数据分屏展示,分屏显示格点预报、站点预报、预报气温变化、降水量、天气现象等信息。支持格点预报编辑,具有单个格点修改、绘制落区进行填值、等值线形状、撤销、重置、本地数据导入、关键点数值修改反馈至格点。对预报结果可进行一致性检验,如:最高气温值不能低于最低气温值,格点预报气温值不能高于站点的最高气温值也不能低于站点的最低气温值。格点编辑超出范围时,应该在格点预报上以醒目的颜色显示站点最高或最低气温值。格点温度预报修改订正功能如图4 所示。

图4 格点温度预报修改订正功能

2.4 预报模式的实时预报评分检验方法

提供 EC、JAM、华东模式、华南模式、智能网格5 种预报模式的实时预报评分功能。 在指定时间,以要素实况数据及要素预报数据为基础,对各类要素产品进行检验。

2.4.1 降水预报检验方法

逐日检验只评定是否正确和是否属“空、漏”报,并保存每日预报与实况资料。月、季、年检验依据当月、季、年的预报正确总次数、空报总次数、漏报总次数,分别计算一般性降雨、暴雨以上和晴雨预报的TS(预兆评分threat score)、空报率、漏报率。

式中PO 为空报率、FAR 为漏报率、NA 为预报正确站(次)数、NB 为空报站(次)数、NC 为漏报站(次)数。

2.4.2 气温预报检验方法

逐日检验计算绝对预报误差,分别将气温预报误差≤2℃、3℃的百分率记为气温预报偏差≤2℃正确、气温预报误差≤3℃正确,并保存每日预报与实况资料。月、季、年检验依据当月、季、年的每日预报与实况资料计算预报准确率,平均绝对误差采用月、季、年的平均值。

其中,N 为站点总数,Fi为第i站(次)预报气温,Oi为第i站(次)实况气温,Nr可分别表示为≤2℃、3℃时预报正确的站(次)数,Nf为预报的总站(次)数。气温预报准确率的实际含义是气温预报误差≤2℃、3℃的百分率。

此外,当用Nr可分别表示为气温预报误差>5℃、10℃预报的站(次)数,应用预报准确率公式可以评定气温预报误差>5℃、气温预报误差>10℃的百分比。

2.5 专业气象服务产品制作生成

专业集合预报系统支持GIS 色斑图等形式的展示和导出[11-12]。基于湖南大型水库流域、高速公路、电网线路、旅游景点等GIS 底图的降水、气温、平均相对湿度、大雾、电线覆冰、道路结冰色斑图绘制和自动生成。标题可选择模版,也可修改,图例和落款自动生成,图形可保存输出。各类图形产品为流域面雨量预报等专业气象服务提供产品制作支撑,如图5 所示。

图5 流域面雨量预报产品制作

2.6 易维护性设计

在软硬件的设计实现上要考虑系统长期运行的稳定性和可靠性。软件在运行期间,针对任何一个重要操作,都具有判断错误的能力,必要时可以进行恢复性操作,否则就发出报警消息,以便于人工干预。

上线试运行测试通过后,基础数据平台系统将进入长期业务运行状态。无论是计算机硬件系统还是软件系统都具有较高的可靠性和故障后快速恢复的能力。

应用软件开发应严格遵循软件工程国标、军标的开发、测试和集成规范,制定合理的数据处理、预报预警服务产品生成规范,加强对多种观测资料在预报预警业务中的应用,强化对灾害天际的实时监视能力和对灾情的分析评估能力。

在支撑平台可靠性的保证下,关键高可用业务系统在3 min 内恢复运行状态。 服务器端系统应满足7×24 h 运行稳定可靠,服务器端系统每年累计故障时间不能超过8 h。

3 结语

专业集合预报系统较为以往的平均方式、方差计算方式等集合预报算法进行了改进,采用提升Boosting与AdaBoost 进行计算,建立投票方式的预测结果及权重系数,多方面提高集合预报准确性。系统在预报准确率评分方面,采用国家局LAPS 个点实况对于各个模式进行格点评分,较为以往插值站点评分来说,评分更为精准,利用率也更为广泛。系统对于专业服务对象采用灵活录入方式,可以根据点、面、行政区域等方式,灵活选择各种模式预报结论,结合服务对象,快速制作各类专业预报。整个系统均响应国家局分布式环境[13]方式。所有数据不留存原始数据,把原始数据来源统一为分布式环境,大大提升了各个模式预报获取速度,服务响应速度,节省空间占用。

后期可增加动态底图服务产品,用户通过导入底图,选择服务产品生成方式等多样化的组合,从而制作图文类服务产品,提高专业服务质量。建立各个模式的准确率与评分大数据,通过分析得出每种模式的历年准确率,季度准确率,时段准确率,结合算法,可进一步提升集合预报的准确性。增加行政区划分级用户管理,可将系统扩展至市县级,从省级系统到市县级系统进行延伸,以支撑全省各级的专业气象服务业务。

猜你喜欢

格点气温气象
带有超二次位势无限格点上的基态行波解
基于FY-3D和FY-4A的气温时空融合
气象树
一种电离层TEC格点预测模型
《内蒙古气象》征稿简则
深冬气温多变 蔬菜管理要随机应变
带可加噪声的非自治随机Boussinesq格点方程的随机吸引子
大国气象
美丽的气象奇观
格点和面积