人工智能技术在数值天气预报中的应用

2021-01-29钱思萌闫力敏巍4

应用气象学报 2021年1期

孙健曹卓李恒钱思萌王昕闫力敏薛巍4)5)

1)(国家气象中心，北京 100081) 2)(清华大学计算机科学与技术系，北京 100084) 3)(国家超级计算无锡中心，无锡 214072) 4)(清华大学地球系统科学系，北京 100084) 5)(地球系统数值模拟教育部重点实验室，北京 100084)

引言

人们的生产生活与天气变化息息相关，灾害性天气对能源[1]、农业[2-3]、运输[4-5]、军事[6]等方面具有重要影响，其中极端天气的影响尤为显著。据统计，2003—2017年我国每年因气象灾害造成的直接经济损失约为3000亿元，且呈上升趋势[7]。因此，对未来天气状态有效、准确的预报带来的经济价值和社会意义巨大，远大于天气预报所需的基础设施投入。

为提高天气预报准确率，人们在探索天气预报技术的道路上从未停止脚步。纵观天气预报的发展历史，大致经历了民间技艺、单站预报、天气图预报和数值天气预报几个阶段[8]，这些阶段的演化也表现出天气预报技术内在的发展规律——使用更多的数学、物理方法取代预报过程中的人工经验决策，不断丰富资料来源并开发更加有效的计算方法与计算工具，实现从纯人工经验的民间技艺到包含大量数学、物理形式化规律并建立在高性能计算技术之上的数值天气预报的转变。

目前数值天气预报发展面临着许多理论上和技术上的挑战，这些挑战来自初始误差、模式误差、天气系统演变的可预报性以及更高时空分辨率预报所需高计算复杂度等多个方面。同时，积累的海量数值天气预报信息在传统的数值预报产品中还未得到充分挖掘和拓展应用，等待人们提出行之有效的解决方法。20世纪80—90年代，人们一致认为人工智能非常适合在大气科学中应用并具有广阔的前景，人工智能技术将会成为天气预报系统中必不可少的一部分，而不仅仅是一个辅助工具[9]。

近年人工智能迎来了第3次发展浪潮，以神经网络为代表的深度学习方法在高维度、大数据量的众多复杂问题中表现优异，在理论和软硬件环境方面都取得了快速发展，我国也制定了《新一代人工智能发展规划》(http:∥www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm)以抢占人工智能发展的重大战略机遇，这为人工智能技术在天气预报中的广泛应用提供了契机。因此，本文针对当前人工智能技术在数值天气预报中的应用与发展进行回顾，从数值天气预报全流程的角度，介绍目前预报过程中存在的问题以及正在探索的人工智能技术方案，包括观测资料预处理与资料同化、预报模式、后处理、高性能计算等多个方面，并对一些纯数据驱动的人工智能预报模型以及其中所采用的优化技术进行总结。

1 数值天气预报与人工智能技术

1.1 数值天气预报发展及主要技术

如今使用的数值天气预报技术已经历较长时间的发展。20世纪初，Cleveland[10]和Bjerknes[11]开始尝试将天气预报看作数学物理学中的初值问题，通过非线性偏微分方程组的形式描述旋转地球大气运动中的已知物理规律，在一定的初始条件下，求解方程组就可以得到未来一段时间的天气状态。由于无法求得方程组的解析解，因此只能将其离散化进行数值求解。偏微分方程数值求解是动力框架的核心，与描述辐射、云雨、边界层过程的物理参数化方案共同构成基本的大气环流模式。

为实现快速计算并使数值天气预报得以应用，Richardson[12]首次对数值计算过程进行简化，降低方程组的复杂度，人们也开始尝试将计算任务交给计算机完成[13]，20世纪70年代的超级计算机已有能力求解整套方程组[14]，高性能计算开始成为数值天气预报不可分割的一部分。

同时，人们注意到初值中的微小扰动会使天气预测结果产生巨大变化，因此如何减小初值误差成为提高预报准确性的关键问题之一，资料同化方法越来越多地用于获取更加精确的初值。另外，大气系统中的混沌特性以及数值预报中的初值误差、模式计算误差和物理参数化方案等导致的不确定性，使用单一模式预报结果不可避免地存在误差与不确定性，于是基于概率预报的集合预报方法逐渐被广泛使用[15]，资料同化与集合预报已成为提高预报质量的重要方法。

如今观测资料预处理、资料同化、预报模式、集合预报和高性能计算等一起形成了高效、综合的数值天气预报业务系统[16-17]，涵盖初值生成、预报、产品应用等过程，基本预报流程如图1所示。按照预报时效，天气预报又分为临近预报(0～2 h)、短时预报(0～12 h)、短期天气预报(0～3 d)、中期天气预报(3～10 d)、延伸期预报(10～30 d)以及气候预测(30 d以上)等多种业务模式[8,18]。数值天气预报业务系统已经孕育大量科学工程结晶，取得举世瞩目的成就，成为复杂工程系统的典范之一。经过100多年科学知识和先进技术的不断积累，数值天气预报能力取得稳定、持续的进步，充分显示出其内在的先进性[19]。与人工智能技术的融合也成为数值天气预报领域未来的热点研究内容之一，人工智能技术的加入将有助于海量观测资料和模拟结果的分析与深度应用，从而进一步提高数值天气预报产品服务质量。

图1 数值天气预报过程示意图Fig.1 Workflow of numerical weather prediction

1.2 人工智能技术

人工智能核心内容主要包括传统机器学习和深度学习两部分。

1.2.1 传统机器学习

传统机器学习算法在少样本、低特征维度的情况下，能够获得与深度学习可比甚至更好的结果，且计算效率更高。传统机器学习中常见的问题包括分类、回归、聚类、降维、特征选择等[20]。常用分类或回归方法包括最近邻居法、决策树、集成方法、支持向量机等，聚类[21]方法包括K均值聚类(K-means)和层次聚类，常用降维方法包括主成分分析(PCA)和奇异值分解(SVD)等[22]，特征选择方法包括过滤式、包裹式和嵌入式[23]。同时，机器学习方法也常用于数据的异常检测和缺失值重建。

1.2.2 深度学习和神经网络模型

深度学习主要用于解决传统机器学习方法在高维特征空间中拟合能力不足的问题，在处理图片、语音、文字等高维时空序列数据方面问题时也有出色表现。深度学习模型包括以深度前馈网络、卷积网络、递归网络、对抗生成网络和贝叶斯网络为代表的众多神经网络结构[20]。深度前馈网络是最基本的深度学习模型之一，其中各层神经元两两相连并通过反向传播算法实现参数更新，具有强大的非线性映射能力；卷积神经网络[24]引入卷积和池化操作，通过系数交互、等变表示、参数共享等思想有效减少模型参数；递归神经网络[25]是专为处理序列数据提出的神经网络，通过将同一隐层神经元间进行连接的方式建立序列数据的前后关系；生成对抗网络[26]由生成器和判别器两部分组成，通过对抗学习，使生成器具有生成与训练数据分布相似样本的能力；贝叶斯网络基于贝叶斯推断采用嵌入隐变量生成样本空间的分布模型，在保持深度学习高拟合能力的同时提升泛化能力。

1.2.3 人工智能的发展方向

目前人工智能的发展方向主要体现在算法、算力和数据3个方面(图2)。

图2 人工智能技术组成Fig.2 Components of artificial intelligence technology

在算法的开发方面，可解释性一直是深度学习算法追求的目标之一，模型具有可解释性便于知识提取、知识积累、知识重复利用，不可解释的模型也面临着稳定性、安全性等问题，同时，可解释性也能够使深度学习摆脱“黑盒”的标签，不再是毫无意义的暴力判定工具，目前可解释性研究主要包括模型结构或参数的可视化分析[27]、因果网络[28]开发等。另外，模型迁移和鲁棒性也是人工智能研究的热点，常用的迁移学习方法包括微调(Fine-tune)[29]、基于样本迁移、基于特征迁移和基于模型迁移等，现有的鲁棒性分析方法多采用样本攻击方法[30]。其他热点研究内容还包括自动超参数寻优(自动机器学习框架(Auto-sklearn)[31]、神经网络结构搜索(NAS)[32]等)、强化学习[33]等。

人工智能软硬件也朝着更便捷、更高效的专用架构方向发展，软件环境主要包括Python中丰富的机器学习(Scikit-learn[34]等)和深度学习(Keras[35]、Tenserflow[36]、Pytorch[37]等)框架、CUDA和CuDNN等图形处理器(GPU)高性能计算软件库。硬件环境包括神经网络芯片[38]、专用加速硬件(TPU等)和通用加速器(GPU/FPGA)以及基于图形加速器的异构超级计算机(Summit[39]等)。软件框架的引入大大降低了人工智能技术应用门槛，高性能专用硬件能够有效提升训练和推理的计算速度，为超大规模人工神经网络的采用和实时训练与推理等严苛场景应用奠定基础。

数据发展的主要内容是建立标准数据集，标准数据集的建立与公开发布有助于加快相关算法的研究与开发，如在图像识别问题中的手写数字数据集(mnist)、微小图像数据集(cifar10/cifar100)、大规模视觉识别图像数据集(imagenet)等。

1.3 人工智能与数值天气预报的联系及差异

人工智能和数值天气预报具有一定的相似之处，如人工智能与数值天气预报都是根据已知先验的信息预测未知，使用的数据都具有高维、海量、异构的特点，这些相似之处使人工智能技术能够很自然地融入数值天气预报中。

同时，人工智能与数值天气预报也存在较大差异：前者以数据为驱动，通过预测模型本身隐式表达数据中的规律；而后者以理论知识为驱动，注重将气象规律以数学物理公式的形式进行显式表达。两种方式各有优劣——数据驱动下规律的表达较为晦涩但能够自动、快速的实现，理论驱动下规律的表达更加清晰和准确但认识过程缓慢；又殊途同归——都是以规律和知识获取为目标，只是方式和表达形式有所不同，如同统计学与数值计算的关系。这些差异的存在也为数值天气预报的发展提供新机遇，使两者各取所长、优势互补成为可能，如使用人工智能优化物理模型参数、替代物理模型子过程、代理模型等[40]，或利用物理理论指导、约束人工智能模型等[41-42]。

2 人工智能技术在数值天气预报中的应用

如今的数值天气预报过程主要涉及初值生成(观测资料预处理、资料同化)、预报(模式积分)、产品应用(后处理)和高性能计算(如图1所示)，在当今人们对天气预报的需求中，每一部分都不可或缺，共同影响数值天气预报的精度与效率。然而，这些过程中仍然存在问题与挑战，有效解决和应对这些问题与挑战能够进一步提高数值预报性能，于是人们尝试使用人工智能技术帮助解决这些问题(表1)并取得一定进展。

表1 人工智能技术在数值天气预报中的应用Table 1 Artificial intelligence applications to numerical weather prediction

2.1 观测资料预处理与资料同化

由于观测资料预处理和资料同化共同影响初始条件的质量，且初始条件中的微小扰动会使模式结果产生较大差异，提高观测资料质量和改善资料同化方法显得尤为重要。大量观测资料凭借资料同化有效融入预测过程也使得人工智能在资料同化中的应用更具机遇。

在提高观测资料质量方面，Berry等[43]提出一种非参数贝叶斯方案对观测中的误差分布进行学习，并能够对其偏差进行纠正，与同化系统联合使用能够有效增强同化效果。另外，人工智能也可用于卫星图像等资料的预处理，如安捷等[44]使用全卷积网络对气象卫星遥感图像资料中的云进行检测，实现高分辨率、大尺度、多通道遥感图像资料的云分割。Chang等[45]使用极限学习机填补中分辨率成像光谱仪反射资料中由于云量造成的空白。

在改善资料同化方法方面，Moosavi等[46]使用随机森林方法在时间和时空两种情境下对集合卡尔曼滤波资料同化方法中局部化函数的定位半径进行自适应调整，进一步提高同化质量。为提高同化速度，Cintra等[47]使用神经网络替代局部化集合转换卡尔曼滤波同化方法，在试验中得到相似的同化结果并表现出更高的计算效率。为更好地利用高空间分辨率资料进行同化，Lee等[48]使用支持向量机等机器学习方法预先寻找预报中更感兴趣的资料区域，通过将高分辨率卫星放置在感兴趣区域以使资料同化产生更好结果。

人工智能有效改善了观测资料质量，并开始有机融入主流资料同化方法，但对于不确定性的量化与分析还需要更加深入的理论支持。

2.2 预报模式

数值天气预报模式涉及动力框架、物理过程参数化方案，其中模式数值积分过程最耗时，而人工智能技术推理具有高效性，使用人工智能模型替代模式(或部分模式)能够显著提高计算效率，这成为一个重要的研究方向。由于神经网络的“黑盒”特性，模式替代可以认为是代理模型(输入输出响应模型)的构建，如Scher[49]使用深度神经网络学习简单的GCM模型输出，试验证明训练后的神经网络能够成功预测模型状态变化，从而取代动力学模型，使用神经网络预测的形式也大大提高计算速度，这一结果也展示了纯数据驱动天气预报的可能性。

物理参数化方案是当前模式中发展最为迅速的部分，也是不确定性最大的部分，使用人工神经网络模型替代与优化物理参数化方案的相关工作也被持续关注。目前物理参数化方案仍以单柱模型方式表示，随着分辨率的快速提升，次网格过程影响日益显著，三维物理方案的高计算量限制了其在模式中的应用，人工神经网络的高效拟合能力为同时降低计算开销提升计算精度创造了条件。Brenowitz等[50]针对传统物理过程参数化方案过于简化问题，探索在全球高空间分辨率资料下的神经网络参数化方法，使用4 km分辨率下的NG-Aqua(near-global Aqua-planet)仿真数据训练模型并对160 km网格视热源和视水汽汇进行预测，通过最小化多个时间步上的预测误差得到数值稳定的模型，在80 d的单柱试验中，相比CAM(Community Atmosphere Model)能够更好地匹配NG-Aqua结果。Pan等[51]将卷积神经网络作为统计降尺度方法替代现有降水参数化方案取得较理想的效果，并能够通过可视化分析对模型及结果进行合理解释。O’Gorman等[52]使用随机森林方法对湿对流自动参数化建模，仍能保证能量守恒和非负性降水量，带有机器学习湿对流参数化的大气环流模型能够稳定运行并准确捕获极端降水等特征。Rasp等[53]使用深度学习模型表示模式中的大气次网格过程，计算成本很小，突破了传统方法中的计算限制，且多年预报模拟结果表现稳定，能够替代全球环流中传统的次网格参数化方法。Xu等[54]提出一种基于代理优化技术的碳循环模型参数校正方法，相比传统方法在计算准确度和计算效率两方面均得到一定提升。Wu等[55]针对CAM5提出一种自动参数估计方法并能对辐射平衡进行约束，结果显示其参数优化效果更好且有效降低辐射不平衡。

同样，人工神经网络的物理参数化方案是否有能力表述包含复杂相变的云、雨、雪、气溶胶等过程与边界层的湍流过程，以及与动力框架的可靠耦合仍值得深入探究。

2.3 集合预报后处理与集合代理

集合预报是解决单一数值预报结果不确定问题的有效途径，从统计学角度给出概率预报结果并对预报的可信度进行量化。集合预报中的问题主要体现在集合预报结果后处理和集合预报效率等方面。在集合预报结果后处理方面，Burke[56]使用随机森林方法对高分辨率集合预报结果进行订正，改善冰雹预报效果，订正后的预报结果具有更高的可靠性和更小的模型偏差，同时由于不需要复杂物理假设计算效率也更高。Taillardat[57]使用分位数回归森林对集合预报结果进行后处理，其中分位数通过集合成员之外的其他预测因子估计得到，消除人为假设订正变量的局限性，提高订正效果。Rasp等[58]提出一种基于神经网络的集合预报后处理方案，通过数据驱动方式自动学习任意预测变量和预测分布参数间的非线性关系，避免预先指定关系函数的局限性。试验结果证明该方法在计算上更经济，且更易推广到其他统计后处理和预测问题中。

为有效提高集合预报效率，Scher等[59]尝试使用基于卷积神经网络的深度学习方法替代集合预报方法，并能够对给定初始状态下模式预报结果的不确定性进行估计，相比传统集合方法计算代价更小，其预报性能的限制在于可用的训练样本较少。Sonderby等[60]使用深度神经网络进行降水预报时直接输出概率预报结果，有效替代集合概率预报方法且预报速度更快。

人工智能技术被认为是一种拟合高维非线性样本空间概率分布，量化不确定性的有效手段，帮助或替代传统的集合预报是非常有潜力的研究方向，并开展初步工作。通过对于初始场的学习，开展集合方案的设计值得进一步关注。将资料同化与集合预报结合起来进行人工智能创新更值得期待。

2.4 人工智能预报模型

一些研究者更加大胆地尝试利用人工智能模型直接进行天气预报，独立于传统的数值预报过程，其预报流程如图3所示。这些人工智能模型以观测资料为输入并直接输出预报结果，能够自动捕捉输入资料中的时间和空间特征并作出快速推理，其结果与数值天气预报模式相比具有相近甚至更高的预报精度，实际预测时(推理过程)计算速度也具有明显优势。

图3 基于人工智能模型的天气预报流程Fig.3 Weather prediction workflow based on artificial intelligence models

Ham等[61]采用深度学习方法能够对ENSO事件进行长达1年半的预测，且预测效果远高于目前最先进的热带气候变化动态预报系统(SINTEX-F等)，证明卷积神经网络是预测ENSO事件的有力工具。在降水预报方面，Google公司的Sonderby等[60]提出了深度学习降水预报模型MetNet，实现1 km 空间分辨率和2 min时间分辨率下全美范围内提前7～8 h的降水预报，超过NOAA使用的大气模型结果，且计算时间从几十分钟或几小时缩减至几秒。在极端天气预报方面，Zhou等[62]提出一种短时暴雨、冰雹、对流阵风和雷暴等强对流天气的深度学习预报方法，使用温度、气压、湿度、风以及数十个对流物理参数作为预报因子，建立6层卷积神经网络作为预测模型，其结果优于其他传统方法，该深度学习预报模式目前已在中国气象局国家气象中心应用。

虽然人工智能模型应用取得了初步成果，但这些模型多为特征变化显著的短时天气预报或特征变化缓慢的长期气候信号的预测，对于物理现象复杂且特征多变的天气过程预报，人工智能模型还未出现较好的应用案例，人工智能模型在解决高维非线性天气问题中的表现还需要进一步验证。

3 人工智能技术的应用

近年来，人工智能应用快速发展，针对不同领域和不同需求的应用发展了大量技术手段。

3.1 大规模神经网络计算

从多源观测大数据中学习知识，实现高维、复杂和多变量的天气过程特征识别和状态预测，需要借助大规模神经网络实现。与传统数值天气预报需要依赖超级计算机支撑一样，大规模神经网络计算也需要强大的算力支撑，而预报时效进一步提升了算力需求。

Kurth等[63]在超算Piz-Daint和Summit上使用Tiramisu和DeepLab v3+深度学习网络模型对高时空分辨率下的极端天气进行模式识别与分割，在识别极端天气位置的同时对边界进行划分。另外，通过对软件框架和训练算法的改进，DeepLab v3+网络可使用到27360个V100 GPU，持续吞吐为325.8 PFLOPS且并行计算效率为90.7%，通过利用FP16张量核，半精度下的DeepLab v3+网络峰值和持续吞吐分别高达1.13 EFLOPS和999 PFLOPS，这一应用获得2018年戈登贝尔奖，展示人工智能技术在气象领域中进行大规模计算的可能性。Rojek[64]针对改进的随机森林方法提出一种混合精度算法，在基于GPU的超算中心进行天气预报模拟时，该算法能够提供与双精度相当的计算精度，且计算能耗降低36%。

3.2 特征分析与可解释性

特征分析与可解释性有助于人们理解人工智能模型的推理过程，便于对预报模型进行优化。Manandhar等[65]通过特征选择方法找到对降水具有较大影响的特征，基于这些特征使用机器学习方法对降水量进行预测，获得较高预测准确率的同时有效降低虚警率。Gagne等[66]使用卷积网络基于上层空气动力场和热力场预测严重冰雹发生概率，通过对卷积网络特征重要性的解释与分析，发现该网络综合了对冰雹生成过程的理解，预测结果也优于其他模型。

3.3 样本权重差异化与注意力机制

人工智能模型在推理天气情况时使用大量时间或空间相关数据，这些数据可以被赋予不同权重用以表示其对预报点影响的大小。Karevan等[67]利用长短期记忆网络建立数据驱动的天气预报模型，考虑样本与预报点距离的影响，将预报点附近的样本赋予更大权重，所提出的传导长短期记忆网络在预测任务中表现出较好的性能。Qiu等[68]提出一种多任务卷积神经网络用于降水量短期预测，考虑到观测的不完整性以及临近点影响，该模型通过多任务处理观测点的时间序列数据并利用多个观测点间的相关性进行预测，结果优于包括欧洲中期天气预报中心模型在内的一系列基线模型。Yuan等[69]提出一种基于双因素注意力机制的多变量编码-解码预报模型，从时间信息和先验知识推断两方面学习注意力权重，在公共天气预报数据集上采用双因素注意力机制方法时预报精度得到很大提高。

3.4 基于物理机制的定制化目标函数

目标函数确定对人工神经网络质量的影响至关重要。Prasetya等[70]从计算机视觉角度考虑降水预报中的雷达回波外推任务，将图像质量评估方法中的结构相似性指标和均方误差、平均绝对误差结合并作为神经网络训练目标，使雷达图像预测质量得到有效提高。Tan等[71]提出一种基于分层卷积长短期记忆网络的深度学习模型，并使用一种新的预报员损失函数预报未来的卫星云图，所提出的神经网络具有更好的预报性能，预报员损失函数也能更好地保留实际大气状况的不确定性。

4 面临的挑战

人工智能技术在数值天气预报领域展现出巨大潜力，主要体现在两个方面：人工智能技术尝试在数值天气预报的核心部分发挥作用，如对观测资料预处理、资料同化、预报模式、集合预报、后处理等进行优化和改善；纯数据驱动的端到端人工智能预报模型开发。这些模型也表现出替代传统数值模式的可能性，同时大量人工智能技术应用于天气预报并对其发展起积极作用。然而，目前人工智能技术在数值天气预报中也面临一些挑战：

①弱解释性问题。传统数值天气预报发展一直十分注重理论知识的积累，与人工智能在驱动方式上有很大差别，人工智能多以统计为基础，对规律的表示较晦涩，解释性不足，基于人工智能的知识发现也较困难，在一定程度上限制了其在行业内的广泛认可及广泛应用。

②不确定性分析问题。如今的数值天气预报十分注重不确定性分析，如何使用人工智能技术有效表述、设计初值及模式不确定性，需特别考虑。

③人工智能与现有数值天气预报技术耦合问题。现有人工智能应用表现出局部优化、局部替代、全局替代等多种耦合模式，然而对于耦合系统的长期稳定运行还缺乏深刻的理论分析和保障。人工智能长于对于样本分布的估计，传统数值预报技术优于确定性规律下的精确计算，这对耦合设计提出了挑战。另外，数值天气预报和人工智能在代码、软硬件环境方面的需求也存在一定差异，需妥善解决。

④理论知识指导下的人工智能模型设计。数值天气预报领域至今已积累大量的数学和物理理论，这些理论应被人工智能模型有效利用，如何合理使用这些理论指导人工智能模型设计值得进一步讨论。

⑤人工智能预报模型在高时空分辨率天气预报问题中的可行性。尽管现有人工智能预报模型应用取得了初步成果，但在高时空分辨率条件下强非线性问题中使用纯数据驱动的人工智能预报模型的可行性仍需验证。同时，人工智能预报模型在训练过程中计算量和数据访问量也大幅提升，这本身也对大规模高性能计算软硬件平台提出了新的要求。

5 展望

人工智能技术在数值天气预报应用中取得成功的同时仍面临挑战，人工智能技术可重点从以下几个方面发展：

1) 在数值天气预报业务中，初值生成过程特别是资料同化方法对预报质量影响尤为重要，而受限于计算压力难以有效利用海量高时空分辨率气象资料，这或许是目前人工智能最为有效的着力点之一。在预报模式、后处理等过程中合理使用代理模型，以及构建端到端的数据驱动模型，能够不失准确性又显著提高预报时效，为大规模计算任务提供高效方案。

2) 在人工智能模型知识积累和再开发方面，贝叶斯网络、图神经网络和因果网络的发展在一定程度上有助于建立更为全面深刻的特征工程，支持理论知识发现与知识积累；在线学习与迁移学习技术能够支持人工智能预报模型的积累与增量开发过程，提高历史资料与模型利用率；自动网络结构与超参数寻优方法能够实现机器学习和深度学习模型中超参数的自动化快速搜索，加快人工智能应用开发。

3) 针对人工智能模型的不确定性，采用贝叶斯推断技术生成当前气象状态的分布特征可能成为更全面、更高效的不确定性量化替代方案；基于贝叶斯网络嵌入隐藏变量特征的学习，基于注意力机制对气象要素间长程依赖关系的识别，可能为系统不确定性分析提供更有洞察力的特征抽取和机理发现。这方面潜力的挖掘需要从数学层面找到与传统分析方法的联系，从而建立综合的不确定性分析方法，同时，应使用合理的分析与评价方法改善人工智能模型的鲁棒性以减小不确定性，如将数学或物理理论作为先验知识用于神经网络结构设计、定制损失函数、控制模型输出等，从而使结果满足一定物理约束条件并具有更小的不确定性。

4) 数值天气预报模式与人工智能模型的耦合需要在耦合方案以及算法的数值稳定性和精度方面进行探究。标准工作流和框架的开发将有助于人工智能耦合模型的开发，如实现Fortran，MPI，NetCDF，NCL一系列基础语言和工具与PyTorch，TensorFlow等神经网络框架有效连接，以便代码耦合与继承。

5) 为实现高时空分辨率人工智能预报模型开发，超大规模神经网络的针对性研究或能满足精细化预报的需求，超大规模网络实现高斯随机过程的收敛性理论和实践突破，可有效支撑高度非线性模式的同化和集合设计。另外，人工智能分布式学习框架和人工智能超算的发展也为大规模人工智能技术应用提供完整和高效的解决方案。

数值天气预报融大数据与大计算于一体，成为复杂工程系统的典范之一。如今，人工智能迎来了第3次发展浪潮，为其在数值天气预报中的深入应用提供了契机。从现有研究看，人工智能已开始在数值天气预报中发挥作用，体现在观测资料预处理、资料同化、模式预报、后处理等多个方面，包括模式代理与参数化方案优化、同化算法优化与替代、观测资料预处理与预报结果后处理等。纯数据驱动的人工智能预报模型也已开发并投入使用，表现出人工智能在天气预报问题中的巨大潜力。人工智能与数值天气预报的广泛结合还有很长的路要走，需要气象领域专家与人工智能、高性能计算等计算机领域专家携手开展深度合作研究。