APP下载

利用混合模型LSTM-DNN 进行全球电离层TEC map的中短期预报

2021-07-13廖文梯赵瑜馨王劲松唐荣欣

航天器环境工程 2021年3期
关键词:电离层预测函数

廖文梯,陈 洲*,赵瑜馨,王劲松,唐荣欣

(1.南昌大学空间科学与技术研究院,南昌 330031;2.北京卫星环境工程研究所,北京 100094;3.中国气象局空间天气重点开放实验室国家空间天气监测预警中心,北京 100081)

0 引言

电离层是地球上层大气的电离区域。许多低轨道航天器运行在电离层中,而基于短波和星地无线电链路的众多高科技系统会直接受到电离层的影响。由于电离层天气预报水平直接关系到各种技术系统的运行安全,所以电离层预报研究一直是空间天气预报的热门方向,特别是对电离层中长期(气候学)行为的预报,无论是经验预报[1-3],还是理论模式预报[4-6]都已经达到了非常高的水准。电离层的短期(天气学)预报也有一定成果[7],但与中长期电离层预报水平相比还有相当大的差距。这是由于电离层天气变化与太阳电离辐射、太阳风和地磁活动、中性大气背景以及电动力学过程有关,同时又与电场、电导率、电子密度等各种参数密切相关[8-9],从而使得电离层天气表现出参数多、变化复杂的特性。另一方面,随着观测资料的不断丰富,电离层天气尺度下所观测到的电离层形态也越来越复杂。例如相同地磁和太阳活动条件下,有时尽管强度和持续时间近似,但在电离层中引起的形态变化常常会表现出巨大的差异和复杂的非线性特征。这就对电离层天气的建模提出了很高的要求。幸而,关于电离层有着十分丰富的全球观测资料,例如,TEC map数据整合了近20年的观测量,按1 h 分辨率计算,有超过10万张TEC map数据可供使用。这些充足的数据为蓬勃发展的人工智能技术——深度学习——在电离层天气的应用创造了条件。

不同于早期空间物理领域主要基于浅层神经网络模型[10-13]来进行相关研究的人工智能算法,深度学习算法不仅能更加有效地掌握大量观测数据的形态特征,而且在功能上也更为丰富。在特征识别的应用方面:Fang Y等[14]利用卷积神经网络(convolutional neural networks,CNN)的相关算法进行了太阳黑子群的识别与分类;Hada-Muranushi 等[15]进行了太阳耀斑的识别分类。在时间尺度的算法方面:基于长短期记忆(long short-term memory,LSTM)的模型有较强的时间重现能力,可以较好地预测地磁扰动指数Dst[16]和地磁活动指数Kp[17];而Chen Z等[18]对暴时电离层天气的预测研究也取得了不错的效果。在空间尺度的算法方面:Chen Z等[19]提出了一个改进版的深度学习模型,可以有效学习全球电离层TEC map空间信息,并生成高精度的TEC map。然而,以上这些模型仍主要是基于单一算法进行的建模,模型本身的性能很难得到进一步提升,因此已经无法满足电离层天气的建模需求。

本文主要是在原始的LSTM算法基础上,加入额外的深度神经网络(deep neural networks,DNN)算法以及相关的电离层驱动源数据来提高电离层短期预测的精度,并探索相关融合模型在电离层天气预报方面的潜力。

1 数据和处理方法

本文使用的数据包括电离层总电子含量(TEC)、太阳黑子数R、太阳活动指数F10.7、地磁活动水平指数Ap和磁暴环电流指数Dst。数据时间范围为2011—2019年。电离层TEC 数据为IGS(International GNSSService)中心提供的1 h 时间尺度的TEC网格(71×73)数据;太阳黑子数R来自比利时SILSO Center,时间分辨率为1 d;太阳活动指数F10.7来自加拿大空间天气数据中心,时间分辨率为1 d;地磁活动水平指数Ap来自德国地质科学研究中心,时间分辨率为3 h;磁暴环电流指数Dst 来自日本京都大学地磁和空间磁数据分析中心,时间分辨率为1 h。电离层TEC map的全球每日平均值和年平均值(如图1所示)具有显著且复杂的周期性变化,因此在数据所覆盖的9年内TEC波动水平很大。

图1 电离层TECmap的全球每日平均值(直线)和年平均值(点画线)Fig.1 Global daily average(straight line)and annual average(dotted line)of ionospheric TECmap

基于以上原因,使用常规的抽样方法来区分测试集和训练集显然不合适,因此为了使训练集、测试集处于同一分布,不能直接从中间某处拆分。本文采用的方法则是以90 d 为周期,每个周期的前30 d 作为训练集,中间30 d 作为验证集,后30 d 作为测试集,以保证所有数据集处在同一分布中。

2 算法基本结构

本文所构建的混合模型LSTM-DNN 主要是由深度神经网络(DNN)和长短期记忆(LSTM)网络组合构建而成的。

2.1 DNN算法简介

DNN 算法的内部结构与传统的神经网络算法基本类似,主要可以分为输入层、隐藏层和输出层。层与层之间以全连接的方式传递信息,它们满足一个线性关系加上一个激活函数,数学表达式为

2.2 LSTM 算法简介

LSTM是一种变种的循环神经网络(Recurrent Neural Network,RNN)。实际上RNN 是最典型的递归神经网络,在深度学习中被广泛用来处理序列数据。但RNN 缺乏记忆功能,本时刻的隐藏层信息只来源于当前输入和上一时刻的隐藏层信息,因此它只能处理一定的短期依赖,而无法处理长期依赖,这就产生了梯度消失和梯度爆炸问题。LSTM是在RNN的基础上引入了细胞状态,根据细胞状态可决定哪些状态应该保留下来,哪些状态应该被遗忘。LSTM解决了一般的RNN存在的长期依赖问题。LSTM在微观上看使用了遗忘门、输入门、输出门三种门来保持和控制信息,选择性的记忆反馈的误差函数随梯度下降地修正参数,从而实现时间上的记忆功能,并防止梯度消失。LSTM单个时间步的计算公式如下:

2.3 基于LSTM算法的TEC预报模型

LSTM电离层TEC预报模型采用“自预测”方法,即历史数据中不含其他物理参数。该模型结构如图2所示。模型采用4个LSTM层,激活函数为线性函数,优化器为RMSprop算法,目标函数为MSE。模型的输入为连续的48 h 全球电离层TEC历史观测数据。因为所使用的LSTM网络不支持输入四维数据,所以在输入层后面加了一个Reshape层,将所有的二维TEC数据进行拉平处理。模型的输出是未来1 h 全球电离层TEC 预测数据。为了保证该输出是二维的TEC数据,故在输出层的前面使用一个Reshape层将LSTM层的输出处理成三维([batch size,64,64])。

图2 基于LSTM 算法的TEC 预报模型结构Fig.2 Structure of TEC prediction model based on LSTM algorithm

2.4 基于LSTM-DNN算法的TEC预报模型

使用“自预测”方法的预报准确度受磁暴影响较大。为提升磁暴时期电离层预报效果,利用太阳风、地磁等参数作为预报因子。太阳活动强烈控制着电离层的行为。当太阳处于活跃期时,将产生巨大的电离层效应。太阳耀斑就是太阳活动的一种形式。在耀斑区,日冕温度增高,太阳发出的辐射软X 射线和紫外线以光速传到地球,被地球上空60~90 km 的大气吸收,使得电离层D层的电子密度大大增加。此外,太阳耀斑爆发经常向行星际空间喷射等离子体云,这些等离子体云的径向速度为500~1000 km/s,其经过1.5~3 d 到达地球附近,与地球磁场作用引起地磁暴;伴随着磁暴,在全球范围内电离层各层都显示出一些剧烈变化。为了使模型能够充分学习到会导致未来时刻的电离层产生变化的物理量,本文使用连续3天的历史观测数据作为预报因子。LSTM-DNN电离层TEC预报模型在LSTM预报模型的基础上以全连接的方式添加了预报因子,以达到效果更好的电离层TEC预报结果。这里同样采用了4个LSTM层,激活函数为线性函数。之后通过2个Dense层,第一层采用Relu 激活函数,最后一层采用sigmoid 激活函数。模型的主要输入是连续的48 h 全球电离层TEC 历史观测数据,辅助输入为4个预报因子。这个模型的损失函数也是由两个部分组成:主损失函数评估的是基于TEC数据和预报因子做出的预测,辅助的损失函数评估的仅仅是基于电离层TEC 数据本身做出的预测。即使来自主损失函数的梯度发生弥散,来自辅助损失函数的信息也能够训练LSTM层。本文中的主、辅助损失的权重分配为:主损失1.0;辅助的损失0.2。基于LSTM-DNN 算法的TEC预报模型结构如图3所示。

图3 基于LSTM-DNN 算法的TEC预报模型结构Fig.3 Structure of TEC prediction model based on LSTMDNN algorithm

3 模型测试结果

3.1 预测方式

本文采用滚动预测的方式来测试模型的精度,即:采用前48 h 的TEC作为历史输入数据,来预测未来1 h 的全球TEC值,然后将已经预测的值不断迭代到输入数据中,以进一步预测未来的值,从而实现预测未来任意时刻TEC(如图4所示)。

图4 滚动预测结构示意图Fig.4 Schematic diagram of rolling forecast structure

3.2 评估指标

当模型训练完善后,将2个模型的预测结果分别与IGS提供的TEC 观测数据进行比较,并采用平均绝对精度(MAD)、均方根误差(RMSE)和平均相对精度(RA)3个性能指标来评估模型的性能。其中:MAD和RMSE值越小,表明预测值与观测值拟合程度越好;而RA 则是值越大模型预测性能越好。3个性能指标的定义分别为:

3.3 模型性能

图5 3种性能指标随预测时间长度增加而变化的趋势Fig.5 The trend of the three performance indicators against the forecast time

基于滚动预测方式,测试了LSTM和LSTMDNN两种模型的3个性能指标随预测时间长度增加而变化的趋势(如图5所示),可以看到:LSTM和LSTM-DNN 算法随着滚动预测时间步长的增加,其预测性能都会下降;但是,LSTM-DNN预测误差随时间累积的速度明显要小于单纯的LSTM算法。进一步测试两个模型在24 h、48 h 和144 h 内的平均预测性能,结果如表1所示。可以看到:当预测时间在24 h 以内,单一的LSTM算法精度要比LSTM-DNN有微弱的优势;但随着预测时间进一步增加,当预测时间从24 h 到144 h,LSTM 的MAD从2.72增加5.53,RMSE 从3.81增加到7.43,而RA 则从82.79%下降到64.97%。对比可以看出LSTM-DNN 预测指标的下降要显著小于LSTM。

表1 3种性能指标分别在24 h、48 h和144 h的平均预测性能参数Table 1 The average predicted performance parameters of the three performance indicators in 24,48 and 144 hours respectively

4 结束语

LSTM算法通常是以自回归算法的形式来进行预测,即:在预测过程中不需要加入额外的驱动量,只需要拿自己的历史信息来预测自己的将来。然而电离层是一个开放的系统,其变化不仅仅来源于自身的背景变化,还有太阳活动、地磁活动以及底部中性大气耦合等多种因素共同作用引起的变化,因此所构建预测模型的数据如果只来自电离层本身,那么该模型的性能是有限的。为此,本文尝试在LSTM 预测模型的基础上,耦合进DNN 算法来加入额外的电离层驱动量,其中R和F10.7指数代表了太阳活动对电离层的驱动因素,Ap和Dst指数则体现了地磁活动对电离层的驱动因素。通过对比两种算法预测效果可以看出,LSTM-DNN算法能够显著减少预测性能随时间衰减的问题。这表明,在LSTM 基础上引入额外的DNN 算法和对应的太阳和地磁活动指数作为输入,是提高电离层预测精度的一种有效方法。

猜你喜欢

电离层预测函数
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
空间环境因素对西北地区电离层空间特征影响
IGS组织的全球电离层数据分析与比较
关于函数的一些补充知识
高中数学中二次函数应用举隅オ
无独有偶 曲径通幽
宽带Chirp技术的应用