APP下载

基于卷积神经网络的急始磁暴自动识别研究

2022-01-14郭宗斌李健

科学技术创新 2021年35期
关键词:台网卷积神经网络

郭宗斌 李健*

(1、山东省地震局聊城地震监测中心站,山东聊城 252000 2、海南省地震局,海南海口 570203)

磁暴是空间天气扰动的一种主要形式之一,对卫星、地面通讯、电力系统[1]、油气管道[2]等均有严重的影响。磁暴在形态上分为初相、主相、恢复相三个阶段。受行星际激波影响,磁场水平分量H 在数分钟内出现高于暴前水平的起伏变化,称作初相,初相后磁场迅速下降并剧烈抖动,这个过程称为主相,初相和主相的突然变化对现代通讯、管道等系统有很大的冲击,随后磁场缓慢恢复,这个过程称为恢复相。

除对磁暴机理作出研究外[1-2]。从磁场及磁暴对实际生产生活(如电网、通信等)的影响角度出发,如何快速识别磁暴并进行提早防范至关重要。

近年来,一些学者应用传统机器学习方法通过人工提取地磁数据能量特征实现对磁暴过程识别[3-4]。易世华(2007)应用小波包分析技术提取了地磁水平分量序列的能量特征,用Fisher方法进行识别,研究了磁暴与非磁暴的识别率在不同时间长度t 下的变化规律,平均识别率83.8%[5]。康瑞清(2013)提出一种基于Fisher 和核Fisher 组合的磁暴识别方法,该方法对于磁暴与非磁暴的平均识别率达到了85%以上[6]。

由于磁暴定义为具有明显初相- 主相- 恢复相完整形态且最低点Dst 不大于-30nT 的磁扰,磁暴属于一种特殊的磁扰,针对能量特征识别的算法并不能有效区分磁暴与磁扰。以上研究均只是针对急始磁暴的某一项或某几项单一特征进行的识别,人为对数据进行降维使用,并未保证数据的全面性,势必难以实现磁暴识别的普适性判断。同时对特征的人为提取也增加了数据处理的时间成本。为实现对急始磁暴的快速高效自动识别,在前人研究的基础上,本文融合Adam 优化算法、dropout 技术等方法,设计出可以自动提取并可组合底层特征的一维卷积神经网络模型进行监督学习,实现对事件磁暴数据的训练识别。

研究中,选取包含事件记录全部信息的磁场数据作为模型的训练与测试的输入数据,而不是预先提取若干判据或部分数据进行降维使用。随后,使用训练数据集基于卷积神经网络建立识别磁暴事件的分类器,然后用训练好的分类器对测试数据集以事件为识别单元进行识别以2008 -2018 年期间发生磁暴事件以及疑似磁暴的磁扰事件分别构建训练集、验证集和测试集。

1 原理与方法

1.1 卷积神经网络基本原理

卷积神经网络是本研究采用的关键框架,它是人工神经网络与深度学习相结合,通过反向传播算法训练卷积神经网络中的权重,从而实现深度学习的方法。

它由卷积层、池化层、激活层等组成。卷积运算是最基本也是最重要的操作,在卷积层中,一个可学习的卷积核与上一层输出的特征图像进行卷积操作,加上一个偏置项后通过激活函数后输出。

当图像输入卷积网络后,首先进入卷积层,通过卷积运算提取图像的局部特征,对于磁场水平分量数据,磁暴发生时拥有初相、主相、恢复相的变化阶段,通过不同的卷积核后具有不同特征的区域将被激活。第一次卷积后较低层次的特征被提取出来经过池化层降维后进入更深的卷积层,这些特征被重新组合得到更高层次的特征,经过一步步浓缩,最后经过全连接层实现分类的任务。

1.2 训练模型设计

图1 二维卷积映射过程

本研究力图借助卷积神经网络的泛化能力,实现在数据收集或积累不充分的情况下,通过对部分地磁水平分量数据的学习挖掘隐含的磁暴信号特征,从而实现对其他磁场异常活动的识别。

针对磁暴数据,由于是一维数据,设计出相应的一维卷积神经网络模型(图2)。输入数据取磁暴数据3 天的长度。本网络结构由输入层,卷积层1,池化层1,卷积层2,池化层2,dropout层,全连接层1,全连接层2,softmax 层组成。

图2 一维卷积神经网络结构示意图

采用relu 激活函数,损失函数采用交叉熵,输出为2 分类问题采用独热编码,10 代表磁暴,01 代表非磁暴。Adam。学习速率为0.0001。

2 数据资料

本文的磁暴事件采用国家地磁台网中心发布的磁暴目录,及ISGI(International Service of Geomagnetic Indices)发布的SSC目录。地磁数据来自国家地磁台网中心,Dst 数据来自ISGI。(http://isgi.unistra.fr/indices_dst.php)。

首先,需对2008-2018 年的磁暴事件进行统计,由于ISGI 与国家地磁台网中心提供的事件有所不同,故需对磁暴事件进行筛选,本文采用的筛选规则如下:

2.1 国家地磁台网中心与ISGI 收录的同类型同时间均记录的事件,确认为磁暴事件,选取进入本文的数据集。

2.2 只要是ISGI 收录的SI(sudden impulse)事件或国家台网中心收录的GC(缓始磁暴)事件均排除,认为其不是磁暴事件,均进行排除,不选取进入本文的数据集。

2.3 ISGI 和国家地磁台网中心单方收录且磁暴形态较为明显,Dst 指数小于-30nT 的事件,均认为其为磁暴事件,选取进入本文的数据集。

最终,共选取2008-2018 年期间的55 个磁暴事件与42 个磁扰事件,于国家地磁台网中心获取上述事件发生期间泉州、武汉、琼中三台记录的地磁H 分量数据。

将所有磁暴事件以及非磁暴事件中随机选取50%作为训练集,25%作为验证集,剩下25%作为测试集。分类完毕后,每个事件截取长度为3 天的数据。将数据中少量缺数的位置采用三次样条插值,对于大面积缺数的数据采取删除处理。随后进行归一化处理,本文采用比较简单的归一化方式归一化特征值等于(特征值- 训练集最小值)/(训练集最大值- 训练集最小值)。最终形成数据集并生成训练集和测试集;其中:训练集中磁暴数据样本量为615,非磁暴数据样本量为430,测试集中磁暴数据数据量为130,非磁暴数据数据量为120 个。

随后,以预处理好的地磁数据集为输入,设定磁暴事件SoftMax 层输出为[1,0],磁扰事件输出为[0,1],初始化相关参数,进行系统的训练,每30 次训练计算一次测试集Loss(代价函数)和准确率。通过调整超参数得到最佳的训练效果,最终确定超参数如下:在一维卷积神经网络中,训练轮数为200,训练批大小为50,训练速率恒定为0.0001.Dropout 几率为50%。

3 识别结果

随着训练次数的增加,训练集和验证集准确率逐渐上升并超越90%,与此同时,从训练集和验证集的代价函数曲线也可明显看出,一维卷积网络在350 次迭代时验证集准确率不再上升,之后验证集的准确率和代价函数大小几乎不再发生变化,如图3 所示。

图3 一维卷积网络训练过程

表1 为一维卷积神经网络的详细训练结果情况。由表可知,验证集对磁暴识别的准确率在约为90%左右,识别结果误差与人工识别的误差相差不大,验证集LOSS 略大于测试集LOSS。因此,利用人工智能深度学习可以很好的实现急始磁暴的自动识别。

表1 训练结果

4 结论与讨论

本文针对性的设计了磁暴非磁暴自动判别算法。采用基于卷积神经网络迁移学习的方法以及设计一维卷积神经网络对磁暴和磁扰事件进行训练识别,结果表明,一维卷积神经网络训练效果有不错的表现,与人工标注引发的误差较为接近,且一维卷积神经网络由于参数少结构简单,训练速度最快,适合用于磁暴自动识别。值得注意的是,本文只是针对特定数据的迁移学习测试并不能用来评判网络性能的好坏。同时,由于训练样本和测试样本较少,本次结果并不一定能代表神经网络的真实表现。因此有待于尽可能多的获取磁暴数据进行训练。

致谢

感谢ISGI 以及国家地磁台网中心的数据,感谢编辑老师及匿名审稿专家提出的各类建议。

猜你喜欢

台网卷积神经网络
基于全卷积神经网络的猪背膘厚快速准确测定
基于神经网络的船舶电力系统故障诊断方法
MIV-PSO-BP神经网络用户热负荷预测
基于改进Hopfield神经网络的对地攻击型无人机自主能力评价
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
地球物理台网仪器维修信息管理的研究与实现
三次样条和二次删除相辅助的WASD神经网络与日本人口预测