APP下载

基于极限学习机的极移中长期预报*

2020-05-12赵丹宁

天文研究与技术 2020年2期
关键词:实线学习机神经元

赵丹宁,雷 雨

(1. 宝鸡文理学院电子电气工程学院,陕西 宝鸡 721016;2. 西安邮电大学计算机学院,陕西 西安 710121)

地球极移表示地球瞬时自转轴相对于地球表面或者历元平极的运行,是表征地球自转变化的一个重要参量,简称极移。极移的两个分量xp和yp、UT1-UTC与岁差、章动统称为地球定向参数(Earth Orientation Parameters, EOP),地球定向参数是天球参考系和地球参考系相互转换的必需参数。甚长基线干涉(Very Long Baseline Interferometry, VLBI)和全球导航卫星系统(Global Navigation Satellite Systems, GNSS)等空间大地测量技术的极移测定精度可达0.05 mas[1]。但由于复杂的资料处理过程,由空间大地测量技术获取的极移结果存在一定的延迟,而深空探测和卫星精密定轨等领域对极移的实时测量有重要需求,所以对极移进行短期预报就显得尤为必要,此外,极移中长期预报在卫星自主导航和天文地球动力学研究中也有重要应用,因此,极移的中长期预报具有重要的科学及现实意义。

国内外学者提出了多种极移预报方法,如最小二乘外推[2]、自协方差模型[3]、模糊推理系统[4]、神经网络[5]、自回归模型[5-6]以及这些模型的不同组合。受大气和海洋等多种激发源的影响,极移呈现复杂的非线性、非平稳变化,因此,采用神经网络等非线性方法对其进行预报在理论上更为合适,许多学者将神经网络应用于极移预报,取得了较好的预报效果[7-8]。国际地球定向参数比较活动的结果也表明,神经网络是当前极移预报精度最高的方法之一[9]。

反向传播神经网络是当前应用最为广泛的一种网络学习算法,在时间序列预测、图像处理和自动控制等领域均有应用,但反向传播神经网络存在易陷入局部极小值、学习速度慢和泛化能力弱等缺点。极限学习机是近年发展起来的一种新型单隐含层前馈神经网络,其特点是隐含层神经元的权重可以随机给定,且不需要更新,网络学习过程仅计算输出权重,因此,在学习速度与泛化能力方面较传统反向传播神经网络具有一定优势[10-11]。基于此,本文将极限学习机神经网络应用于极移中长期预报,根据极移时间序列特征,建立了基于极限学习机神经网络的极移预报模型,试验结果验证了极限学习机神经网络应用于极移预报的有效性和实用性。

1 极限学习机原理

给定N个训练样本(xi,yi),其中,输入向量xi=[xi1,xi2, …,xiu]T∈Ru,输出向量yi=[yi1,yi2, …,

yiv]T∈Rv,u,v分别为输入向量维数与输出向量维数,则具有h个隐含层节点的单隐含层前馈神经网络能够以零误差逼近这N个样本,即[10]:

(1)

其中,wj=[wj1,wj2, …,wju]T为第j个隐含层神经元与输入层神经元间的连接权重;βj=[βj1,βj2, …,

βjv]T为第j个隐含层神经元与输出层神经元间的连接权重;bj为第j个隐含层神经元的偏置;g(x)为激活函数。(1)式可以表示为矩阵相乘的形式:

Y=Hβ,

(2)

其中,H为隐含层输出矩阵:

(3)

β和Y为

(4)

极限学习机神经网络的训练步骤如下[10]:(1)随机选取输入层权重wj和偏置bj,j=1,2,…,h;(2)计算隐含层输出矩阵H;(3)计算输出层权值β=H†Y,其中H†为矩阵H的Moore-Penrose广义逆。

2 预报方法

2.1 最小二乘外推

最小二乘外推模型包含3部分:线性趋势项、钱德勒项和周年项,其数学模型为

(5)

其中,T1,T2分别为钱德勒项和周年项的振荡周期,取T1=432.08天、T2=365.24天;a,γ为趋势项参数;c1,d1为钱德勒项参数;c2,d2为周年项参数,这些未知参数可以根据最小二乘法求解。

2.2 神经网络模型构建

最小二乘拟合残差含有剩余的短周期成分,也含有各种准周期和非线性成分,对于这些成分,利用神经网络的非线性拟合能力对其进行建模与预报。依据神经网络模型构建与极移预报的实际情况,采用如下方式确定网络的输入和输出:

[ε(t-k-u+1),ε(t-k-u+2),…,ε(t-k)]→ε(t) ,

(6)

其中,ε(t)为最小二乘拟合残差,t=1, 2, …,n;k为预报跨度。为了提高数据利用率,采用滑动窗口的方式构建训练样本:

(7)

相应地,在预报阶段网络的输入和输出为

[ε(n-u+1),ε(n-u+2),…,ε(n)]→ε^(n+k),

(8)

其中,ε^(n+k)为神经网络模型的第k步预报值。

由于本文利用极限学习机神经网络实现从输入到输出的非线性映射,需要事先确定激活函数类型和网络拓扑结构(输入层神经元数和隐含层神经元数),其中,激活函数选用Sigmoid函数,表达式为

g(x)=1/(1+e-x) .

(9)

由于网络拓扑结构对网络性能有至关重要的影响,为了确定较优的网络拓扑结构,通过观察网络训练误差随输入层神经元数和隐含层神经元数的变化情况优化网络拓扑结构,即网络训练误差最小时所对应的输入层神经元数和隐含层神经元数为最优输入层和隐含层神经元数。以预报跨度30 d为例,图1给出了网络训练均方根误差(Root Mean Square Error, RMSE)随输入层和隐含层神经元数的变化情况,从图1可以看出,当输入层神经元数为17、隐含层神经元数为47时,网络训练均方根误差最小。

图1 网络训练均方根误差随输入层和隐含层神经元数的变化情况

Fig.1 Changes of the network training RMSE with the neutron number of input and hidden layers

3 方法验证

为了评估极限学习机神经网络用于极移长期预报的性能,首先将本文的预报结果同文[7]的反向传播神经网络预报结果进行比较和分析,为了较为客观地对二者的结果进行对比,本文预报过程中采用与文[7]相同的预报策略和误差评价指标,其中,试验数据采用国际地球自转与参考服务(International Earth Rotation and Reference Systems Service, IERS)发布的EOP 05C04序列,基础数据长度为3年,预报时段为2001年4月6日(MJD 52005)至2010年3月25日(MJD 55280),每隔91天预报一次,一共进行了37期的预报,预报误差评价指标选用平均绝对误差(Mean Absolute Error, MAE),其计算公式为

(10)

其中,Oj,Pj分别表示j点的观测值与预测值;l为预报期数。

图2给出了本文极移预报结果的误差曲线和文[7]预报结果的误差曲线,表1统计了两者1天、5天、10天、20天、30天、60天、90天、120天、180天、240天、300天和360天预报跨度的平均绝对误差。从图2和表1可以看出,对于xp分量中长期预报,除了120天、180天和240天的极限学习机神经网络方法的预报精度稍逊于文[7]的反向传播神经网络方法,其余跨度的预报精度优于文[7]的反向传播神经网络方法或与之相当;对于yp分量中长期预报,除了120天的预报精度稍逊于文[7]的反向传播神经网络方法,其余跨度的预报精度优于文[7]的反向传播神经网络方法或与之相当。从图2还可以发现,极限学习机神经网络预报误差曲线变化比较平缓,预报误差呈现逐渐增大的趋势,而反向传播神经网络预报误差曲线跳跃较为明显,预报误差不稳定。

图2 极限学习机神经网络预报误差与文[7]预报误差的对比

Fig.2 Comparison of the prediction errors for pole coordinates obtained by the ELM and reference [7]

表1 极限学习机神经网络极移预报与文[7]预报结果的平均绝对误差统计(单位: mas)

为了进一步分析极限学习机神经网络方法的预报性能,本文也预报了2005年10月1日至2008年2月28日(与EOP PCC时段相同)不同预报跨度的极移值,并将本文预报结果的平均绝对误差与EOP PCC预报结果的平均绝对误差进行对比分析[9],如图3~图5,图中数字代表参与EOP PCC的不同团队的编号,不同颜色曲线表示不同团队预报结果的平均绝对误差,参与EOP PCC的团队详细情况见文[9],其中,极移超短期(1~10天)预报精度较高的团队是Kalarus(编号061,黑色实线)和IERS EOP产品中心(编号071,绿色实线);短期(1~30天)预报精度较高的团队是Kalarus(编号061,黑色实线)、Zotov(编号091,浅蓝色实线)和Kosek(编号051,灰蓝色实线);中长期(1~500天)预报精度较高的团队是Kalarus(编号061,黑色实线)和Kosek(编号051,灰蓝色实线)。

从图3~图5可以看到,对于1~10天的超短期预报,极限学习机神经网络方法的预报精度仅低于排在第1位的Kalarus团队的预报精度,优于其他团队的预报精度;对于1~30天的短期预报,极限学习机神经网络方法的预报精度大体处于所有团队的中间位置;对于1~500天的中长期预报,极限学习机神经网络方法的预报精度低于排在第1位的Kalarus团队的预报精度,稍逊于排在第2位的Kosek团队的预报精度或与之相当,优于其他团队的预报精度。

图3 极限学习机神经网络超短期(1~10天)预报误差与EOP PCC的对比

Fig.3 Comparison of the ultra short-term (1-10d) prediction errors obtained by the ELM and EOP PCC

图4 极限学习机神经网络短期(1~30天)预报误差与EOP PCC的对比

Fig.4 Comparison of the short-term (1-30d) prediction errors obtained by the ELM and EOP PCC

图5 极限学习机神经网络中长期(1~500天)预报误差与EOP PCC的对比

Fig.5 Comparison of the medium- and long-term (1-500d) prediction errors obtained by the ELM and EOP PCC

4 结 论

本文针对极移序列非线性、非平稳变化的特性,将一种新型极限学习机神经网络用于极移中长期预报。通过预报试验可以发现,极限学习机神经网络用于极移中长期预报可以获得较好的预报效果。与反向传播神经网络预报结果的对比表明,极限学习机神经网络的预报精度优于反向传播神经网络的预报精度;与EOP PCC预报结果的比较发现,极限学习机神经网络的中长期预报精度优于大部分参与EOP PCC团队的预报精度。

猜你喜欢

实线学习机神经元
小编话交规“刘星”你违法啦!
“机”关
AI讲座:神经网络的空间对应
基于随机权重粒子群优化极限学习机的土壤湿度预测
秋天来啦
戒烟
仿生芯片可再现生物神经元行为
采用GCaMP6 在体大规模记录感觉神经元的活动
基于改进极限学习机的光谱定量建模方法
烧脑数独时间,叮!给你的大脑做做操。