APP下载

基于增量稀疏核极限学习机的发动机状态在线预测

2019-02-22刘敏张英堂范红波李志宁

北京理工大学学报 2019年1期
关键词:增量排气权重

刘敏, 张英堂, 范红波, 李志宁

(陆军工程大学石家庄校区,河北,石家庄 050003)

发动机状态在线预测是在其运行过程中通过实时预测其转速、油压、油温、水温、排气温度、振动特征和油液金属磨粒浓度等状态参数,分析发动机健康状况发展趋势,及时发现并排除其潜在和早期故障,从而实现预知维修,对提高设备可靠性,降低维护成本具有重要意义[1].

与离线预测相比,在线预测模型具有对新增样本进行自学习以实时更新自身预测能力的优势,预测精度高且自适应性强. 因此,国内外学者提出了大量基于人工神经网络[2],支持向量机[3],极限学习机与核极限学习机[4]等智能学习算法的在线预测方法,并取得了良好的应用效果. 然而由于在线预测过程中,样本贯序累积,且缺乏有效的样本筛选和在线建模策略,导致在线预测模型存在模型膨胀、泛化性不足和更新时间过长等问题,在线预测的实时性与准确性有待提高[5-6].

大量研究表明,样本稀疏化和增量式建模是解决上述问题的有效途径[7-8]. Huynh等[9]提出了具有增量建模能力的在线贯序神经网络,但未进行样本稀疏化. Zhou等[10]基于滑动时间窗与Cholesky因式分解提出了带有遗忘机理的在线KELM模型,实现了样本后向删减与增量建模,一定程度上提高了在线建模效率. Simone等[11]提出了基于近似线性独立的在线贯序KELM,通过预设误差阈值筛选有效样本增量更新预测模型,提高了在线建模效率. 张英堂等[12]提出了基于快速留一交叉验证的在线KELM模型,自适应筛选有效新增样本更新预测模型,进一步提高了模型泛化性和在线更新速度. 然而由于缺乏删除旧样本和限制模型膨胀的有效策略,上述在线预测模型在实际应用中的在线处理能力仍有待提升.

因此,本文提出了增量稀疏核极限学习机算法,并将其应用于发动机状态在线预测. 首先提出样本信息度量方法稀疏化训练样本,并在线构造规模有限且结构稀疏的稀疏测量矩阵,然后提出增样更新与迁移更新算法相结合的方法对核权重矩阵进行增量更新,最终实现ISKELM的快速在线建模.

1 增量稀疏核极限学习机模型

(1)

式中:L为隐层节点数;β=[β1β2…βL]T为隐层输出权重向量;h(xi)=[h1(xi)h2(xi)…hL(xi)]为从n维输入空间到L维隐层特征空间的特征映射向量.

ELM的训练目标是训练误差和输出权重范数的最小化,可以表述为

(2)

通过解最优化方程可得

β=HT(γ-1+HHT)-1y,

(3)

式中:H=[h(x1)Th(x2)T…h(xt)T]T为所有输入的映射矩阵;y=[y1y2…yt]T为输入对应的目标输出向量;γ为惩罚系数. 应用Mercer条件定义核矩阵G=HHT,G(i,j)=h(xi)·hT(xj)=k(xi,xj). 由此,得到KELM的模型输出为

ft(·)=h(·)HT(γ-1I+HHT)-1y=

(4)

式中:k(·)为核函数矩阵;α为KELM的输出权重矩阵.

k(·)=[k(x1,·)k(x2,·)…k(xt,·)].

(5)

α=[α1α2…αt]=(γ-1I+G)-1y.

(6)

由式(4)可知,随着样本数的增加,模型的计算量持续增大,在线化处理困难. 因此,需要筛选有效样本以对k(·)进行稀疏化处理,从而提高在线建模效率. 根据稀疏表征理论[8],基于k(·)构造稀疏测量矩阵Φt如下:

Φt=[k(c1,·)k(c2,·)…k(cmt,·)].

(7)

则增量稀疏核极限学习机模型在时刻t的输出可以定义为

(8)

式中:{c1,c2,…,cmt}⊂{x1,x2,…,xt},ci为第i个核中心样本;mt≪t为有效样本数,即模型的阶数;αi,t为t时刻第i个核函数的权重.

t+1时刻样本xt+1对应的输出表示为

(9)

当样本序贯产生时,为实现增量稀疏核极限学习机的在线建模,本文提出了基于样本信息度量的稀疏测量矩阵构造方法和基于增样更新与迁移更新算法相结合的核权重矩阵递推更新方法.

2 基于样本信息度量构造稀疏测量矩阵

2.1 样本信息度量方法

设样本xt+1在Ft下的条件后验概率为pt(xt+1|Ft),则将xt+1对当前测量矩阵Φt的有效信息量定义为xt+1在时刻t的条件概率自信息量.

I(xt+1|Ft)=-logpt(xt+1|Ft).

(10)

设测量矩阵Φt的在Ft原子个数为mt,核中心ci(1≤i≤mt)的条件后验概率为pt(ci|Ft),则将Φt在时刻t所具有的平均自信息量定义为Φt的条件概率熵,即:

对于Ft下的

Φt=[k(c1,·)k(c2,·)…k(cmt,·)],

利用核密度估计计算得到核中心c的条件后验概率为

(12)

式中θ为核宽度.

因此,xt+1的条件概率自信息量和Φt的条件概率熵分别表示为

(13)

(14)

本文中基于I(xt+1|θ,Ft)和H(Φt|θ,Ft)筛选有效样本并删除冗余样本,在线构造稀疏测量矩阵,其基本过程包括在线扩充和在线修剪矩阵,其基本过程如图1所示. 文中采用的核函数均为单位范数核,即∀x∈X,k(x,x)=1.

图1 测量矩阵Φ t的构造过程Fig.1 Construction process of the measurement matrix Φt

2.2 稀疏测量矩阵在线扩充

测量矩阵Φt中所有核中心的条件后验概率矩阵为pt(c|θ,Ft):

(15)

根据式(11)得到Φt的条件概率熵为

(16)

(17)

式中kt=[kθ(c1,xt+1)…kθ(cmt,xt+1)]T∈mt×1.

(18)

(19)

(20)

2.3 稀疏测量矩阵在线修剪

(21)

由以上分析可知,本文中提出的样本稀疏化方法,无需预先定义稀疏化参数,而是根据新旧样本的有效信息量对大规模样本进行无监督稀疏化,具有更高的自适应性和灵活性,可提高样本稀疏化效率. 在最佳阶数内扩充与修剪测量矩阵,仅保留最有效样本,可使矩阵始终保持规模和结构最优化. 经分析可知,构造测量矩阵的计算复杂度为O(m). 在稀疏化条件下,m值有限且较小,可有效满足实际在线应用的要求.

3 ISKELM核权重矩阵增量更新

为匹配稀疏测量矩阵扩充与修剪过程,限制模型膨胀,并实现核权重矩阵的快速更新,本文提出一种增样更新和迁移更新算法相结合的改进增量式建模方法.

3.1 增样更新算法

核权重矩阵增样更新过程对应于测量矩阵Φt在线扩充过程. 当Φt规模小于m时,若新样本满足2.2节中的条件,则用于扩充Φt,同时更新相应核权重矩阵. ISKELM的核权重矩阵为α=(γ-1I+G)-1y. 在时刻t,记Ct=γ-1I+Gt.

对于t+1时刻的新样本(xt+1,yt+1),有

(22)

式中λt=γ-1+kt+1,t+1,kt=[k1,t+1…kmt,t+1]T.

Ct+1的逆矩阵为

(23)

3.2 迁移更新算法

核权重矩阵迁移更新过程对应于测量矩阵Φt的在线修剪过程. 当Φt规模达到最大m时,为实现现有规模为m下的模型更新,本文提出一种利用有效样本替换冗余样本的迁移更新算法.

(24)

(25)

对于t+1时刻的新样本(xt+1,yt+1)有

(26)

(27)

本文提出的方法在最佳阶数内对当前模型核权重矩阵进行递推更新,极大地缩短了计算时间,同时有效限制了模型膨胀. 同时,核权重矩阵更新计算复杂度为O(m2),满足实际在线应用要求.

4 仿真与实验分析

为说明本文所提方法在系统状态在线预测中的有效性,以Lorenz混沌时间序列模拟复杂系统数据变化过程进行在线预测仿真实验. 以8V150ZAL型柴油机为对象进行发动机状态参数在线预测实验分析. 利用ISKELM进行在线预测仿真与实验分析的流程如图2所示.

图2 ISKELM在线预测流程图Fig.2 Online modeling process of ISKELM

4.1 Lorenz混沌时间序列预测实验

将ISKELM应用于Lorenz混沌时间序列在线预测,以验证本方法的有效性. Lorenz混沌时间序列可描述为

(28)

从Lorenz时间序列中选1 000个数据点,令嵌入维数为10,得到990组样本. 由于在线预测中用于初始建模的已有样本较少,在线新增样本较多,因此将所有样本按1∶4的比例分为训练样本和测试样本. 即以前190组作为训练样本初始化预测模型,后800组作为测试样本模拟在线数据对初始模型进行在线更新. 分别建立FM-OKELM,FL-OKELM和ISKELM三种预测模型作为对比实验对时间序列进行在线预测. 模型初始化训练阶段,选择KELM的核函数为高斯核函数,即k(ui,uj)=exp(-‖ui-uj‖2/θ). 任取网络参数(γ,θ)值为(2,1),设FL-OKELM的时间窗长L∈(1,40),ISKELM的稀疏测量矩阵规模m∈(1,40). 则190组样本训练得到的均方根误差(RMSE)平均值随L和m的变化曲线如图3所示.

图3 时间序列预测误差随L与m的变化曲线Fig.3 Curves of prediction error varying with the change of L and m for Lorenz time series

由图3可知,分别取FL-OKELM的时间窗长L=15,ISKELM的稀疏测量矩阵规模m=9,可使得模型预测精度最高且规模最小,同时可防止模型膨胀. 以预测精度为适应度值,对FL-OKELM与ISKELM中KELM的网络参数(γ,θ)进行寻优,根据大量研究经验[1]将参数寻优范围分别设置为γ∈[0.1,1 000],θ∈[0.1,1 000],进而通过网格搜索法得到两个网络中(γ,θ)参数组合的最优值分别为(987,3.33)和(865,2.24),从而建立预测模型. 同理得到FM-OKELM的最佳(γ,θ)值为(513,1.76),并建立相应预测模型. 利用以上三种模型对Lorenz混沌时间序列进行800步在线预测,得到预测曲线如图4所示.

图4 Lorenz混沌时间序列预测曲线Fig.4 Prediction curves of Lorenz time series

由图4可知,当预测步长较小时,三种方法均可较好地匹配目标序列. 但随着预测步长的增加,FL-OKELM和FM-OKELM的预测误差变大,而ISKELM仍保持较高的预测精度. 在整个预测过程中,ISKELM的预测结果与实际值基本吻合,精度最高且相对稳定.

图5是800步预测中三种方法的计算时间与预测步长的变化关系曲线,其中“+”表示800个样本中用于模型在线更新的有效样本.

图5 在线预测时间与预测步长变化关系曲线Fig.5 Curves of prediction time varying with the change of prediction step

由图5可以看出,ISKELM只筛选了部分样本作为有效样本对模型进行增量更新,而且预测步长越长,样本筛选效率越高,从而大大缩短了模型的在线学习时间. 因此,与FL-OKELM和FM-OKLEM相比,ISKELM具有更快的在线预测速度.

利用三种方法对Lorenz混沌时间序列进行在线预测时的模型训练和测试结果如表1所示.

表1 Lorenz混沌时间序列在线预测结果

由表1可知,在测试阶段,与FM-OKELM和FL-OKELM 相比,ISKELM的预测速度分别提高了84.29%和57.55%,预测精度分别提高了40.16%和26.94%. 此结果进一步证明ISKELM通过筛选有效样本和删除冗余样本,并在最佳阶数内对模型进行递推更新,可有效提高样本稀疏化效率,限制模型膨胀,并缩短在线建模时间,进而提高在线预测的速度和精度.

4.2 变速工况下发动机状态参数在线预测

发动机结构复杂,状态参数繁多,对其状态进行在线预测时,需选择测试分析简便、抗干扰性强且能有效反映其动力性能和技术状况变化过程的参数表征其工作状态. 排气温度作为主要的气动热力性能参数可有效表征发动机的燃烧效率和热损耗,且测试方便、干扰小,常用于表征发动机运行状态[1]. 故本文通过预测排气温度变化过程,分析发动机技术状态变化趋势.

在8V150ZAL型柴油机变速工况下,采集其排气温度数据,部分相关实验数据如表2所示.

表2 柴油机运行状态参数

从所有实验数据中截取201组数据,以1为嵌入维数,构造200组时间序列样本. 按在线预测中新增样本体量大的原则划分训练集与测试集,以前70组作为训练样本初始化模型,后130组作为测试样本在线更新模型. 在模型初始化阶段,70组样本训练得到的平均RMSE随L和m的变化曲线如图6所示.

图6 排气温度预测误差随L与m的变化曲线Fig.6 Curves of prediction error varying with the change of L and m for exhaust gas temperature

由图6可知,FL-OKELM的时间窗长和ISKELM的稀疏测量矩阵规模的最佳值分别为L=7和m=5. 与4.1节相同,利用网格搜索法获得KELM网络结构参数(γ,θ)的最佳值,并建立相应预测模型,各模型对排气温度进行130步预测得到的预测曲线如图7所示.

由图7可知,ISKELM可以更好地匹配目标序列,准确预测排气温度的变化趋势,有效跟踪和反映柴油机的技术状态. 利用三种方法对排气温度进行在线预测时的模型训练和测试结果如表3所示.

由表3中数据可知,在测试阶段,与FM-OKELM 和FL-OKELM相比,ISKELM的预测速度分别提高了80.50%和31.72%,预测精度分别提高了48.56%和15.81%. 该实验结果进一步证明ISKELM在模型在线学习和更新方面具有明显优势,可有效提高发动机状态在线预测速度和精度.

图7 排气温度预测曲线Fig.7 Prediction curves of exhaust gas temperature

表3 发动机排气温度在线预测结果

5 结 论

为解决在线预测中样本贯序累积且稀疏化效率较低、模型膨胀和更新速度较慢等问题,建立了规模有限且结构稀疏的ISKELM在线预测模型. 基于样本信息度量实现样本自适应前向稀疏与后向删减,并在最佳阶数内对稀疏测量矩阵进行在线扩充与修剪,提高了样本稀疏化和在线建模效率. ISKELM采用增样更新与迁移更新算法对核权重矩阵进行增量更新,降低了算法复杂度,提高了模型在线更新速度. 混沌时间序列与发动机状态参数在线预测仿真与实验结果表明,与FM-OKELM和FL-OKELM等现有模型相比,ISKELM具有更高的在线预测速度和精度,为发动机状态在线预测提供了新的更有效的方法.

猜你喜欢

增量排气权重
某车型排气消声器冰堵问题的分析及优化
导弹增量式自适应容错控制系统设计
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
研发信息的增量披露能促进企业创新投入吗
提质和增量之间的“辩证”
权重常思“浮名轻”
GDI发动机排气系统性能优化分析
特大城市快递垃圾增量占垃圾增量93%
为党督政勤履职 代民行权重担当
权重涨个股跌 持有白马蓝筹