APP下载

基于长短期记忆网络的风电机组齿轮箱故障预测

2020-11-06尹飞飞江国乾

计量学报 2020年10期
关键词:油温齿轮箱风电

何 群, 尹飞飞, 武 鑫, 谢 平, 江国乾

(燕山大学 电气工程学院,河北 秦皇岛 066004)

1 引 言

风能是一种清洁、可再生能源,近些年发展迅猛,装机容量持续增加[1]。风电机组通常分布在沿海、山区等风能丰富但自然条件恶劣的地区,机组长时间连续运行容易发生各种故障。统计发现[2],齿轮箱是风电机组主要的故障来源之一。由于其工作在高转速、高负载的条件下,长期运行容易发生轴承磨损、齿轮失效等故障,给风电场带来巨大的经济损失。因此,研究可靠有效的齿轮箱故障预测方法,对提高风电机组运行可靠性和降低机组维护成本具有重要的意义。

齿轮箱是由轴承、齿轮等部件组成,在其运行过程中各种机械部件具有复杂的耦合关系,从而产生的各种状态信号往往呈现出非线性特点并包含有大量噪声,使得齿轮箱早期故障特征难以提取。为此,国内外相关学者提出了多种不同的特征提取的方法,如小波包分析[3]、局部时频熵[4]、多层去噪自动编码器[5]等。这些方法需要在机组上二次安装振动传感器,成本较高;而数据采集与监视控制(supervisory control and data acquisition, SCADA)系统是集成在风电机组中,无需安装额外的监控系统,可以大大节约成本。因此,基于SCADA运行数据的风电机组状态监测已成为近年来风电领域的研究热点[6~8]。如文献[7]利用人工神经网络方法对SCADA数据进行建模实现了齿轮箱轴承早期故障的检测;文献[8]基于SCADA数据建立贝叶斯数据驱动模型,用于风电机健康状态的监测与评估;文献[9]将主成分分析与极限学习机结合,建立了风电主轴承的温度监测模型,实现了主轴承温度过高故障的提前预测。上述方法在风电机组关键部件的状态监测问题上取得了较好的应用成果,然而这些方法本质上仍属于浅层学习模型,对复杂的状态监测数据建模能力有限,不能很好地挖掘数据的内在结构信息和关联性,其建模精度也有待进一步提高。

深度学习[10]方法作为一种新兴的机器学习方法,由于其强大的特征学习和非线性系统建模的能力,已经广泛应用于图像处理、语音识别和脑机接口[11]等领域并取得了突破性成果。近年来,该方法也逐渐被应用于风电系统的健康监测与故障检测。如文献[12,13]分别提出深度信念网络和深度神经网络方法,对风电机组SCADA数据进行健康行为建模,通过模型预测值与真实值之间的残差作为状态检测量,实现了对主轴承和齿轮箱的故障预测。

然而,SCADA数据本质上是由多个传感器采集的多维时间序列。由于不同子系统或子部件间的关联耦合和相互交叉作用,使得数据之间存在空间关联性;并且,时序数据当前时刻信息与历史时刻信息有密切的时序关联性[14,15]。已有方法均没有很好地考虑SCADA多变量数据内在的时空关联性。为了解决这一问题,本文提出了基于长短期记忆(long short-term memory,LSTM)网络[16]的齿轮箱故障预测方法。考虑到当齿轮箱出现齿轮磨损、齿蚀或疲劳引起的点蚀等各种故障时,均会引起齿轮箱油温升高[17,18],因此选取油温作为目标预测变量;充分考虑其与其它相关传感器数据之间在时空维度上的重要关联信息,建立齿轮箱正常运行时的油温监测模型;进一步在正常运行模型重构残差的基础上采用指数加权移动平均值(exponentially weighted moving-average,EWMA)设定阈值控制线,用于齿轮箱油温状态的故障预测;最后通过实例分析验证了所提方法的有效性。

2 风电机组SCADA监测数据描述

本文所使用的风电机组SCADA监测数据来自内蒙古某风电场,所安装的风电机组是额定功率为1.5 MW的变速恒频发电机组,其SCADA系统的采样间隔为30 s,机组监测数据包括111个维度,记录内容包括机组运行状态、外界环境状态、运行时间等离散信息。其中记录风电机组运行状态的有47维数据,内容包括风电机组整体的发电量、功率、电流、电压等信息和机组各个部分的信息,如齿轮箱、轴承和轮毂等;记录外界环境状态的有10维数据,分别记录环境的风速、风向和温度等信息;运行时间记录每次SCADA系统采集数据的具体时间。

虽然编码器记录了监测量的安全阈值,但是由于安全阈值是静态的并且过于宽泛,当发出报警时风电机组故障已经非常严重,无法起到预防以减少维修时间和保证发电量的效果。为此,针对SCADA数据的多维时空相关特点,充分考虑不同传感器数据空间维度之间和时间维度上的相互耦合关系,建立反映齿轮箱动态特性的故障预测模型,实现故障的早期检测及预测。

3 LSTM网络原理

LSTM网络模型[15]是传统循环神经网络(recurrent neural network,RNN)的变形。该网络每个记忆单元(cell)引入了输入门、输出门和遗忘门3个门控开关,其结构见图1。

图1 LSTM结构示意图Fig.1 A typical structure of LSTM

如图1所示,每个LSTM记忆单元有4个输入分别为z、zi、zf和zo。3个门控开关使用的是Sigmoid函数,输出结果是0~1之间的实数。式 (1)~式(6)是LSTM单元的原理推导。

输入门计算为:

it=σ(wi·[ht-1,xt]+bi)

(1)

式中:it表示输入门输出结果;σ(·)为Sigmoid函数;wi和bi分别为输入门对应的权重系数和偏置项;ht-1为前一时刻的输出;xt为当前时刻的输入。输入门决定了输入信息被保留的程度,输出为0时表示完全丢弃,输出为1时被完全保留。遗忘门计算为:

ft=σ(wf·[ht-1,xt]+bf)

(2)

式中:ft为遗忘门输出结果;wf和bf分别为遗忘门对应的权重系数和偏置项。遗忘门决定了前一时刻的记忆是否被保留,当输出为0时前一时刻记忆被清除,输出为1时,前一时刻记忆都被保留。当前输入为:

(3)

(4)

式中:Ct为当前输入的信息和经过遗忘门作用的上一时刻cell中的信息相加后,cell最终获得的结果;Ct-1为前一时刻cell的状态。输出门计算为:

ot=σ(wo·[ht-1,xt]+bo)

(5)

式中:ot为输出门输出结果;wo和bo分别为输出门对应的权重系数和偏置项。输出门决定了cell中的信息输出程度,结果为0时表示完全不输出,输出为1时cell的信息被全部输出。LSTM记忆单元的最终输出为:

ht=ot·tanh(Ct)

(6)

LSTM网络不仅根据当前的输入调整权重,还根据之前的输入调整权重,并且通过引入遗忘门解决了传统RNN模型梯度消失的问题,是目前实际应用中最高效的时间序列模型[19,20]。由于SCADA系统是由大量传感器每隔一定时间采集的数据,每个传感器采集的数据在本质上是一维时间序列,因此当前信息变化与之前信息有着紧密的时间依赖性。为此,LSTM网络非常适合于具有动态时空相关性特点的多变量SCADA数据建模,以期建立更为可靠精确的预测模型。

4 基于LSTM网络的齿轮箱故障预测

图2为所提出的风电齿轮箱故障预测方法流程图,该方法主要包括齿轮箱油温模型离线训练和在线监测两部分。其中,离线训练部分使用大量正常运行的数据训练出健康模型;在线监测部分实时预测油温并通过EWMA控制图加权计算其残差,若超出阈值,则对故障发出故障预警。

图2 风电齿轮箱故障预测流程图Fig.2 Flowchart of wind turbine gearbox fault prediction

4.1 模型构建

以齿轮油温T为目标建模变量,建立风电齿轮箱的健康状态LSTM网络模型。首先应确定输入特征,由于SCADA数据维数较多,为减少训练时间和无关变量的影响,根据文献[7,13]建议,选取7个变量:齿轮箱前轴承温度T1、齿轮油入口温度T2、齿轮箱后轴承温度T3、环境温度T4、机舱温度T5、发电机转速S1和齿轮箱转速S2,则模型的输入X表示为:

X=[T1,T2,T3,T4,T5,S1,S2]

(7)

图3 LSTM网络模型Fig.3 LSTM network model

确定好模型的层数和每层的记忆单元后,采用基于时间的反向传播算法来学习模型的各个权重和偏置。模型的激活函数采用式(8)的双曲正切函数,训练时采用式(9)所示的损失函数。

(8)

L(T,f(X))=(T-f(X))2

(9)

4.2 阈值设定

使用已经训练好的LSTM网络模型对齿轮箱的温度进行预测,并计算出预测温度与真实温度之间的重构误差(reconstruction error,ER):

(10)

当齿轮箱在健康状态时,ER在一定范围内变化,当健康状变化时,ER也随之增大,实时监测ER的大小对于防止即将发生的齿轮箱故障有重要意义。注意到在齿轮箱健康状态下预测误差也存在较小的波动性,所以EWMA设定阈值控制线。该方法有效地消除了噪声并且对均值小漂移敏感。根据健康状态下的误差,计算出齿轮箱油温的阈值,如果预测误差超过阈值,在线监测系统将会发出故障报警。

EWMA统计量st为:

st=ψERt+(1-ψ)st-1

(11)

式中:t表示时间;s0为风电机组某一段健康状态下ER的均值;ψ为历史ER对当前EWMA的统计权重,ψ∈(0,1],基于实验分析该过程中取ψ为0.2。μst为风电场中同种类型风电机组齿轮箱ER的均值:

μst=μER

(12)

st的方差为:

(13)

式中:σER为ER的标准差;nm为采样长度。

根据式(12)、式(13),得出齿轮箱的阈值函数为:

LU(t)=μst+Lσst

(14)

式中:L通常取3。得到的阈值[21]作为故障警告界限。

5 数据预处理与参数选择

5.1 数据预处理

为了更真实地反映各个变量随时间的变化关系,消除因各种环境变化的随机因素干扰,使用图4所示的滑动平均窗口的方法对数据进行预处理。考虑数据量大小和更好地包含时间维度信息,选取的时间窗大小N为60,步长为1。

图4 滑动平均窗口示意图Fig.4 Schematic of sliding window

5.2 模型参数选择

5.2.1 LSTM记忆单元个数选择

为了研究记忆单元个数对预测精度的影响,使用单个隐藏层作为训练模型,采用记忆单元逐渐递增的方式对温度进行预测,记录不同记忆单元个数的平均绝对误差(MAPE)和损失(loss)值,见表1。

表1 不同记忆单元个数的MAPE和loss值比较Tab.1 Comparison of MAPE and loss values for different number of memory units

由表1可知,在记忆单元个数为128时,预测精度达到最高,因此,本文网络模型第1个隐藏层记忆单元的个数选择为128。

5.2.2 网络隐藏层数选择

进一步讨论网络深度对模型预测性能的影响,选择网络隐含层数。此模型第一个隐藏层记忆单元个数与上节一致,采用逐层递减的方式进行模型构造并对预测精度进行测试,结果见表2。

表2 不同层数的MAPE和loss值比较Tab.2 Comparison of MAPE and loss values for different hidden layers

由表2可知,当模型层数为3时,预测精度达到最高。因此,此网络模型采用3个隐藏层,每个隐藏层的记忆单元个数分别为128,64,32。

5.2.3 训练次数选择

对模型进行训练时,如果训练次数不足,模型就不能达到最佳的收敛状态;反之训练次数过多,预测精度将不会再提升,并且耗费时间。为了选择最佳的训练次数,在每层记忆单元的个数和网络模型层数确定的基础上,逐渐增大训练次数,得到的结果见图5所示。

图5 loss值随训练次数变化曲线Fig.5 Loss value changes with training times

由图5可得出,训练集的损失曲线在0~10次迅速下降,10次后下降缓慢;测试集的损失曲线虽然有小的波动,但一直呈下降趋势。考虑到训练耗时问题,选择训练次数为30次。

6 实例分析

6.1 数据说明

选取内蒙古某风电场机组SCADA数据,选取2014年5月14日~2014年5月30日50号机组健康状态37 000个数据,其中前32 000作为训练数据集,后5 000个作为测试数据集。因为同一风电机没有齿轮箱故障,选取2014年7月22日~2014年7月24日同一线路的49号机组的5 000个数据作为故障验证数据集,所有数据的采样间隔为30 s。

6.2 正常状态下的齿轮箱模型测试

按照上述方法选择合适的参数构建LSTM网络模型,对齿轮箱油温进行预测。为了验证此方法的优势,与神经网络(BP)、SVM、随机森林(random forest,RF)、岭回归(ridge regression,RR)4种方法[22]进行比较。所有方法均采用相同的预处理,并在相同的数据集上进行模型训练、测试和验证。图6给出了在正常状态下,齿轮箱模型测试时几种不同方法的预测曲线。计算每一种方法的MAPE和标准差(SDAPE)个指标,结果见表3所示。

图6 5种模型温度预测曲线Fig.6 Five model temperature prediction curves

表3 5种模型的MAPE和SDAPE比较Tab.3 Comparison of five considered models in terms of MAPE and SDAPE

由图6可以看出:LSTM网络模型在健康状态下对齿轮箱油温拟合的更好;由表3可知:相比于其它4种模型,LSTM模型得到的MAPE和SDAPE误差指标最小,分别为0.52和0.57,这同样说明LSTM方法具有较强的油温建模拟合能力,更适合作为齿轮箱油温的预测模型。

6.3 故障状态下齿轮箱模型测试

使用5种模型在验证数据集上进行模型故障测试,验证数据集有5 000个数据,根据SCADA数据的状态码显示,风电机齿轮箱在4 421个点时发生油温过高故障。使用LSTM网络模型对验证集油温预测的曲线如图7所示,与之相对应的EWMA阈值控制图如图8所示。

图7 基于LSTM网络模型的油温预测曲线Fig.7 Oil temperature prediction curve based on LSTM network

根据图7和图8可得:LSTM模型在未发生故障时真实值和预测值之间的残差很小,对齿轮箱油温有很好的拟合能力;当发生故障时残差迅速变大,在第3 594个点时达到式(14)计算所得阈值并持续上升;与状态码记录的数据点相比提前了821个点,根据30 s记录1次数据计算,此模型提前了6.84 h预测出齿轮箱故障。

图8 故障状态齿轮箱EWMA阈值控制图Fig.8 The EWMA chart of gearbox under fault condition

分别使用5种模型对故障数据进行预测,把计算所得阈值、预测故障的数据点个数和预测时间分别记录在表4中。

表4 不同模型阈值与故障预测时间比较Tab.4 Comparison of different models in terms of detection thresholds and failure prediction time

由表4和表3中的数据可得:模型的预测精度越高,所得故障阈值越小,预测时间就越早;相比于其它4种模型,LSTM模型阈值最小,能最先预测出齿轮箱故障,有利于更早地采取措施,避免更严重的故障发生。

7 结 论

针对风电机组SCADA运行数据的多变量时空相关性特点,提出了基于LSTM网络的风电齿轮箱故障预测方法,旨在深层挖掘SCADA数据在时空维度的特征信息,为风电机组故障预测提供一种新思路。首先,建立健康状况下的LSTM网络模型,进行齿轮箱油温的预测;然后根据故障状态下,齿轮箱内部各种关系被破坏,其预测值与真实值之间的残差增大,从而对故障进行预测。该模型与SVM、RR、RF和BP等4种模型在MAPE和SDAPE两种误差指标上进行对比,结果显示所提出的LSTM故障预测模型对真实油温数据有更好的拟合能力,可以构建更为精确的重构模型。风电机组内部结构复杂,SCADA数据维数较多,在后续的研究中,应更加注重各种变量之间的耦合关系,选择合适的特征,对各种故障进行早期的识别和预测。

猜你喜欢

油温齿轮箱风电
风电齿轮箱轴承用钢100CrMnSi6-4的开发
海上风电跃进隐忧
分散式风电破“局”
一根筷子辨别油温
液压系统油温过高现象原因分析及改进
风电:弃风限电明显改善 海上风电如火如荼
提高齿轮箱式换档机构可靠性的改进设计
重齿风电
杭州前进齿轮箱集团股份有限公司
如何判断油温?