APP下载

基于核极限学习机的风电机组齿轮箱故障预警研究

2019-07-10刘帅刘长良曾华清

中国测试 2019年2期
关键词:风电机组信息熵

刘帅 刘长良 曾华清

摘要:风电机组运行环境恶劣、机组设备衰退是近年来齿轮箱故障频发的主要原因,其设备状态与机组安全性、运营成本息息相关。面对这一挑战,利用监控与数据采集系统数据,提出一种将保局投影、核极限学习机和信息熵相结合的风电机组齿轮箱故障预警方法。采用保局投影对风电机组状态参数进行特征提取后,使用核极限学习机建立状态参数预测模型,最后辅以改进的加入信息熵概念,可准确预警异常工况。以河北省张家口某一风电场的运行数据作为实例进行研究,仿真结果表明,所提算法至少能提前2天预警潜在故障,验证该预警方法的有效性与实效性。关键词:风电机组;故障预警;保局投影;核极限学习机;信息熵

中图分类号:TH17

文献标志码:A

文章编号:1674–5124(2019)02–0121–07

0 引言

风机的运行和维护问题已经成为制约风电产业发展的关键因素[1-2]。我国风能资源大多分布在人迹罕至的高山、荒漠、草原或海边,极其恶劣的环境严重影响风电机组的安全可靠运行,导致运行维护成本居高不下。据欧洲风电协会统计,运行维护成本占风电总生产成本的20%~25%,其中海上风电的运行维护成本更高达35%[3]。

监控与数据采集(supervisory control and data acquisition,SCADA)系统作为风电机组状态监测系统的重要组成部分,它能够全面记录含有风电机组故障信息的状态参数,且获取较为便捷。因此,目前有很多学者通过对SCADA数据的分析來检测风电机组的故障。Bangalore等[4]基于SCADA数据建立了检修计划模型,其模型依据风电机组的在役年限与机组运行状态评估故障概率。Antonino等[5]建立3种机器学习模型来监测风电机组的功率曲线;Christopher等[6]根据热力学第一定律的原理建立了风电机组齿轮箱的故障预警模型,通过齿轮箱温度的变化数据来估计齿轮箱损伤程度;Edzel等[7]提出多机制建模所得残差可以有效地预测故障发生前风电机组运行状况的变化;Qiu等[8]提出了一种基于热物理学的风电机组传动系故障诊断方法;Dao等[9]提出了一种基于SCADA数据协整分析的故障预警方法,可以有效分析非线性数据趋势;Borchersen[10]等通过应用扩展卡尔曼滤波对来自43个涡轮3年的历史数据发现了15/16个故障。

国内方面:曹梦楠[11]使用SCADA数据,提出一种基于无迹卡尔曼方法的风电机组故障诊断策略;张永辉[12]根据风电场SCADA数据之间的相关程度,实现对风力发电机的潜在故障预警;董玉亮等[13]利用自组织映射网络检测机组的早期故障;颜永龙等[14]选择BP神经网络和最小二乘支持向量机的组合模型判断机组健康状态;刘帅等[15]使用动态时间规整算法提前预警齿轮箱故障,其预警时间可长达数周。

从以上文献可以看出,其预警方法多采用建立研究对象模型后对比参数残差确定机组故障[5-7,11-14],引入的不同模型对风电机组故障预警研究有促进作用,但其研究成果在特征提取方面不够深入;而基于统计学[9]方法对数据的选取要求较高、专业性较强,基于热物理学[8]方法需要加装实验设备,都有现场应用的不便理性。

保局投影[16](locality preserving projections,LPP)是一种由He等人于2003年提出的用于流形学习的算法,具有保持数据集空间结构不变的非线性特点,可用于提取风电机组SCADA数据中高维信息的特征信号。Ding等[17]基于保局投影算法有效完成了滚动轴承分类;Soldera等[18]改进了保局投影算法并应用于人脸识别,取得了更高的识别精度;He等[19]提出了统计学保局投影算法,有效检测了潜在故障。

核极限学习机(kernel extreme learning machine,KELM)是将原极限学习机[20](extreme learning machine,ELM)中隐含层替换为核函数,使其在速度优势上进一步提高了精度。Zeng等[21]使用核极限学习机对交通标志进行识别,其结果优于其他方法;Bouzgou等[22]提出了一种结合互信息测量和极限学习机的辐照时间序列的新预测方法,能够提高太阳辐射预测的准确性;Mouatadid等[23]建立了基于ELM的更高精度的城市用水需求模型。

本文针对风电机组状态参数具有高维、非线性等特征,通过保局投影提取风电机组状态参数中代表本征结构的特征向量,再利用核极限学习机对目标状态参数建立预测模型,最后通过加入信息熵的检测方法分析目标状态参数的残差变化趋势,监测机组的健康状况,从而实现机组故障预警的目的。

1 算法基础

1.1 保局投影算法

保局投影算法可以很好地发掘嵌入在高维数据中隐藏的低维流形信息。

假设高维空间Rn中存在数据点集:X={x1,x2,···,xm},xi∈Rn(i=1,2,···,m),在低维空间Rl(l<

其中,Sij为近邻的第i个样本和第j个样本之间的相似性程度。可以取用k近邻或ε近邻的高斯权或均匀权作为相似性度量。

1.2 核极限学习机

极限学习机算法是一种简单、有效的单隐含层前馈神经网络(single-hidden-layerfeedforwardneuralnetworks,SLFNs),该方法具有学习速度快、泛化性能好等优点。

对于任意的N个训练样本(xj,tj),其中xj=(xj1,xj2,···,xjn)T∈Rn,tj=(tj1,tj2,···,tjm)T∈Rm,含有l个隐含层节点,数学上,激励函数为g(x)的SLFNs的模型为

式中:wi——wi=(wi1,wi2,···,win)T连接输入层和第i个隐含层节点的权值向量;

βi——βi=(βi1,βi2,···,βim)T连接输出层和第i个隐含层节点的权值向量;

bi——第i个隐含层节点的阈值;

yj——与tj相对应的SLFNs输出节点的计算输出值。

若模型能够零误差地逼近上述N个样本(xj,tj),可得:

其中,H被称为神经网络隐含层的输出矩阵,其第i列对应第i个隐含层单元的输出向量;T表示期望模型输出值。

极限学习机的核心假设为:当激励函数g(x)是无限可微且参数wi和bi任意指定时,求解线性系统Hβ=T的最小二乘解,即为0误差逼近样本解的等价,即

因此,根据广义逆的相关定理得,需要求解线性系统Hβ=T的最小范数最小二乘解为

其中,H?是隐含层输出矩阵H的Moore–Penrose广义逆。

由于ELM中的隐含层映射h(x)和SVM中的核函数映射极为相似,所以可以直接将核函数映射代替ELM中的隐含层映射h(x),此时即为核极限学习机。当h(x)未知时,满足Mercer条件的核函数主要包括:线性核函数、多项式核函数、RBF核函数、小波核函数等,RBF核函数表达式如下:

其中,σ为核函数的宽度系数。

2 基于LPP-KELM和信息熵的风电机组故障预警方法

本文提出的风电机组故障预警方法有效地结合了LPP算法、KELM算法、信息熵方法,从多属性、多耦合关系的SCADA数据中预警潜在故障,为现场运维计划提供有效支撑。

若离散随机变量X的取值概率用p(x)来表示,则信息熵H(x)可用式(7)来定量表示其不确定程度;同时,信息熵的概念在不同领域应用时,需要改进信息熵[15,24],改进后可得到式(8)。

式中:dom(X)——X的取值范围;

Hd——以统计区间时间长度为单位的信息熵;

N——等间隔温度区间的数目;

ni——在统计区间时间长度内的第i个等间隔温度区间的残差数目;

Td——以统计区间时间长度为单位的总残差数目。

特别地,当ni=0时不进行统计计算,若存在ni=Td时,熵值为0。

本文所提出的风电机组在线故障预警方法可分为两部分,如图1所示。1)离线预警模型生成部分(图1左侧):首先利用健康风电机组的状态参数数据建立基于LPP-KELM的风电机组状态参数预测模型,在分析状态参数预测模型的残差变化趋势基础上,确定预测模型均方根误差(root mean square error,RMSE)和预测模型残差的熵值的预警阈值;2)监测预警部分(图1右侧):将已获取机组SCADA数据输入到离线时已训练好的预测模型中,获得机组当前的目标状态参数预测值,然后利用RMSE、信息熵方法双重检验,基于RMSE和残差熵值阈值判断机组的状态是否异常。其中,双重检验中两种方法的时间尺度可不一致,以满足不同时间尺度预警需求。其中,监测预警部分具体算法实施步骤为:

1)将风电机组SCADA数据按LPP算法步骤进行特征提取。

2)将特征向量输入到离线时已训练好的KELM预测模型,得到监测状态参数预测值。

3)将监测状态参数预测值与实测值对比,获取残差的变化趋势。

4)以连续相同长度时间段为统计区间,计算目标状态参数预测模型的均方根误差及残差的熵值。

5)当均方根误差大于离线时确定的均方根误差阈值,且残差熵值大于离线时确定的熵值閾值时,判定机组运行异常;反之则说明目标状态参数预测模型的监测状态参数变化不剧烈,返回步骤1)继续监测。

3 实例分析

3.1 案例背景及算法设定

本节选取河北省张家口某变速变桨恒频风力发电机组在2017年的实际运行数据,对风电机组故障预警方法分别在机组健康状态下和异常状态下的应用进行仿真研究。该机组额定功率为1.5MW,切入风速为3m/s,切出风速为25m/s,SCADA系统每隔10min记录一次采样数据。

数据预处理:根据一定时间间隔选取合适数据数目,确定所选数据包含风电机组各类运行工况,并剔除机组输出功率为0或者负值、风速小于切入风速(3m/s)和风速大于切出风速(25m/s)以及风速小时对应的机组输出功率大等的样本点,认为这些数据点为机组非正常运行状态下的数据点。

LPP-KELM模型生成部分,输入尽可能选取与监测目标相关的测点,本例中选取风速、发电机转速、叶轮转速、风向角、环境温度、机舱温度、发电机温度、功率、齿轮油温度作为输入。

异常预警方面,RMSE、信息熵方法双重检验的时间尺度都采用为1d。当两个监测状态参数经处理后都超出阈值时,才判定有潜在故障;否则,当有一种预警方法超出预警时,异常处于不明朗状态,可作为预警前兆,保持持续关注即可。

3.2 生成离线预警模型

选取机组连续正常运行20d的1775组风电机组状态参数数据作为测试数据样本(见图2),生成所提预警方法在机组正常状态下的预警模型。

由图可知,齿轮箱轴承温度在50~69°C之间变化,未超出风电场监控系统的报警阈值,并且风电机组正常运行条件下的齿轮箱温度波动剧烈,由于其变化影响因素较多,无法直接总结其变化规律。

将健康状态测试数据样本代入预测模型中,获得齿轮箱轴承温度预测模型的残差曲线。齿轮箱轴承温度残差曲线如图3所示。大部分残差集中在–2~2°C,最大值不超过6°C。通过对照图2,可得知:LPP-KELM模型在气象波动剧烈处残差比气象稳定时大。将残差曲线转化残差数据对应的直方图,如图4所示。温度残差直方图反映了残差在各个温度区间的分布情况,可知其分布基本符合正态分布情况。

圖5为齿轮箱轴承温度的RMSE变化趋势,机组正常状态下,齿轮箱轴承温度预测模型的RMSE在0.2~0.6°C之间变化,RMSE的变化剧烈程度较小;熵值变化趋势如图6所示,这表示机组正常状态下的残差熵值在0~1.7之间变化,主要集中于0附近。因此,风电机组在正常状态下,参数预测模型的RMSE和残差熵值都变化较小。

通过以上分析,可以得到风电机组在健康状态下监测机组的异常预警值:残差预警阈值为6°C,RMSE预警阈值为0.6°C,熵值预警阈值为1.7。至此完成离线预警模型的生成部分。

3.3 异常状态监测预警

选取同一机组发生故障前连续运行16d的1000组风电机组状态参数数据,验证基于LPP-KELM和信息熵的风电机组故障预警方法在机组异常状态下的有效性。其齿轮箱轴承温度的变化情况见图7。

由图可知齿轮箱轴承温度随机组状态变化而变化,但变化幅值均没达到报警值,也无明确规律。将图7与图2相对比可得,无论机组状态如何,齿轮箱轴承温度的变化趋势大致相同,这说明通过直接观察齿轮箱轴承温度的变化趋势无法判断机组状态是否出现异常。

根据LPP-KELM预测模型获得预测模型残差的变化曲线如图8所示,可看到数据样本点越接近故障发生点(图8中红色星点,第991个数据样本),齿轮箱轴承温度预测模型的残差变化幅值就越大,超越了正常状态下的残差阈值6°C,但却只存在个别数据样本点,这很难判断这些个别数据样本点是否是异常点还是干扰点。

图9、图10分别为齿轮箱轴承温度预测模型的RMSE变化趋势图,以及齿轮箱轴承温度预测模型的残差熵值变化趋势图。由图9可知,RMSE值已经在第9d超过了RMSE的阈值0.6°C,对照查看图10,发现熵值处于增大趋势,但熵值并未超出预警阈值,可作为故障预警前兆,故而继续保持监测。在第10d、11d,RMSE值与熵值都回归至正常水平,无超出预警值;第12d,熵值接近报警阈值1.7,但并未超越,RMSE值正常。经历第13d的平稳期后,第14dRMSE值、熵值全部超出预警阈值,正式预警。至此,本文所提LPP-KELM与信息熵结合的故障预警方法得到验证。

若单独分析图9、图10,可知RMSE值在故障发生前3天变化较剧烈,这表明,在机组发生故障前2天,RMSE值的变化趋势已与机组正常状态的产生差异。从图10观察出残差熵值出现波峰愈加增大的趋势。故而可印证上述故障预警的正确性,即当前机组即将发生齿轮箱故障。

4 结束语

本文研究了保局投影、核极限学习机、信息熵相结合的风电机组故障预警方法,建立了风电机组状态参数预测模型,并基于历史SCADA数据确定了故障预警阈值。采用保局投影方法提取机组特征向量,可削弱无关特征和非线性对风电机组状态参数预测结果的影响;基于LPP-KELM的风电机组状态参数预测模型及添加信息熵后的双重检验方法保证了风电机组故障预警的准确性。仿真结果表明,所提方法能够有效地挖掘出风电机组SCADA数据变化趋势中隐藏的机组状态信息,达到了风电机组故障预警的目的。

参考文献

[1]DAWOUDSM, LINX, OKBAMI.Hybridrenewablemicrogridoptimizationtechniques: Areview[J].RenewableandSustainableEnergyReviews, 2017, 82(3): 2039-2052.

[2]ALHMOUDL, WANGB.Areviewofthestate-of-the-artinwind-energyreliabilityanalysis[J].RenewableandSustainableEnergyReviews, 2017, 81(2): 1643-1651.

[3]HAMEEDZ, HONGY, CHOY, etal.Conditionmonitoringandfaultdetectionofwindturbinesandrelatedalgorithms: Areview[J].RenewableandSustainableEnergyReviews, 2010, 13(1): 1-39.

[4]BANGALOREP, PATRIKSSONM.AnalysisofSCADAdataforearlyfaultdetection, withapplicationtothemaintenancemanagementofwindturbines[J].RenewableEnergy, 2018, 115(1): 521-532.

[5]MARVUGLIAA, MESSINEOA.Monitoringofwindfarmspowercurvesusingmachinelearningtechniques[J].AppliedEnergy, 2012, 98(10): 574-83.

[6]GRAYCS, WATSONSJ.Physicsoffailureapproachtowindturbineconditionbasedmaintenance[J].WindEnergy, 2010, 13(5): 395-405.

[7]LAPIRAE, BRISSETD, ARDAKANIHD, etal.Windturbineperformanceassessmentusingmulti-regimemodelingapproach[J].RenewEnergy, 2012, 45(9): 86-95.

[8]QIUY, FENGY, SUNJ, etal.ApplyingthermophysicsforwindturbinedrivetrainfaultdiagnosisusingSCADAdata[J].IETRenewablePowerGeneration, 2016, 10(5): 661-668.

[9]DAOPB, STASZEWSKIWJ, BARSZCZT, etal.ConditionmonitoringandfaultdetectioninwindturbinesbasedoncointegrationanalysisofSCADAdata[J].RenewableEnergy, 2018, 116(2): 107-122.

[10]BORCHERSENAB, KINNAERTM.Model‐basedfaultdetectionforgeneratorcoolingsysteminwindturbinesusingSCADAdata[J].WindEnergy, 2016, 19(4): 593-606.

[11]曹夢楠,邱颖宁,冯延晖,等.基于无迹卡尔曼方法的风电机组齿轮箱故障诊断[J].太阳能学报,2017,38(1):32-38.

[12]张永辉.基于监测数据的风力发电机故障预警研究[D].沈阳:沈阳工程学院,2017.

[13]董玉亮,顾煜炯.基于保局投影与自组织映射的风电机组故障预警方法[J].太阳能学报,2015,36(5):1123-1129.

[14]颜永龙,李剑,李辉,等.采用信息熵和组合模型的风电机组异常检测方法[J].电网技术,2015,39(3):737-743.

[15]刘帅,刘长良,甄成刚,等.基于群体多维相似性的风机齿轮箱预警策略[J].仪器仪表学报,2018,39(1):180-189.

[16]HEXF, NIYOGIP.Localitypreservingprojections[A].In: ProceedingofNeuralInformationProcessingSystem[C],Vancouver, Canada, 2003: 153-160.

[17]DINGX, HEQ, LUON.Afusionfeatureanditsimprovementbasedonlocalitypreservingprojectionsforrollingelementbearingfaultclassification[J].JournalofSoundandVibration, 2015, 335(20): 367-383.

[18]SOLDERAJ, BEHAINECAR, SCHARCANSKIJ.Customizedorthogonallocalitypreservingprojectionswithsoft-marginmaximizationforfacerecognition[J].IEEETransactionsonInstrumentationandMeasurement, 2015, 64(9): 2417-2426.

[19]HEF, XUJ.Anovelprocessmonitoringandfaultdetectionapproachbasedonstatisticslocalitypreservingprojections[J].JournalofProcessControl, 2016, 37(1): 46-57.

[20]HUANGGB, ZHUQY, SIEWCK.Extremelearningmachine: theoryandapplications[J].Neurocomputing, 2006, 70(1/3): 489-501.

[21]ZENGY, XUX, SHEND, etal.Trafficsignrecognitionusingkernelextremelearningmachineswithdeepperceptualfeatures[J].IEEETransactionsonIntelligentTransportationSystems, 2017, 18(6): 1647-1653.

[22]BOUZGOUH, GUEYMARDCA.Minimumredundancy-Maximumrelevancewithextremelearningmachinesforglobalsolarradiationforecasting: Towardanoptimizeddimensionalityreductionforsolartimeseries[J].SolarEnergy, 2017, 158: 595-609.

[23]MOUATADIDS, ADAMOWSKIJ.Usingextremelearningmachinesforshort-termurbanwaterdemandforecasting[J].UrbanWaterJournal, 2017, 14(6): 630-638.

[24]LIUXL, XUXL, JIANGZL, etal.Applicationofthestatedeteriorationevolutionbasedonbi-spectrumentropyandHMMinwindturbine[J].Chaos, Solitons&Fractals, 2016, 89(8): 160-168.

猜你喜欢

风电机组信息熵
近似边界精度信息熵的属性约简
基于S能量熵的直驱式风电机组故障诊断方
基于信息熵的承运船舶短重风险度量与检验监管策略研究
信息熵及其在中医“证症”关联中的应用研究
论犯罪信息
从信息熵论视角看特殊教育课堂教学
基于模糊集和信息熵理论的电网调度员培训评估方案
基于实践应用的风电机组测试与认证教学改革
风力发电机组电气与控制系统快速检修思路探索
风电机组典型事故及预防措施分析