APP下载

计及气象因素的风电机组故障诊断与风险预测

2022-09-29程江洲冯馨以冯梦婷闫冉阳张晓瑀

科学技术与工程 2022年22期
关键词:贝叶斯风电机组

程江洲, 冯馨以, 冯梦婷, 闫冉阳, 张晓瑀

(三峡大学电气与新能源学院, 宜昌 443002)

随着“双碳”目标的提出,电力作为清洁、高效的二次能源,将在支撑社会经济发展,服务民生用能需求,构建清洁低碳、安全高效能源体系中发挥更加重要的作用[1]。近年来,中外频繁出现因电力供需紧张造成的大规模停电事故,部分事故与风电等新能源供电在负荷高峰时期电力供应不足和极端天气情况下电网调节灵活性不足等原因有关[2]。为了稳定出力水平,减小不正常运行状态带来的损失,对风电机组不正常运行状态进行故障诊断与风险预测具有重要的现实意义。

近年来基于模型驱动[3]的故障诊断方法发展迅速。韩松等[4]提出了一种基于主成分分析和支持向量机的故障诊断方法;Mani等[5]运用模糊集理论对数据进行预处理,结合专家系统、人工神经网络(artificial neural network, ANN)进行建模,最后输出诊断结果;颜肃等[6]对输电线路建立模糊Petri网进行故障诊断,并采用逆向搜索策略对模型进行优化,提高诊断效率。然而上述方法在对风电机组故障进行诊断时存在各自的局限性,其中人工神经网络需要大量的原始数据支撑,不适用于处理小样本数据,Petri网增加了系统计算复杂度,诊断精度下降。

针对风电机组故障样本小、模型结构复杂的特点,基于贝叶斯网络的故障诊断方法在处理小数据样本和降低模型复杂度上具有良好的表现。李军锋等[7]构建单层贝叶斯分类器诊断变压器低压侧故障;Amin等[8]研究了一种基于动态贝叶斯网络的故障检测方案;褚景春等[9]利用贝叶斯理论建立概率神经网络,结合故障树对风电机组进行故障诊断。贝叶斯网络具备正向诊断的能力,对故障进行事前诊断,并且具备反向推理[10]的能力,使得贝叶斯网络能够在正常运行状态下对系统内各隐患进行推理预测。但在现有研究中利用贝叶斯网络反向推理技术对风机进行风险预测的应用较少。另一方面,天气恶劣的情况下,电网故障更容易发生[11],对于运行环境多处于山区、沙漠等地的风力发电系统来说不良天气的影响则更为明显。因此,文中提出一种计及气象因素的基于改进贝叶斯网络的风电机组故障诊断与风险预测模型(meteorological factor-Bayesian network,MF-BN),对多源气象因素进行特征提取,考虑气象因素对贝叶斯网络进行参数优化,在风机出现不正常运行状态时进行及时的诊断排除。当风电机组稳定运行时,对各系统部件可能出现的风险事件进行预测,有助于运维人员进行合理的检修维护,提高风力发电的供电灵活性和稳定性。

1 计及气象因素相关性的评估指标

1.1 风电机组故障机理分析

风电机组由多种复杂的系统构成,主要分为变桨系统、齿轮箱、偏航系统、制动系统、主控系统、传感器、液压系统等[12]。对风机可能发生的故障进行总结如表1所示,其中疲劳、裂纹等故障的发生与材料强度不良、器件老化等原因有关;齿轮箱齿轮件卡死或螺栓损坏与漏油导致润滑不足等原因有关;传感器故障与其内部电路或机械故障等原因有关。

除了因为电气、机械等原因直接导致的风机故障外,气象因素同样可能间接的引发风机潜在故障。例如,温度过高导致绝缘损伤、油高温分解,温度过低改变材料机械特性使部件在正常振动下出现裂纹,湿度过大导致设备结霜、绝缘降低,降雪密集导致叶片覆冰。对风机进行故障诊断与风险预测时考虑气象因素对诊断与预测效率有重要意义。

表1 风电机组典型故障类型

1.2 基于Relief F算法的气象因素特征提取

对风机典型故障类型的发生原因进行分析,发现故障的产生与温度、气压、湿度、降水降雪、风速等因素存在关联。由此确定的风机故障初始特征集中包含所有可能导致故障的气象因素,冗余的数据特征会使模型结构变得复杂,不利于故障的识别和诊断,甚至降低诊断准确度。因此,需先对初始特征集进行特征提取,剔除冗余特征,将风电机组的故障数据样本分类为特定的故障模式并对故障影响因子重要性进行排序,选取最优特征集合。

Relief F(relevant features F)算法的基本思想是给样本的每一个特征赋予权值,权值越大表示该特征对样本的区分能力越强,对权值阈值进行设置即可得到特征子集,从而达到对数据进行降维的目的。该算法首先对特征的预测权值初始化为0,然后从数据集中随机抽取一个样本R,分别从相同类别及不同类别中找到K个近似R的样本,用Hj和Mj表示,最后利用特征权重计算公式开始迭代更新每一个特征权值[13]。特征权重计算公式为

(1)

式(1)中:W(A)和W′(A)分别为迭代更新后和更新前的特征权重值;k为样本总数,j=1,2,…,k;Class(R)为R样本类型;C为C类样本;Mj(C)为与样本R距离最近不同类样本中的C类样本;P[Class(R)]为R样本类型占样本总数的比例;Hj与Mj分别为训练集中与样本R距离最近的同类样本与不同类样本;m为抽样次数;K为近邻样本数;PC是第C类样本数占样本总数的比例;diff(A,R,Hj)为样本R和Hj关于特征A的差异,特征A用n维数组表示,A={a1,a2,…,an},其样本特征差计算公式为

(2)

(3)

2 贝叶斯模型的诊断与推理

贝叶斯网络(Bayesian network, BN)是一种基于统计的人工智能算法,利用样本先验信息进行最大后验估计,可以有效进行多源信息表达与融合,具有处理不确定性问题的能力[14]。

2.1 贝叶斯网络

贝叶斯网络将先验分布融入建模,后验分布正比于似然估计和先验分布的乘积,其原理为

posterior∝likelihood×prior

(4)

式(4)中:posterior为后验概率;likelihood为似然函数;prior为先验概率。

贝叶斯网络空间复杂度低,因为模型仅有两个成分定义,即BN=(G,P)。如图1所示,G=(V,E)表示有向无环图(directed acyclic graph,DAG),可分为原因层(Cause)、征兆层(Symptom)和故障层(Fault)3个层次表示[15-16],证据(Evidence)顺着有向边向下传递。P表示条件概率表(conditional probability table,CPT),这些条件表仅需要很小的存储空间,用于描述节点之间的影响强度。

2.2 建立贝叶斯模型

(1)训练数据集生成。贝叶斯网络的学习数据采用风电机组的历史监测数据。在生成贝叶斯网络的训练数据集的过程中,采集设备过往故障,对故障数据进行转化生成。

(2)构建贝叶斯网络。存在随机变量集合X={X1,X2,…,Xn},则模型结构(DAG)由节点集合DN有向边集合DL构成。

各个节点ni的条件概率函数为

f(xi)=P(Xi=xi|Ni),Xi∈X

(5)

式(5)中:Ni为随机变量Xi对应的节点ni的所有父节点的集合。

条件概率表(CPT)中的参数即为模型结构中所有节点的条件概率函数集合F={f|Ni∈DN}。

(3)基于贝叶斯网络的正向诊断。

图1 贝叶斯网络基本结构Fig.1 Basic structure of Bayesian network

贝叶斯网络的正向诊断首先对观测数据进行概率密度估计,确定父节点的先验概率。当原因(Cause)产生后,证据(Evidence)顺向传播导致对应子节点的后验概率改变,实现故障诊断。

贝叶斯公式为

(6)

式(6)中:ωi为故障告警信息;P(X)为节点X的先验概率;P(ωi|X)为给定X的条件概率;P(X|ωi)为ωi发生的情况下X发生的概率,也称为后验概率。

当先验状态更新为后验状态即为学习完成。每经过一次学习,模型便得到更新,原来的后验状态变为新的先验进行学习,依据不断学习的状态模型对故障诊断做出最优决策。

(4)基于贝叶斯网络的反向推理。从结果到原因的反向推断称为贝叶斯网络反向推理过程,根据假设的子节点状态和已知的CPT,反推各父结点的后验概率,通过计算风险事件发生的后验概率来实现风险预测。

反向推理的贝叶斯公式为

(7)

式(7)中:P(X|Y=θ)表示子节点Y的故障概率为θ时各父节点Xi的后验概率;概率值越高表示当节点Y发生故障时,由节点Xi导致的可能性越大。

2.3 计及气象因素的参数优化贝叶斯模型

结合上文分析,将气象因素影响融入模型的先验信息,建立计及气象因素的风电机组故障诊断与风险预测模型,模型预测流程图如图2所示。

图2 MF- BN模型预测流程图Fig.2 MF-BN model prediction flow chart

模型具体应用步骤如下。

(1)采集风电场历史故障信息,以及发生故障时的天气情况,建立原始数据集。

(2)分析风机故障机理,确定故障初始特征集。利用Relief F算法对可能引发风机故障的气象因素进行特征提取,剔除冗余特征以减小数据维度。

(3)建立基于贝叶斯网络的风电机组故障诊断与风险预测模型,将提取出的故障特征集中的气象因素作为相关故障节点的父节点加入模型的原因层(Cause)。

(4)从原始数据集中随机抽取80%作为训练数据集来训练模型,其余20%作为测试数据集对模型进行验证。

(5)结合反向推理公式,将子节点故障概率设置为100%,反向计算后验概率,即对应父节点的致因性。后验概率越大表示该节点的致因性越强,需要在正常运行状态时加以重点监控。

3 算例分析

3.1 特征提取

根据实际工程经验,初步确定包含14个故障特征的初始故障特征集。利用Relief F算法对特征权重进行计算,得到特征权重以及准确率如表2所示。

绘制特征权重和分类准确率变化趋势如图3所示。由表2和图3可知,权重均值约为0.025,“平均温度”“3~5级风”“平均风速”和“雾霾”的特征权重远远低于该均值。计算至第7个特征时的分类准确率最高,随着特征量的增加,至第8个特征时分类准确率出现大幅下降。故确定特征权重阈值为0.023,提取“降雪量”“极端高温”“雷雨”“8级风以上”“5~8级风”“相对湿度”和“极端低温”为有效故障特征集。

表2 风电机组故障特征

图3 分类准确率Fig.3 Classification accuracy

3.2 计及气象因素的风电机组故障诊断

3.2.1 数据预处理

将故障记录逐一转化为待使用的原始数据集。以发生“安全链触发”故障为例,该故障发生时风速为17.9 m/s,故对应数据集中将“8级风以上”“安全链故障”标记为“abnormal”。

3.2.2 构建故障诊断模型

使用GeNIe软件对计及气象因素的贝叶斯模型进行仿真,在视图界面构建MF- BN模型结构如图4所示。

图4 MF-BN模型Fig.4 MF-BN model

当风机出现不正常运行信号时,随着证据从父节点向子节点传播,下方节点的后验概率随之更新。综合考虑故障发生部位和更新的后验概率,优先对后验概率较大的事件进行排查。

3.3 基于MF-BN模型的风电机组风险预测

在建立的MF-BN模型的基础上,将节点“风机”的状态设置为故障,即将“abnormal”的概率值设置为100%,再将原有的条件概率表输入到模型中,根据式(7)即可反向推理其他模型的后验概率,后验概率的大小表示该节点致因性的大小,从而找出导致风电机组发生故障的最大可能事件。

受篇幅所限仅以各主要系统节点以及与齿轮箱相关的子节点为例表示结果,MF-BN模型反向推理结果如图5所示。

由图5可知,当风机发生故障时,电气系统、变桨系统、液压系统致因性较高,应适当加以监控。针对齿轮箱系统,齿面故障发生的可能性高于其他部件,当运行环境气温过高时,应当注意防范油温过高和齿面胶合擦伤故障的发生。

利用MF-BN模型反向推理得到风险预测结果与各节点发生故障的真实概率较为贴合,在故障诊断的同时可以完成实时的风险预测,对风机进行预防性监控。

3.4 ROC曲线验证

ROC曲线是一种常用在诊断性试验中的评价指标[17]。在ROC曲线中,以真阳性率作为Y轴,假阳性率作为X轴。

一般情况下,其常采用ROC曲线下面积(area under curve,AUC)作为评判标准。AUC取0~1的值,值越接近1,则该模型的性能越好。

验证结果如图6所示,MF-BN模型的AUC为0.904 9,证明模型具有较高的使用价值。

3.5 结果对比

为验证文中所提模型的必要性,分别对贝叶斯网络(BN)、计及气象因素但未进行特征提取的贝叶斯网络(non-feature extraction-MF-BN),以及MF-BN模型进行同等数据集下的精确度验证,验证结果如表3所示。

测试集中包含预测数据10 000组,正常数据8 352组预测正确8 057组,故障数据1 648组预测正确1 435组,其中受天气影响导致故障572组,预测正确534组。最终结果表明,MF- BN模型对故障预测准确率为94.92%,较之其余两种模型均有一定程度的提高。

4 结论

基于贝叶斯理论,考虑气象因素相关性对贝叶斯网络进行参数优化,提出了一种计及气象因素的基于改进贝叶斯网络的风电机组故障诊断与风险预测模型,得出以下结论。

图5 MF-BN模型反向推理结果Fig.5 Reverse inference results of MF-BN model

图6 MF-BN模型ROC曲线Fig.6 ROC curve of MF-BN model

表3 准确率对比

(1)利用Relief F算法对影响风机运行状态的气象因素进行特征提取,剔除冗余特征,提高了模型计算与诊断的效率。

(2)计及气象因素对风机运行状态的影响对诊断模型进行优化,结果表明提出的MF-BN模型诊断精确度为94.92%,经ROC曲线验证模型性能较好,验证了所提模型的正确性和有效性。

(3)利用贝叶斯网络反向推理技术对风电机组正常运行状态下的风险事件进行预测,实现了由故障事后控制向风险事前监控的转变,有效帮助运维人员掌控运行风险。

猜你喜欢

贝叶斯风电机组
1600t风电安装船海水冷却系统坐底改造设计
关于间接蒸发冷机组在数据中心中应用的节能分析
核电厂工程建设机组防异物管理与实践
田湾核电5号机组首次并网成功
风电新景
川航备降机组获“英雄机组”称号,机长刘传健被授英雄机长
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
贝叶斯网络概述
贝叶斯公式的应用和推广