APP下载

基于循环卷积生成对抗网络的风机齿轮箱故障诊断

2024-03-04赵承利钟麦英

关键词:齿轮箱故障诊断卷积

赵承利,张 璐,钟麦英

(山东科技大学 电气与自动化工程学院,山东 青岛 266590)

风机齿轮箱作为风力涡轮传动系统的核心装置,常用于动力传动,承受不规则的机械应力。由于此类零部件长时间工作在高温、高速、高负荷等恶劣工况下,极易发生故障,造成财产损失甚至引起灾难性事故。因此,研究齿轮箱的故障诊断方法至关重要[1]。针对齿轮箱的故障诊断研究主要集中于运动学机理模型和数据驱动两方面。由于传感器技术的高速发展,数据收集量指数式增长,数据驱动的故障诊断方法得到更广泛的应用,主要包括随机森林、人工神经网络、深度学习等方法[2]。文献[3]提出一种基于随机森林的旋转机械齿轮组故障诊断方法;文献[4]提出一种基于图的半监督学习随机森林算法,实现对旋转机械齿轮箱的故障诊断;文献[5]利用改进的经验模态分解与人工神经网络相结合,实现对电机转子轴承的故障诊断。深度学习方法相较于其他方法具有更深的特征学习结构,所需数据量更多,能更有效地描述复杂模型。文献[6]提出一种多尺度卷积核动态融合方法来提取齿轮箱故障信号特征,并结合全局稀疏网络实现对齿轮箱的故障诊断。以上方法虽表现良好,但都基于足够多的故障样本,而实际应用中,齿轮箱常因故障样本不足导致总体样本不平衡,很大程度上影响传统故障诊断方法的准确性[7]。

近年来,以生成对抗网络(generative adversarial network,GAN)为代表的数据增强方法为解决样本不平衡问题提供了新思路。GAN是Goodfellow于2014年提出的一种对抗生成模型新框架[8],随着对抗机制的不断完善,GAN也在图像生成、语义分割等领域有着广泛应用,并衍生出不同功能的变体[9]。条件生成对抗网络[10]在原始GAN无监督的基础上加入条件信息,能更有效地捕捉原始数据分布。针对于原始GAN训练不稳定、梯度爆炸、梯度消失等问题,Wasserstein生成对抗网络(Wasserstein GAN,WGAN)[11]和带有梯度惩罚的WGAN(WGAN with gradient penalty,WGAN-GP)[12]相继提出。这些方法已经在图像生成方面取得了良好的效果,而GAN在一维数据增强方面应用较少。2017年,GAN开始用于故障诊断领域。Lee等[13]利用GAN解决异步电机中数据样本不平衡问题;文献[14]提出改进辅助分类生成对抗网络用于风机齿轮箱故障数据的生成;文献[15]提出一种新的条件辅助分类器GAN框架,结合模型不可知元学习实现轴承故障诊断。

上述方法虽然表现良好,但对于一维时序信号进行特征提取时,并未针对性地考虑到时域数据内在关系和时间方向上的深度联系,因此本研究提出一种带有梯度惩罚的Wasserstein循环卷积生成对抗网络(Wasserstein recurrent convolutional GAN-GP,WRCGAN-GP)诊断方法。首先,利用卷积网络数据降维和循环网络提取时间信息,生成具有周期性变化的时间序列信号;然后,以随机噪声作为输入,通过对抗机制不断学习少数类故障样本特征,生成与真实数据相似的平衡数据集;最后,将平衡数据集输入到堆叠去噪自编码器(stacked denoising autoencoder,SDAE)[16]模型实现风机齿轮箱故障诊断。

1 生成对抗网络

GAN主要包含生成器和判别器两部分,结构如图1所示。其中,生成器用于捕捉真实样本分布,生成新样本;判别器用于分辨输入样本来自真实样本还是生成样本。GAN损失函数定义为:

(1)

图1 GAN结构图

式中:x为服从Pdata分布的真实数据,Ex~Pdata为x的期望;z为服从Pz分布的随机噪声,Ez~Pz为z的期望;D(x)为判别器D的输出;G(z)为生成器G的输出。在训练过程中,G的目标是最小化真实数据与生成数据之间的误差,以求最大程度学习真实数据的分布;D的目标是最大化真实数据与生成数据之间的差距以区分彼此。当训练达到纳什平衡时,G可以生成与真实数据分布相似的数据。

实验表明,训练中若生成器与判别器能力平衡,模型更易收敛,因此在训练模型时,应首先优化判别器,而后优化生成器。但判别器过强,生成器也不能有效更新参数,容易出现梯度消失、梯度爆炸等问题。虽然GAN已经在图像生成方面有着不错的表现,但对一维数据特征捕捉、数据增强方面仍有一定局限性。

2 基于循环卷积生成对抗网络的故障诊断

为了更好地解决风机齿轮箱样本不平衡问题,设计了基于循环卷积生成对抗网络的故障诊断方法,主要分为样本生成模型构建和故障分类方法设计两阶段,如图2所示。其中,WRCGAN-GP用来生成少数类故障样本以平衡数据集,再利用SDAE对平衡数据集进行故障分类。

图2 基于WRCGAN-GP的故障诊断方法架构

2.1 样本生成模型构建

针对故障样本数量不足的问题,设计了WRCGAN-GP样本生成模型,该模型包含生成器G和判别器D两部分,其结构如图3所示。G采用循环卷积网络结构,卷积模块由两层卷积和两层池化交替组成,循环模块采用长短期记忆网络(long short-term memory,LSTM)单元结构,其卷积输出作为循环网络的输入。G的输入为(zT,cT)。其中,z为随机噪声,维度为100×1;c为样本标签,维度为m×1,m为样本类别数。G的输出为xg,维度为n×1,G中第i层卷积运算的输出为oi:

(2)

图3 WRCGAN-GP结构图

(3)

式中:fc为卷积层激活函数;M为输入特征图矩阵;oi-1为i-1层输出;ki和ai分别为第i层的卷积核与偏置。通常卷积块的激活函数选用ReLu函数,如式(3)所示,该激活函数在输入值大于零的部分导数值恒定,能在权值更新时克服梯度消失问题,并可以有效驱使网络逼近全局最优。

经过卷积运算得到信号特征,并重塑为符合循环模块输入的形状,表示为R=[r1,r2,…,rt],rt的维度为ξ×1,t∈{1,2,…,ω}。循环模块中LSTM单元结构图4所示,t时刻运算如下:

(4)

图4 LSTM结构图

(5)

(6)

(7)

(8)

输出门用来计算隐藏层的输出,计算式为:

(9)

WRCGAN-GP是在WGAN-GP的基础上进行架构改进,通过最小化损失函数L(d)和L(g)进行对抗训练,交替更新参数,其损失函数为:

(10)

L(g)=-Exg~Pg[D(xg,c)]。

(11)

2.2 故障分类

堆叠去噪自编码器近年来因其优异的性能被广泛用于故障诊断领域,其结构见图5。将平衡数据集B作为SDAE的输入实现齿轮箱故障分类。SDAE由数个去噪自编码器(denoising autoencoder,DAE)模块堆叠而成,其基础模块DAE是一种通过特征提取并最小化重构误差来拟合样本的单隐层神经网络,主要由输入层、隐藏层及输出层三部分构成。输入层与隐藏层构成编码器fs,隐藏层与输出层构成解码器gs,结构如图6所示。

图5 SDAE结构图.

图6 DAE结构图

(12)

(13)

式中:W′为输出权重矩阵,b′为输出偏置向量。最后通过最小化重构误差优化自编码器:

(14)

(15)

3 实验分析

3.1 数据集介绍

本研究采用的数据集来自山东科技大学电气与自动化工程学院实验室风力涡轮传动系统故障诊断模拟器,平台结构如图7所示,传感器主要有振动传感器、扭力传感器以及压力传感器等。负载工作电压分别有8、5 V,电机工作频率有6、10、14 Hz。以上装置中所涉及到的硬件,如齿轮等,均可被替换成故障型齿轮以输入故障,故障形态有缺齿、断齿、齿裂以及磨损等。

1—负载制动器;2—行星轴齿轮箱;3—平行轴齿轮箱;4—动力装置;5—传感器

实验负载工作电压8 V、电机工作频率6 Hz,信号取自振动传感器,共有5种信号类型,分别为正常信号、缺齿信号、断齿信号、齿裂信号和表面磨损信号,原始信号样本维度为2 048×1。为了凸显每种样本类型的信号特点,首先进行快速傅里叶变换,截取样本前半段作为最终使用样本,维度为1 024×1,共选取数据样本980个,各类型样本数量及标签设置如表1所示。WRCGAN-GP生成的各类故障样本数量为原始数据集中正常样本与故障样本数量的差值,即380个,以达到平衡数据集的目的。

表1 样本及标签设置

3.2 结果与分析

模型训练需设置若干超参数值,损失函数中λ取10,优化器选择为Adam,学习率设置为0.000 5。为使多层之间协调更新,训练更易收敛,每一层后跟随批量归一化层,且训练时每训练1次生成器更新5次判别器,迭代次数为500。WRCGAN-GP与SDAE具体网络结构设置如表2、表3所示。将训练集数据输入到WRCGAN-GP中训练并得到生成样本,其损失函数随迭代次数的变化情况如图8所示。可以看出,生成器损失与判别器损失在训练初期波动较大,但随着迭代次数的增加,损失值在迭代200次附近时趋于平稳。

表2 WRCGAN-GP网络架构

表3 SDAE网络架构

图8 损失值变化情况

图9为4种故障类型真实样本与生成样本的对比图,可以看出,虽然生成样本与真实样本并不完全相同,在某些峰值处存在小的偏差,但分布趋势基本一致,可以作为原始数据扩展集。

图9 样本对比图

t分布随机近邻嵌入算法[18]可以更直观地观察到原始样本与生成样本分布相似情况,该算法可将高维数据映射到低维空间,以此分析数据在高维空间的分布。相似程度较高的样本相互聚集,反之相互排斥,增强前后样本数据可视化结果如图10所示。由图10可以看出,数据增强后各类样本的聚类效果更加明显。

图10 增强数据前后可视化结果对比

针对不平衡数据集,通常采用以下指标进行样本质量评价:Gmean[19]、F1[20]、ROC曲线以及AUC值[21]。Gmean为正类准确率与负类准确率的综合指标,可表示为:

(16)

式中:TP为正类预测为正类的比例,即正类准确率;TN为负类预测为负类的比例,即负类准确率;FN为正类预测为负类的比例;FP为负类预测为正类的比例。

F1相较于Gmean更加注重少数类分类性能的评价,其计算式为:

(17)

ROC是以假正率(FPR)为x轴和真正率(TPR)为y轴构成的曲线,曲线下方围成的面积即为AUC值,其值越接近于1,分类准确率越高。其中,

(18)

为进一步说明WRCGAN-GP的优越性,设置消融实验进行对比验证。方法1:加入标签信息的梯度惩罚Wasserstein卷积生成对抗网络(Wasserstein convolutional GAN-GP,WCGAN-GP),即去掉WRCGAN-GP生成器中的LSTM结构。方法2:不加入标签信息的WGAN-GP(WGAN-GP),即去掉WCGAN-GP中的标签信息。方法3:加入标签信息的WGAN,即去掉WCGAN-GP损失函数中的梯度惩罚项。另外,将所设计的故障诊断方法与卷积神经网络(convolutional neural network,CNN)[22],随机森林(random forest,RF)[4]进行对比。

根据不同方法的故障诊断结果,计算评价指标,结果如表4所示。首先,针对三种生成算法的生成样本,均利用SDAE分类器进行故障分类。由表4可以看出,在正常样本量与故障样本量之比为20∶1的极不平衡情况下,WGAN-GP-SDAE中由于没有标签信息约束,训练不稳定,F1与AUC值均较低,Gmean甚至出现0值情况;WGAN-SDAE本身训练不稳定,即使有标签信息约束,但指标仍低于WCGAN-GP-SDAE与WRCGAN-GP-SDAE;而本研究提出的方法在保证训练稳定的前提下,引入标签信息约束,且加入LSTM结构以读取数据潜藏的故障信息,相较于单一卷积结构的WCGAN-GP-SDAE,其三项指标值均有所提高。其次,将原始不平衡数据集作为CNN与RF的输入,由于原始数据集中故障样本量极少,CNN不能发挥有效性,Gmean出现0值,F1也仅有27.16%;RF由于多棵树结构优势,Gmean和F1较CNN有所提升,但仍低于WRCGAN-GP-SDAE。从图11 ROC曲线也可以看出,WRCGAN-GP-SDAE曲线距离坐标轴左上角更近,曲线下方围成的面积也更接近于1,生成样本也更符合真实样本分布。

表4 评价指标对比

图11 ROC曲线结果对比

为了更详细地展示生成样本质量,将故障分类准确率汇总如表5所示。由表5可以看出,WGAN-SDAE仅有缺齿和磨损分类效果良好,对于另外几种特征较为相似的故障类别不能实现有效分类;WGAN-GP-SDAE结构上无改变,且缺少标签信息的约束,故障分类也仅有正常和磨损正确率在95%以上;在WCGAN-GP-SDAE中,缺齿有14%被误分类,断齿有5%被误分类,可见对于极为相似、难以分辨的故障样本,单一卷积结构不能完整有效地获得故障信息并进行准确分类;由于原始数据集的不平衡特性,CNN仅能对正常和磨损样本准确分类;RF分类准确率较CNN有所提升,但对于缺齿仍然有18%的误分类率。而所提出的方法在进行故障分类时,所有故障类别分类准确度都在95%以上。

表5 故障分类准确率对比

综上对比实验结果表明,本研究提出的故障诊断方法在样本特征相似、故障信息难以提取的情况下,能够生成质量更高的样本,有效平衡数据集且显著提升故障诊断准确率。

4 结论

针对风机齿轮箱实际工况中故障样本数量少的问题,提出一种基于WRCGAN-GP的故障诊断方法,将样本生成模型在原始WGAN-GP中加入标签信息,并将原有的多层感知器替换成为具有描述数据内在关系和分析时间深度上相关性能力的循环卷积网络,挖掘样本中更深层次的故障信息,生成了更高质量的新样本,同时通过SDAE进行特征提取并实现故障诊断。将所提出方法在风力涡轮传动系统数据集上进行对比分析,结果表明,所提出的方法可以有效捕捉难以提取的深层次故障特征分布,生成高质量样本并提高故障诊断准确率。值得指出的是,WRCGAN-GP中的循环卷积结构在一定程度上增加了模型参数,使训练耗时大于传统GAN,因此如何进一步优化网络结构、提高网络的训练速度是下一步研究内容。

猜你喜欢

齿轮箱故障诊断卷积
风电齿轮箱轴承用钢100CrMnSi6-4的开发
基于3D-Winograd的快速卷积算法设计及FPGA实现
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
提高齿轮箱式换档机构可靠性的改进设计
杭州前进齿轮箱集团股份有限公司
因果图定性分析法及其在故障诊断中的应用
一种基于卷积神经网络的性别识别方法
基于LCD和排列熵的滚动轴承故障诊断
基于遗传退火优化MSVM的齿轮箱故障诊断