APP下载

基于深度学习的旋转机械故障诊断研究综述

2020-09-26李舜酩

计算机测量与控制 2020年9期
关键词:编码器故障诊断卷积

沈 涛,李舜酩,辛 玉

(南京航空航天大学 能源与动力学院,南京 210016)

0 引言

随着当代旋转机械设备的高速,重载以及自动化程度要求不断提高,当设备发生故障时,极易造成极大的经济损失,甚至导致重大事故的发生,因此对故障诊断方法的速度,效率和精确性等都有着越来越高的要求。

目前的故障诊断技术是利用检测到的信息特征来判断系统的工作状态。一般将故障诊断方法分为以下几种:基于模型的方法、基于信号的方法、基于知识的方法和组合式的方法[1]。其中传统的信号处理和模型识别的方法,依托于专家经验的诊断方法,难以检测出结构复杂的旋转机械故障。基于模型的方法在故障诊断方面有了一定的改进和成果,在一定程度上弥补了人工数据统计的不足,但由于旋转机械的特征提取困难,数学模型复杂,在故障诊断中仍有一定的局限性,已经不能适应智能制造的趋势。

鉴于深度学习技术强大的数据表示学习和分析能力,基于深度学习的故障诊断方法引起了各行各业的广泛关注[2]。通过多层非线性网络训练,可以学习样本的潜在特征,提高分类或预测能力。因此深度学习被认为是机械设备大数据处理和故障诊断的有力工具,不仅为旋转机械的故障诊断提供了一条新的方法与思路,而且提高了设备的安全性和可靠性,降低设备的维护成本[3]。本文将系统的介绍典型的深度学习模型,以及它们在旋转机械故障诊断中的应用,最后做出总结与展望。

1 国内外研究现状

2006年Hinton等人首次在Science[4]中提出了深度学习理论,引发了不同领域的研究浪潮。近年来,不仅是国外对深度学习在旋转机械故障诊断中应用有所建树,国内也越来越重视机械的智能故障诊断的发展。“十二五”科学和技术发展规划也将重大工程健康状态的检测、监测以及诊断和处置列为重大科学问题。

现阶段在面对旋转机械的不同故障类型时,深度学习故障诊断方法不仅能够克服了传统振动分析的不足,还能做到自适应提取隐藏且复杂多变的故障信息,避免了人为干预所带来的不确定性和复杂性,增强了识别过程的智能性[5]。而在应用方面的研究,诊断对象小到简单的电动机,大到复杂的航空发动机。其本质上是对旋转机械中的转子系统、齿轮箱和轴承等结构的诊断来判断工作状况。

基于深度学习的故障诊断技术虽然极大促进了故障诊断领域的发展,但为了进一步提高旋转机械的安全稳定运行,仍面临着各种挑战,需要更多更深入的研究。

2 典型深度模型介绍

2.1 深度置信网络

深度置信网络(DBN) 是由Hinton[6]提出的一种概率生成模型。DBN应用于非监督学习中可对待处理的信号进行降维,从而提取特征;应用于监督学习中可作为分类器。DBN由若干个受限玻尔兹曼机(RBM)和Softmax回归层组成如图所示。其中V代表显层,h代表隐层,W代表权重。其基本结构如图1所示。

图1 DBN基本结构示意图

深度置信网络在旋转机械故障诊断中的优点在于可以适用于一维振动信号数据,而且在样本较少的情况下也能实现不错的性能。

2.2 卷积神经网络

卷积神经网络(CNN)是由LeCun等人[7]提出,是受动物视觉皮层细胞感受机理启发而建立的一种前馈神经网络[8],最早是应用于大规模的图像分类识别中。其基本的网络结构和旋转机械的故障诊断相结合如图2所示。由一个输入层,两组交替出现的卷积层和池化层,以及全连接层组成。

图2 CNN基本结构示意图

其中卷积层中每一个特征图都对应一个卷积核,这些卷积核通过一组权重来卷积前一层的输入并组成一组特征输出,成为下一层的输入[9]。经过两组卷积层和池化层后,会接一个全连接层。全连接层后接一个隐藏层,最后由Softmax回归层完成分类,可有效的用于故障的诊断与识别[10]。

CNN设计之初就是为了解决大规模的图像识别分类问题,在图像识别分类领域的应用也最为成功。由于卷积神经网络的局部连接、权值共享以及池化操作等形成了具有很强的特征学习能力,并且具有很强的鲁棒性和容错能力,使模型对平移、扭曲、缩放具有一定程度的不变性。它还可以用于输入一维的数据用于语音识别[11]和自然语言的处理[12]。

在最开始的研究中,许多研究人员将CNN的模型引入旋转机械故障诊断领域中时,采用原始的CNN结构,即构造二维的训练网络样本,提取的也是二维数据的特征并完成诊断。而旋转机械振动信号是一维信号,相对应的构建一维的卷积神经网络也成了研究的重点。

对此,文献[13]将采用大尺寸卷积核的一维卷积神经网络与小尺寸卷积核的一维卷积神经网络以及经典二维卷积神经网络模型进行对比,最终的诊断精度结果以及可视化散点图显示带有大尺寸卷积核的一维卷积核神经网络模型(1D-CNN)的效果最优。文献[14]提出了基于一维深度卷积神经网络的故障诊断模型,通过和传统诊断方法对比,分析了深度卷积模型在诊断精度和诊断鲁棒性的表现,证明了该模型的优势。

2.3 循环神经网络

循环神经网络(RNN)是一类处理序列数据的深度学习网络,在自然语言处理中应用较多。由Schmidhuber提出,并经过了许多研究人员的改良[15]。与其他神经网络不同,RNN网络在层间的神经元也建立连接,简单来说其神经元的输出可以在下一个时间戳直接作用到自身。

RNN相比经典的神经网络结构多了一个循环圈,这个圈就代表着神经元的输出在下一个时间戳还会返回,来作为输入的一部分。RNN可以被看作是对同一神经网络的多次赋值,第i层神经元在t时刻的输入,除了(i-1)层神经元在该时刻的输出外,还包括其自身在(t-1)时刻的输出,如果我们按时间点将RNN展开,结构图如图3所示。

图3 RNN基本结构示意图

RNN适用于处理序列数据以进行预测,但却受到短期记忆的影响。所以就有了诸如长短期记忆(LSTM)和门控循环单元(GRU)这种使用称为门的机制来缓解短期记忆的影响。门结构可以调节流经序列链的信息流。LSTM和GRU正在被用于最先进的深度学习应用,如语音识别,自然语言理解和故障诊断等。

2.4 自动编码器以及其变体

2.4.1 自编码器

自编码器(AE)分为两个部分:编码器和解码器。它是Rumelhart[16]提出的一个典型的三层神经网络结构,包括输入层、隐藏层和输出层。文献[17]提出自编码网络可看作是传统的多层感知器的变种,其基本想法是将输入信号经过多层神经网络后重构原始的输入,通过非监督学习的方式分析输入信号的潜在结构,将中间层的响应作为潜在的特征表示。

其基本结构如图4所示。

图4 AE基本结构示意图

结构中输入信号为x,在编码层先将其线性变化为z,然后再施加非线性变换,公式表达这一过程为式(1):

a=f(z)=f(wx+b)

(1)

(2)

自动编码机可以通过级联和逐层训练的方式组成深层的结构,其中只需要将前一层中隐含层的输出作为当前层的输入。

在自编码器的框架下,很多研究者通过引入正则约束的方式开发了很多变种模型。栈式自编码正是一种由多层自编码构成的神经网络模型。文献[18]就提出了一种基于栈式降噪自编码网络的故障诊断方法,采取逐层贪婪编码的方式进行预训练,实现高维深层故障特征的自适应提取和挖掘,再使用反向传播算法对模型进行监督式微调。

2.4.2 降噪自编码器

降噪自编码器(DAE)是由Vincent等人[19]从鲁棒性着手提出的。在日常的研究中发现对于部分被遮挡或损坏的图像,仍然可以进行准确的识别。DAE正是受此启发所提出的。因此,降噪自编码器的主要研究目标是:隐层表达对被局部损坏的输入信号的鲁棒性。

通过对原始输入信号人为的加入一些纯高斯噪声,也或者是随机丢弃输入层的某个特征使干净信号发生局部损坏,再将这个损坏的信号通过传统的自编码得到输出。其中干净输入信号x,加噪后的损坏输入信号。降噪自编码器的基本结构如图5所示。

图5 DAE基本结构示意图

近些年,通过Vincent等人进一步努力,由深度信念网络得到启发,将降噪自编码器得结构进行堆叠,提出了一种堆叠式降噪自编码网络(SDAE),并应用于图像分类领域[20]。

2.4.3 稀疏自编码器

一些研究者将稀疏表示的思想引入自编码,提出了稀疏编码器(SAE)[21-22]。自编码器最初提出是基于降维的思想,但是当隐层节点比输入节点多时,自编码器就会失去自动学习样本特征的能力,此时就需要对隐层节点进行一定的约束。因此在自编码的基础上对每层神经元做了正则化,在自编码器隐层添加稀疏性约束函数,来增强自编码机输出的稀疏性,使得模型神经元数量较大时仍可以得到较好的隐层特征。

稀疏表达包含了输入信号大部分主要特征,在保证模型重建精度的基础上,极大地降低了数据的维度,使模型的性能得到了很大的提升。An也正是采用一种无监督的稀疏滤波学习方法[23]。即使在转速波动情况下,该模型对旋转机械故障诊断具有较强的鲁棒性。后来An研究了权值矩阵的多重相关性[24],提出了一种更适合信号特征提取的方法,进一步提高了诊断的准确性。

2.5 生成式对抗网络及其变体

随着深度学习的进一步发展,鉴于以往的生成模型不能很好地泛化生成结果,研究者们提出了一系列新的生成模型。Goodfellow等人在2014年从“零和博弈”中受到启发,并提出了生成式对抗网络(GAN)[25]。

图6 GAN基本结构示意图

GAN中的生成器与判别器可被视作对抗博弈中的双方。生成器的目标是生成需要的数据,但是需要注意的是这里的数据只是仿真数据。判别器再来判别生成数据的真实性,最终模型的目标则是得到一个判别器都不能判别的需要数据。这种突出的生成能力不仅可以生成各种不同类型的数据,还对各种半监督学习和无监督学习的发展起到了推动作用。

GAN模型的实质就是寻找零和博弈的一个纳什均衡解,即对抗双方的损失函数都依赖于对方的参数,却又没有影响到对方参数的能力,目的是为了提高判断的准确性。

2.5.1 堆积生成对抗网络

堆积生成对抗网络(StackGAN)在结构上是串联多个GAN模型来实现的,这一点和栈式自编码的方法相似。

图7 StackGAN基本结构示意图

2.5.2 深度卷积对抗网络

深度卷积对抗网络(DCGAN)是GAN发展早期比较典型的一类改进。它是卷积神经网络(CNN)和对抗网络结合起来,将CNN的思想融入对抗模型中;将生成器中的全连接层用反卷积层代替,如图8所示。

图8 DCGAN的基本结构示意图

在图像生成的任务中已取得了很好的效果[26],使用GAN进行图像生成任务时,默认的网络结构一般都与DCGAN类似的设置。

2.5.3 条件生成对抗网络

条件生成式对抗网络(CGAN)是一种带有条件约束的GAN,在GAN的网络结构中引入条件变量c,使用变量c对模型中的生成器G和判别器D增加条件,以引导数据的生成。

生成器接收隐变量z与条件变量c,生成出的样本G(z|c)与在条件变量c控制下的真实样本x联系在一起,用于判别器的训练,具体结构如图9所示。

图9 CGAN的基本结构示意图

CGAN的目标函数为:

minGmaxDV(D,G)=Ex[logD(x│c)]+Ez[log(1-D(G(z|c)))]

(3)

ACGAN是在CGAN的基础上改进。它在判别器D的真实数据x也加入了类别c的信息,进一步告诉G网络该类的样本结构如何,从而生成更好的类别模拟。

3 深度学习在旋转机械零部件故障诊断中的应用

旋转机械的故障诊断是近些年来国内外研究比较广泛的领域,是发展比较成熟的故障诊断技术,具有一定的代表性,因此旋转机械是故障诊断的重点研究对象。本文又以旋转机械中最基本的转子系统、齿轮箱和轴承为对象讨论基于深度学习的故障诊断方法。

3.1 基于深度学习的滚动轴承故障诊断

滚动轴承是各种旋转机械的支承元件,不仅使用范围十分广泛,而且品种繁多、要求严格。它的质量和性能也十分重要,是旋转机械不可或缺的部件,其故障诊断显得尤为重要。近期存在的几个突出问题的研究。

1)针对如何提高滚动轴承故障诊断的准确率和算法训练的效率问题:

对此问题有关研究提出了一种深度信念网络(DBN)与粒子群优化支持向量机(PSO-SVM)的滚动轴承故障诊断方法[27]。该方法不仅提高了诊断准确率,而且大大缩短了训练时间。还有在不均衡数据集下基于深度对抗网络的故障诊断方法[28],此方法不仅建立适合轴承故障诊断的深度卷积神经网络模型,还引入Focal损失函数增强诊断的准确性。

2)针对滚动轴承故障样本较少的问题:

为了保持故障诊断的准确性,同时减少标签样本数量,研究表明动态调节学习率的SAE可以一定程度上解决该问题[29]。但在上述的传统的监督方法中,模型训练还是需要大量的人工标注样本,对此有关研究提出一种基于聚类和叠层自动编码器的滚动轴承故障诊断新方法[30],此方法不仅取消了人工标定样本的初始步骤,也是做到了更加智能。文献[31]则是充分利用了GAN生成模型和半监督学习的能力,将其应用于滚动轴承的故障诊断,解决了样本数据不足和标记的问题。

3)针对滚动轴承复杂时变工况下的故障诊断问题:

为解决此类问题有关研究将变分模式分解(VMD)、希尔伯特变换(HT)和深信网络(DBN)结合起来用于滚动轴承的故障诊断[32],取得了一定的成效。文献[33]则利用内斯特罗夫动量(NM)对深度信念网络(DBN)进行优化,它能稳定有效地改善模型训练过程中的收敛性,提高DBN的泛化能力。在轴承故障类型和程度诊断方面表现出了更令人满意的性能。

4)针对滚动轴承中复合故障的识别:

有相关的研究表明基于双树复小波包(DTCWPT)的自适应深信网络(DBN)方法[34]和一种基于深层小波卷积自编码器(DWCAE)和长短时记忆网络(LSTM)的轴承故障诊断方法[35],能够提取复合故障中的特征信号,并做到不同故障类型的有效识别。

5)针对大型机械中滚动轴承振动信号非线性、低信噪比和高维度的问题:

针对此问题有关研究提出将卷积降噪自编码器和深度卷积网络(CNN)相结合的滚动轴承故障诊断方法[36]和一种基于改进堆叠降噪自编码器的故障诊断方法[37]。两种方法的实验结果都表明在故障诊断过程中,遇到振动信号非线性、低信噪比和高维度的问题时,诊断的准确度较高、时间复杂度较低。

3.2 基于深度学习的齿轮箱故障诊断

机械设备中大部分部件都是旋转机械,尤其是齿轮箱属于易磨损部件,其运行状态不仅影响该机器设备本身的安全稳定运行,故障严重时不仅会造成重大的经济损失,甚至是人员伤亡,因此这要求机械的故障诊断方法更加智能高效。

近期存在的几个突出问题的研究:

1)针对齿轮振动信号的非线性、非平稳性且数据量大等问题

有关基于ELMD能量熵与PSO-SAE的齿轮故障诊断方法[38]的研究表明能够解决此类问题,并且考虑到了齿轮发生不同的故障,进而导致不同频带内的信号能量值发生改变。文献[39]构建了1-DCNN齿轮箱诊断模型,具有很高的泛化能力,可通过增加CNN层组数量来达到较高的准确率。此外,还可以直接将时域或者频域作为低层输入信息构建深度学习故障诊断模型[40],可以有效地削弱人为因素的干扰,不仅能够在保证诊断效果,还能降低计算复杂度和所需要的存储空间。

2)针对在齿轮故障诊断时,单传感器可靠性和容错性不佳的问题:

齿轮箱有着的复杂结构以及故障时获取信号的困难,单个传感器并不能有效地获取有效的故障振动特征,研究表明一种基于多个传感器信息融合及堆栈降噪自编码(SDAE)的齿轮故障诊断方法[41]在噪声环境下准确率衰减较小,并且抗干扰能力较强。此方法在单个传感器失效的情况下,诊断准确率还能高于正常状态下单一信号SDAE诊断方法。

3)针对齿轮故障诊断模型建立中的样本不均衡问题:

针对样本不均衡的问题,文献[42]研究了一种基于生成式对抗网络(GAN)的故障诊断方法,并将其应用于行星齿轮箱。通过实验表明在诊断样本信息不足的情况下,GAN诊断模型仍可以达到诊断精度。

3.3 基于深度学习的转子系统故障诊断

转子系统种类繁多,具体到设备如电动机、发电机、压缩机和发动机等。它们广泛应用于电力、石化、航空和航天等重要行业。

转子系统故障的常见形式:转子不对中,转子不平衡,动静摩擦等,其中转子不对中时引起绝大多数故障的原因。不对中故障会导致转子系统在运转过程中将产生一系列有害于机械的连锁动态反应,如引起联轴器偏转、轴的弯曲变形和油膜失稳等。

近期对几个典型转子系统的故障诊断研究。

1)针对不同电机故障诊断方法的研究:

针对永磁同步中电机匝间短路和永磁体失磁故障时,存在数据处理复杂、特征独立单一和样本不足等因素引起的诊断偏差问题,文献[43]提出一种基于深度学习变分自编码网络(VAE)及稀疏自编码网络(SAE)的故障诊断方法。实现构建丰富、多样、更具鲁棒性的训练集合,更加高效的对电机匝间短路及失磁故障的诊断。

针对电机中的滚动轴承缺陷,有关研究提出的解决方法:采用创新的离散小波变换(DWT)进行特征提取,再采用正交模糊邻域判别分析(OFNDA)进行特征约简,最后通过动态循环神经网络(RNN)预测元件的状态,并在不同的运行条件下对故障进行分类[44]。文献[45]则是构建了一个叠层自动编码网络,通过引入稀疏约束对输入数据进行压缩和约简的方式,使网络能够准确提取输入数据的故障特征,并通过引入随机噪声提高网络的故障识别能力。此外,为了提高特征标签的鲁棒性,相关研究表明在SAE的输入端加入腐败因子,然后利用从SAE中学习到的特征训练神经网络分类器,最终能够有效识别异步电动机的故障[46]。

2)针对发电机故障诊断方法的研究:

为实现风电机组发电机部件的故障诊断,文献[47]通过分析风机监控与采集(SCADA)数据,设计了基于深度自编码(DAE)网络和XGBoost的故障诊断算法。故障检测算法需要对不同风电机组设置不同参数,通过DAE获取SCADA数据的重构值来预测故障和提取故障样本。然后通过XGBoost模型来识别并分类故障。

3)针对发动机故障诊断方法的研究:

发动机气路系统的故障诊断研究方面,文献[48]在结合深度置信网络(DBN)、采样与集成技术的基础上,提出了基于不均衡样本驱动的发动机故障诊断模型。也有相关研究提出了一种基于主元分析与深度置信网络相结合的发动机气路系统故障诊断新方法[49]。

针对发动机故障中参数非线性强且易受噪声影响的问题,文献[50]提出一种改进降噪自编码的发动机气路诊断方法。该方法在降噪自编码器(DAE)基础上,采用改进萤火虫算法(FA)优化的径向基(RBF)神经网络,并引入惯性权重与自适应光强因子的改进FA来优化RBF网络从而得到萤火虫径向基(FRBF)网络。通过实验证明,此方法诊断精度高且算法性能稳定、鲁棒性优。

4 总结与展望

4.1 总结

在复杂的旋转机械故障诊断中,传统的故障诊断方法,往往不能满足对高阶、非线性、自适应特征提取的要求;而基于深度学习的故障诊断方法,得益于它的特征学习优势和强大的聚类分析能力,所建立的智能故障诊断模型更加自动化和高效。不同的深度学习模型具有不同的优缺点,如表1所示。

由表1可以得知,不同种的深度学习神经网络都有各自不完善的地方。而在对典型深度学习模型的改进上,研究者们有着各种各样的方法。其本质就是充分发挥各神经网络的优点,并且通过各种方法弥补或者避免不足之处。

Xu就卷积神经网络存在的一些弊端提出了一种新的宽感受野自适应快速卷积神经网络模型[51]。该模型在环境噪声和工作负载变化时具有较高的诊断精度和鲁棒性。文献[52]提出一种新型DSCNN-GRU网络,该模型降低了一维卷积结构参数,并加入门控机制以便更好地捕捉故障特征。针对堆叠式循环神经网络梯度消失的问题,文献[53]提出了一种改进的深度循环神经网络(DRNN)方法,即通过门控循环单元解决该问题来提高诊断的准确率。也有相关研究就上述问题提出基于改进堆叠式循环神经网络的轴承故障诊断模型[54]。Wang考虑到堆叠式自动编码器(SAE)的缺点,引入了深度神经网络(DNN)[55],可以减少训练时间、快速提取故障特征。Xu提出了一种可再生融合故障诊断网络(RFFDN)的深度学习模型[56],该模还能在非平衡采样条件下提取出变速度下的域不变特征,并能准确地对新的故障进行分类。这些融合方法的目的都是为了在故障诊断中达到更好的效果。

再比如上文所说自编码器(AE)和生成式对抗网络(GAN)及其变体还在不停的改进中。为获取隐层准确的稀疏度,缩减训练时间,研究者们在稀疏自编码器的基础上提出k-稀疏自编码器,此方法丢弃非线性激活函数,利用排序算法或ReLU函数选取k个最大激活值。Qian考虑到稀疏滤波(SF)实现的稀疏性是不规则的,对此提出了一种简单,快速的监督特征提取算法,称为监督正则稀疏滤波 (SRSF)[57]。此算法是将一种新的参数化稀疏标签矩阵(PSLM)融合到特征矩阵中,对稀疏性进行规则化,从而实现监督特征提取。

深度学习本身有着非常迅速的发展,各种算法思想相互融合,扬长补短。未来深度学习在旋转机械的故障诊断中的应用会越来越高效准确。

4.2 展望

1)在信号获取方面,向多种信息融合的趋势发展,在故障特征提取方面也趋于多种特征提取技术融合诊断方向的研究。

2)在故障诊断模型方面,由于各方面因素的干扰,实测信号中往往包含各种噪声干扰,从信噪比低的信号中提取需要的特征对于高效的故障诊断至关重要。然而,过度去噪或去噪不足会使原始的信号失真,降低故障诊断效率甚至准确度。因此,对于深度学习故障诊断模型的鲁棒性未来将展开进一步的研究。

3)单一的深度学习模型通过增加深度来提高模型效果的方法会出现梯度消失问题、计算过于复杂、准确率不高等问题,不能进一步使得诊断更精确可靠且高效。因此融合多种模型和算法,彼此扬长补短会带来更好的诊断效果,成为深度学习在故障诊断领域研究的重点。

5 结束语

旋转机械的传统诊断方法在速度,效率和精确性等方面都有一定的欠缺。深度学习模型可以学习样本中的潜在特征,提供更好的表示和分类能力。因此,本文首先介绍了深度学习的几种典型神经网络模型,然后在此基础上对其在旋转机械故障诊断上的应用进行具体对比分析。最后就目前该领域的发展情况进行总结,归纳出现存的一些问题和不足,并进行合理的展望。

猜你喜欢

编码器故障诊断卷积
基于全卷积神经网络的猪背膘厚快速准确测定
比亚迪秦EV充电系统故障诊断与排除
WV3650M/WH3650M 绝对值旋转编码器
基于神经网络的船舶电力系统故障诊断方法
迈腾B81.8T起动机无法启动故障诊断分析
设定多圈绝对值编码器当前圈数的方法
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
转炉系统常用编码器选型及调试