APP下载

深度学习在旋转机械设备故障诊断中的应用研究综述

2019-10-22吴春志冯辅周吴守军

噪声与振动控制 2019年5期
关键词:编码器故障诊断卷积

吴春志,冯辅周,吴守军,陈 汤,王 杰

( 陆军装甲兵学院 车辆工程系,北京100072 )

旋转机械是指主要依靠旋转动作完成特定功能的机械,典型的旋转机械有变速箱、减速机、汽轮机、燃气轮机、风机、发电机、发动机等,它们被广泛应用于电力、石化、冶金、汽车制造、航空航天等部门。这些核心部件一旦发生故障,轻者会影响使用,严重的会造成停机甚至是人员伤亡。因此对旋转机械进行在线监测与故障诊断成为系统设计和维护中非常关键的一环。旋转机械设备面临的主要的故障有不平衡、轴承不对中、松动、齿轮部件的断裂磨损等。而油液分析、温度分析、声发射检测、振动分析等诊断和测试方法是故障特征提取及故障诊断的主要手段。相对于其他几种监测方法,基于振动信号的分析所需具备的条件更容易获取,相关研究更加成熟。

旋转机械的故障诊断主要为了实现三个任务,一是确定设备的运行状态,二是判断故障发生的原因,三是预测故障发展的趋势。进一步讲,故障诊断可以看作是对设备状态的模式识别问题。近年来,针对故障诊断的人工智能模式识别方法已经做了很多研究,例如K-NN,朴素贝叶斯,SVM,人工神经网络等等。传统的基于振动信号的故障诊断方法通常需要先对采集到的信号进行故障特征提取,再通过模式识别方法进行分类诊断,这不仅需要很多预先研究的专业知识,而且模型的可移植性相对较差,往往一种模型只针对某一特定设备的故障。近年来人工智能(AI)发展迅速,受到学术界和工业界的高度关注,而深度学习,作为人工智能的一大类方法,在图像识别、视频分割、语音以及神经语言程序学中得到了广泛的应用,近年来也逐渐有研究人员将其应用到旋转机械的故障诊断中来。

“深度学习”这个概念最早是由机器学习大师,多伦多大学教授Hinton 和他的学生Ruslan 于2006年发表在《Science》的一篇论文中定义的[1]。而其被人们所熟知是在2012年,Hinton 课题组用他们研究的由卷积神经网络(Convolutional Neural Network,CNN)构建的AlexNet 网络参加了ImageNet 图像识别比赛,一举夺得冠军,且远远超过第二名(SVM 方法)。深度学习的成功并非偶然,而是近半个世纪研究的积淀所得,其核心的BP 算法最早由Werbos 于1974年提出,被用来训练人工神经网络。Hinton 在1986年提出了用于多层感知器(Multi-Layer Perception,MLP)的BP 算法,并引入Sigmoid 激活函数,有效解决了非线性学习分类的问题。1998年,后来被称为“深度学习三巨头”的纽约大学教授Yann Le-Cun 提出并完善了LeNet5,这奠定了卷积神经网络的基础结构,卷积(Convolution)、池化(pooling)和非线性。2014年Goodfellow 提出了无监督学习的生成式对抗网络被LeCun评价为“机器学习过去20年最重要的思想之一”。随着计算能力的提升尤其是GPU加速计算的实现,为解决不同类型的问题,越来越丰富的网络模型相继被提出,模型深度也在逐渐加深。

本文主要从理论及应用两个角度就目前应用在旋转机械故障诊断中较广的几种深度学习模型进行综述分析,包括自编码器(AutoEncoder,AE)及其发展的网络结构、深度置信网络(Deep Belief Network,DBN)、卷积神经网络以及递归神经网络(Recurrent Neural Network,RNN),生成式对抗网络(Generative Adversarial Network,GAN)等。最后探讨现有研究面临的挑战以及未来的发展趋势。

1 自编码器

自编码器这个概念最早是来自Rumelhart,2006年Hinton 在《Science》提出一种深度自编码器算法[2],通过逐层学习深度的网络然后对整个网络进行参数调优,解决了容易陷入局部最小值的问题。自编码器是一种无监督的学习算法,由编码器和解码器组成,其结构原理和工作流程如图1所示。

图1 自编码器工作流程图

数据经过编码器进行压缩后再通过解码器解压恢复,通过不断训练从而减少输入输出之间的损失,最终实现特征的抽取和数据的降维。自编码器的优点在于结构简单易于实施,容易跟踪反向传播最小化的损失函数,缺点在于训练需要数据量较大,不能判断哪些问题是相关的。针对不同的应用环境,研究人员对自编码器进行了许多改良,诸如降噪自编码器(Denoising AutoEncoder,DAE),稀疏自编码器等(Sparse AutoEncoder,SAE),卷积自编码器(Convolutional AutoEncoder,CAE)变分自编码器(Variational AutoEncoder,VAE)等等。

1.1 降噪自编码器

降噪自编码器优点在于能更好地对数据进行压缩和特征提取,缺点在于模型输入的是随机噪声,可控性差。侯文擎等[3]提出一种改进的堆叠降噪自编码器(Stack DAE)诊断方法,利用粒子群算法对DAE网络超参数进行自适应的选取来确定SDAE网络结构,据此得到故障状态的特征表示,输入到Soft max分类器中进行故障分类识别,对变工况的轴承故障诊断取得了不错的效果。Shao 等对DAE 做了较深入的研究,通过DAE和收缩自编码增强特征提取能力,用局部保持投影融合特征来提高特征质量[4]。文献[5]提出了一种集成深度自动编码器(EDAEs)方法,采用不同的激活函数作为隐藏函数来设计具有不同特性的一系列自动编码器(AEs)。EDAE 由各种自动编码器构成,可用于对振动信号进行无监督的特征学习;在文献[6]中提出了深度跟踪小波自适应编码器(TDWAE)方法。首先采用高斯小波函数作为设计小波自动编码器(WAE)的激活函数,然后利用多个WAE构建深度小波自动编码器(DWAE)实现电力机车轴承故障诊断。

1.2 稀疏自编码器

稀疏自编码器是在自编码器的基础上对每层神经元做了L1正则化(约束使隐藏层中的节点大部分都为0),这使得当模型神经元数量较大时仍可以得到较好的隐层特征。张绍辉等[7]预先对低层频域信号提取包络线,得到表征频域变化态势的信息成分,接着再与稀疏自编码结合构建了故障诊断模型,降低了计算复杂度和存储空间。侯荣涛等[8]通过堆叠SAE,以频谱信号作为输入提取低维特征,有效诊断了轴承故障。

1.3 卷积自编码器

卷积自编码器在传统编码器基础上结合了卷积神经网络的卷积和池化操作对数据进行特征提取,应用反卷积操作对特征进行解码,通过堆叠形成一个深度网络结构。张西宁等[9]构建了卷积自编码器,通过卷积和反卷积对轴承信号进行编码和解码,解决了卷积神经网络权值随机初始化造成局部最优的问题,同时通过反卷积重构探讨了卷积神经网络的结构含义。

1.4 变分自编码器

变分自动编码器是一种无监督学习网络,可以显示设计一个生成模型并根据输入数据的分布来生成数据。与自编码器基础结构不同之处在于它有两个编码器,通过神经网络来计算样本的均值和方差,加入噪声增强鲁棒性并使之接近服从正态分布,并从分布中解码生成数据。Yoon等[10]将其用于剩余寿命估计,并且认为它是处理未来可靠性预测中标签不足问题的有效手段。张祥等[11]将VAE 和DBN 结合起来,将VAE学习到的隐变量特征作为DBN的输入实现故障诊断。

2 深度置信网络

深度置信网络由Hinton在2006年提出,是一种概率生成模型,如图3所示。DBN 在监督学习和非监督学习中都有应用。用作非监督学习可对信号进行降维,提取特征,类似于自编码器;用作监督学习可以作为分类器。DBN 由若干个受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)和Softmax 回归层组成,如图2所示。

图2 RBM结构示意图(V代表显层,h代表隐层)

图3 DBN结构示意图(W代表权重)

DBN的基础部件RBM包含2个层,隐藏层和可视层。特点是层内无连接,层间全连接(如图2所示)。受限玻尔兹曼机主要有2 种应用方式,一种是编码数据,采用其他监督学习的方法进行分类或者回归,第二种是将计算得到的权重和偏置从而初始化神经网络。李敬微等[12]将计算得的到滚动轴承信号的包络谱构造成特征向量,然后利用高斯RBM进行故障诊断。Zhao 等[13]构建了一个由多个RBM 组成的DAE模型,通过使用DAE网络输入及其输出重构值计算重构误差,用于反映组件健康状况的状况检测指标。

深度置信网络在旋转机械故障诊断中的优点在于可以适用于一维振动信号数据,而且在样本较少的情况下也能实现不错的性能。Ma 等[14]提出了一种基于DBN 的轴承加速寿命试验下的退化评估方法。Shao等在文献[15]中提出了一种用于感应电机故障诊断的DBN,其中直接使用振动信号作为输入,并采用t-SNE 算法对学习表示进行可视化。在文献[16]中,Shao 提出了一种压缩感知改进卷积深度置信网络(CDBN)的新方法,并采用指数移动平均技术来提高构建的深层模型的泛化性能。此外,Zhang 等[17]提出了一种多目标进化优化的DBN 集合,用于多元输入的故障诊断。Tang 等[18]提出了一种结合牛顿动量优化梯度和自适应学习率的深度置信网络,用来对旋转机械故障进行诊断分类。李川等[19]用3 种深度神经网络模型(DBM,DBN 和DAE)来识别滚动轴承的故障状态,并讨论了包括时域,频域和时频域在内的4种预处理方案,结果表明这3种深度学习模型对轴承故障诊断结果都取得了较高的精度。

深度玻尔兹曼机(Deep Boltzmann Machine,DBM)和深度置信网络一样扩大了RBM 的使用范围,并且基本上是由众多的RBMs 层组成的概率模型,其网络结构如图4所示。

图4 DBM结构示意图

DBM优点在于它的参数可以同时优化,而且能从大量无标签数据中学习出高阶特征,然后再用少量带标签样本进行微调。与DBN 不一样,DBM 既有从下而上的传播,又有从上至下的反馈,权重可以全局优化。Li等[20]提出了一种多模式深度支持向量分类方法,作者从振动信号中提取时域、频率和时频特征并输入到高斯-伯努利DBM 中,使用支持向量分类来融合3个输出以进行最终预测。

3 卷积神经网络

卷积神经网络是受哺乳动物视觉皮层细胞感受机理启发而建立的一种前馈神经网络,现在已经是图片和视频识别领域应用最为广泛的方法。

一个传统的CNN模型如图5所示。由一个输入层,两组交替出现的卷积层和池化层,以及全连接层组成。卷积层中每一个特征图都对应一个卷积核,这些卷积核通过一组权重来卷积前一层的输入并组成一组特征输出,成为下一层的输入。与传统滤波器需要人工设定参数不同,卷积神经网络的权值和偏置通过BP 算法进行训练。池化层主要是为了实现两个目的,一是大幅减少输入卷积层的空间维度,使权重参数减少75%,从而降低计算成本。二是控制过拟合,使测试集准确度更接近训练集准确度。主流的池化方式有最大值池化、平均池化、L2-norm池化。经过两组卷积层和池化层后,会接一个全连接层。与传统的神经网络类似,全连接层可以应用到不同的分类模型。全连接层后接一个隐藏层,最后由Softmax回归层完成分类。

由于CNN 设计之初就是为了解决图像的分类识别问题,如今在图像领域的应用也最为广泛。而开始将CNN引入旋转机械故障诊断领域中时,许多研究人员仍然采用原始的CNN结构,即构造二维的训练集训练网络,提取二维数据的特征并完成诊断。Lu[21]等对采集到的振动信号进行傅里叶变换,将频谱信号作为CNN网络的输入,实现旋转机械状态监测。He[22]使用小波包能量图像用作CNN的输入,来进行故障诊断。曾雪琼等[23]和王丽华等[24]使用短时傅里叶变换将故障信号转换成时频谱图作为CNN的输入,实现异步电机和变速箱故障诊断。Chen等[25]通过绘制振动信号的特征统计图作为CNN 的输入,实现故障的分类诊断。韩涛等[26]将信号做多小波变换和时频变换,以多小波系数图和时频图作为CNN的输入来诊断故障。

后来研究人员通过改造CNN,将卷积、池化的思想应用在一维信号上,得到适用于一维信号的卷积神经网络。相比二维CNN,一维CNN可以将原始振动信号或者频谱信号直接作为输入,实现由原始输入端到最终分类诊断输出端的“端对端”故障诊断。Jing等[27]直接以振动信号的频率数据作为CNN的输入,并和从原始数据,频谱和组合时频数据的特征3 种类型数据作对比,结果表明CNN 能够从频率数据中自适应学习特征,并且比其他比较方法具有更高的诊断精度。张伟[28]为检测轴承故障,构造了第一层大卷积核以及多层小卷积核的WDCNN 模型,在CWRU 数据库上的识别率达到了100 %。Chen等[29]提出了一种基于改进算法的分层学习速率自适应深度卷积神经网络,用于诊断轴承故障并确定其严重程度。

图5 卷积神经网络结构示意图

除了在故障模式识别中取得的不错成果,卷积神经网络也可以完成机械设备的故障预测。Babu等[30]以传感器的时间序列数据作为输入,增加了一个回归层来进行剩余寿命预测,通过实验证明了基于CNN的回归模型比多层感知器、支持向量回归和相关向量回归方法更好。Youngji 等[31]将信号的小波功率谱作为输入,以CNN构建滚动轴承的健康指标。任等[32]通过提取主频谱能量组成向量作为CNN的输入,来进行轴承退化趋势预测。Guo 等[33]提出了一种基于卷积神经网络的考虑趋势毛刺的健康指标构造方法。所提出的方法首先通过卷积和池化操作来学习特征,然后通过非线性映射操作将这些学习的特征构造成健康指标,使用轴承数据集验证所提出方法的有效性。

4 递归神经网络

递归神经网络最早是由Schmidhuber提出,并经过了许多研究人员的改良。RNN 是一类处理序列数据的深度学习网络,在自然语言处理中应用较多。与其他神经网络不同,RNN网络在层间的神经元也建立连接,如图6所示。

图6 递归网络结构示意图

RNN 通过使用来自过去网络结果的信息来产生输出,从而克服了简单神经网络的局限性,在一个RNN 中,每一步的隐藏状态取决于之前的隐藏状态。RNN有许多变体结构,其中长短期记忆(LSTM)和门控循环单元(GRU)的网络应用最多。这些变体网络可以帮助解决RNN 中零点梯度的消失问题。文献[34]认为由于能够在时间序列数据中存储长期相关性和非线性动力学,因此这些基于RNN的变体网络在时间序列传感器数据处理和健康监测中比传统的RNN更好。在旋转机械故障诊断领域,RNN通常被用来做故障预测。

与其他体系结构一样,RNN也可以扩展多个隐藏层,可以将多个观测值之间的隐藏状态连接起来,并沿着序列传播信息。Yuan等[35]比较了3种不同的RNN变体(简单的RNN,LSTM,GRU)在航空发动机的故障诊断和预测中的应用。许寅等[36]使用LSTM对航天器在轨状态趋势进行了预测,并与RNN进行了对比,指出LSTM可以实现高精度的中长期预测。杨嘉明等[37]将LSTM 和BP 神经网络结合起来完成了列控车载设备的故障诊断。牛哲文等[38]在将传统门控循环单元(GRU)神经网络和卷积神经网络(CNN)结合起来,同时引入dropout 降低了过拟合,结果表明在短期风功率预测上要好于LSTM。

5 生成式对抗网络

在GAN诞生之前,非监督学习的基本思想是根据数据集估计样本分布p(x),然后对p(x)进行采样,生成分布类似的新样本。这种方法难以解决高维样本的生成问题。GAN 作为非监督深度学习的代表[39],创造性地提出了生成器和判别器。生成器学习样本的分布,并从噪声数据中生成新样本,而判别器判别是否是真实样本,二者进行博弈从而优化模型(如图7所示),很好解决了非监督学习的著名问题:“给定一个样本,训练一个系统,生成类似的新样本”。在GAN 提出后不久,研究人员相继提出了数十种以其为原型的各种优化生成模型,如DCGAN、InfoGAN、cGAN、WGAN等等。

图7 生成式对抗网络示意图

在设计机械故障诊断分类模型时,各个故障状态的样本数量通常保持一致,而在真正的应用环境中,类别分布并不均衡,故障数据往往相对较少。当传统分类方法直接应用到不均衡样本时,为了提高分类精度,分类器会减少对少数类的关注度,分类边界会偏向多数类样本。最终导致少数类样本很难被识别,严重影响分类器的性能。GAN则很好解决了这个问题。Wang等[40]通过GAN生成与原始样本具有相似分布的新样本以扩展故障样本集,辅助SDAE(堆栈自编码器)来诊断行星齿轮箱故障,交替训练SDAE-GAN的生成器和鉴别器,可以明显提高样本生成质量和故障分类能力。Georgios 等[41]将条件反馈GAN(cGAN)方法应用到少数类样本生成中,在不均衡样本分类中取得了不错的效果。

6 研究展望

虽然深度学习进入大众视线的时间不长,但越来越多的研究人员参与到深度学习的研究中,并将其应用到除图像识别外的各种模式识别领域,给众多行业带来了新思路。本文简单梳理了深度学习的发展脉络,针对旋转机械设备故障诊断领域应用最广泛的几种深度学习模型,从原理到应用做了分类综述。通过对相关文献的梳理总结,笔者认为在本领域应用深度学习方法,仍有如下几个方面问题需要研究:

(1)深度学习最大的特点就是能在信号中迭代学习更新权重,自动提取特征,这也是和传统人工智能方法相比优势所在。那么,模型每一层到底从原始信号中学习到了什么?在图像领域,有许多文献对此做了研究说明,而在故障诊断领域相关研究还不够成熟。

(2)深度学习模型多种多样,对解决故障诊断领域中的某个问题,似乎没有一种明确的选择方式。现有研究大都根据已有深度学习模型进行修改,能否应用深度学习的思想,根据振动信号的特点设计一种更“合身”的深度学习模型可能是未来研究的一个方向。

(3)传统方法解决故障诊断问题时往往是多个方法的组合,先提特征再进行模式识别;深度学习将这些过程集中到一起,很好地完成了“端到端”的故障诊断,这是否是最完美的解决方案?特征提取方法是否应被淘汰?二者如何各自发挥所长,共同更好地解决问题也值得继续研究。

猜你喜欢

编码器故障诊断卷积
融合CNN和Transformer编码器的变声语音鉴别与还原
基于包络解调原理的低转速滚动轴承故障诊断
基于3D-Winograd的快速卷积算法设计及FPGA实现
舞台机械技术与设备系列谈(二)
——编码器
卷积神经网络的分析与设计
从滤波器理解卷积
数控机床电气系统的故障诊断与维修
基于傅里叶域卷积表示的目标跟踪算法
基于双增量码道的绝对式编码器设计
基于量子万有引力搜索的SVM自驾故障诊断