APP下载

基于相似性度量迁移学习的轴承故障诊断

2022-08-26徐易芸沈长青

振动与冲击 2022年16期
关键词:源域相似性度量

徐易芸,马 健,陈 良,沈长青,李 奇,孔 林

(1.苏州大学 机电工程学院,江苏 苏州 215131;2.苏州大学 轨道交通学院,江苏 苏州 215131;3.长光卫星技术有限公司,长春 130102)

旋转机械出现故障不仅会带来重大经济损失[1],而且可能危害到操作人员的生命安全,造成严重事故[2]。轴承是一种应用广泛并且极其重要的旋转机械部件,针对轴承故障的诊断方法受到越来越多研究者的关注。利用轴承振动信号,文献[3]提出了较多故障诊断方法,包括多项逻辑回归,支持向量机(support vector machine,SVM)[4]和小波包变换[5]等。经典方法如Kankar等[6]将小波包变换运用到多逻辑回归算法中,建立了故障诊断模型,证明了能量和峰值可以作为用来分辨故障种类的两个特征。

为了获得更深层次的故障特征表示,基于深度学习的轴承故障智能诊断方法成为近年来的研究热点。通过卷积神经网络[7](convolutional neural networks,CNN),自编码器[8](autoencoder,AE),深度置信网络[9](deep belief network,DBN),循环神经网络[10](recurrent neural network,RNN),生成对抗网络[11](generative adversarial networks,GAN)等新的机器学习模型能够自动从原始输入信号中挖掘故障特征并且进行诊断。王应晨等[12]提出了一种降噪自编码器和深度置信网络相融合模型来实现滚动轴承的故障诊断。洪骥宇等[13]在降噪自编码器的基础上,将改进的神经网络故障状态识别方法应用于航空发动机的故障诊断。以上研究表明,使用现有的深度学习故障诊断方法已经能够在一定程度上提升故障诊断性能。在实际工业场景中,工况往往复杂多变,且无法对所有工况数据进行有效标注。因此,基于已知域的有限有标签数据训练故障诊断模型,实现跨域场景下对其他异常工况的有效诊断,缩小由于工况变化和测试环境变化等因素带来的故障特征分布差异,是故障智能诊断领域所需要解决的关键问题。

迁移学习有助于解决这一问题。利用迁移学习从有标签的源域数据中学到知识,将这些知识迁移到无标签的目标域中完成诊断分类。Lu等[14]提出了一种深度域适应方法,通过使用最大平均差异(maximum mean discrepancy,MMD)将数据映射到再生核希尔伯特空间来减小分布差异,同时通过权重正则化项来增强原始数据的代表性特征,从而在目标域内获得较高的分类精度。Guo等[15]提出了深度卷积迁移学习网络(deep convolutional transfer learning network,DCTLN)。DCTLN利用CNN自动学习特征,域自适应模块通过最大化域间判别误差,最小化域内概率分布距离帮助CNN学习域不变特征。Wen等[16]建立了一种新的深度迁移学习方法,利用三层稀疏自编码器来提取特征,并利用MMD来最小化训练数据和测试数据特征之间的分布差异。

使用迁移学习方法能够对不同工况下滚动轴承故障进行有效诊断。然而已有的迁移学习方法在模型训练过程中学习到的特征可能并不具有较高的特征相似性。由于异常工况的多样性、时变性和强非线性,低相关性特征往往更容易产生偏差,高相关性特征能更正确地表示对应的故障类型,由此,需要增加高相关性特征对模型的贡献度。针对此问题,本文提出一种基于相似性度量迁移学习的轴承故障诊断方法,采用滚动轴承的振动信号作为模型输入,通过CNN对故障特征自适应提取;结合迁移学习和相似性度量思想对损失函数改进,在域间相关对齐的同时减少类内的差异,利用相关对齐[17](correlation alignment,CORAL)损失最小化源域和目标域之间的分布差异。最大化输入特征与中心特征之间的相似性,用目标域预测标签中包含的故障分类信息作为特征聚类的划分中心,使模型能够学习与故障类型具有高相关性的特征,减小每个故障类别的类内距离,提升跨域的泛化能力,使用故障分类器实现多工况轴承故障诊断,结果表明,提出的方法具有更高的诊断精度。

1 迁移学习故障诊断基本思想

迁移学习为一类源域和目标域之间存在差异的问题提供了一种可行的解决方案[18]。图1给出了迁移学习故障诊断的基本原理示意图。

图1 迁移学习故障诊断基本原理示意图Fig.1 Principle of transfer learning-based fault diagnosis

2 所述方法

2.1 故障诊断模型

本文提出的故障诊断模型由CNN构成。由于网络结构对模型的泛化能力有影响,针对不同问题对CNN结构参数可做适当优化,通过对CNN参数进行试验选择,考虑到计算量和效率,最终选定CNN模型如表1所示。

表1 CNN结构详细信息Tab.1 The details of CNN network

CNN模型包括特征提取器和故障分类器。特征提取器对故障特征自适应提取,使用二维卷积来保留数据的结构信息。输入由采集的轴承振动信号构建,输入尺寸的3个维度分别为通道数、特征图长与宽。特征提取器中共有5个卷积层,每一层卷积后都使用带泄露的线性修正单元(leaky rectified linear units,LeakyReLU)作为,它在训练过程中能够改善梯度消失或梯度爆炸的问题,使CNN获得更好的性能。卷积层特征计算公式为

Out=LeakyReLU(W*X+b)

(1)

式中:Out为卷积层的输出;*为卷积操作;W为卷积核;X为输入特征;b为对应的偏移量;LeakyReLU为激活函数。

故障分类器基于特征提取器学习的特征来识别健康状况。在分类器中经过一层卷积Conv6、LeakyReLU整合提取到的特征。为了在保持重要空间信息的同时减小特征图的维数,P1层对特征平均池化。再将学习到的特征平铺到两层全连接层FC1、FC2,最后连接输出层FO,给出故障诊断结果。

2.2 基于相似性度量迁移学习的轴承故障诊断方法

为了实现多工况轴承故障诊断,本文提出一种基于相似性度量迁移学习的轴承故障诊断方法。如图2所示,模型将特征分布差异度量和相似性度量与特征提取器连接,帮助CNN学习域不变特征。根据优化目标分为3个部分介绍:① 源域数据的健康状况分类损失;②源域和目标域数据特征之间的CORAL损失;③源域与目标域之间的相似性度量。

图2 故障诊断模型Fig.2 Fault diagnosis model

(1) 分类损失。采用交叉熵函数使源域训练数据的健康状况分类损失最小,定义如下

(2)

得到FOS层输出的预测值和真实标签值的损失函数,将学习到的特征输入分类器按照源域已知故障标签的监督,通过前向和反向传播的计算和优化对模型进行更新,使得诊断模型对已知标签的各个领域数据进行有效识别。

(2) CORAL损失。使用CORAL损失最小化源域FC2S和目标域FC2T层之间的特征分布差异距离,计算源域和目标域特征的二阶统计量间的距离

(3)

源域和目标域数据集的特征协方差矩阵定义为

(4)

(5)

在处理协方差时,源域和目标域共享网络参数。

通过链式法则计算出CORAL损失相对于输入特征的梯度

(6)

(7)

(3) 相似性度量。当数据来自不同域时,一些特征与标签的关系会出现跨域变化[19],造成输入特征与中心特征之间的相似性减小。因此使用相似性度量来约束相似性之间的差异,最大化类内的相似性度量,即从数据中提取出与故障类型高度相关的特征。中心特征用数据标签提供的故障分类信息表示,但由于迁移学习中目标域数据无标签,无法在训练阶段提供故障信息,因此使用模型预测的目标域标签,使用预测标签中包含的分类信息为输入特征提供聚类中心,将数据划分为不同的簇。在训练中通过前向传播计算和反向传播更新不断优化,目标域预测的准确度逐步提高,为特征聚类提供更准确的中心位置。

令f(x)为模型的预测输出,将中心特征与输入特征相似性最大化,就是最小化特征的类内距离J

(8)

式中:μk=Ex~D(x∣y=k)[f(x)]为预测输出的期望;β为正则化参数;k为数据种类;D为数据分布。

结合上述3个部分,最终的损失函数写为

L=LC+λD+μJ

(9)

式中,超参数λ和μ分别为域适应和相似性度量的权重系数。

2.3 故障诊断步骤

本文提出的故障诊断方法流程如图3所示,具体步骤如下:

图3 故障诊断方法流程图Fig.3 The flow chart of diagnosis method

步骤2模型训练。读取源域和目标域的训练数据集,建立故障诊断模型。初始化故障诊断模型的待训练参数,设置学习率ε和超参数λ,μ。

前向传播:将源域和目标域训练数据作为输入,通过CNN提取特征。计算式(9)中源域和目标域训练数据特征的CORAL损失,源域与目标域之间的特征相似度和源域数据的健康状况分类损失,输出最终的损失函数。

反向传播:使用Adam优化算法[20]反向逐层传递,对模型进行更新。

步骤3故障诊断。将目标域测试数据输入最终训练好的模型,面对不同领域的故障数据,该模型能够有效地识别故障类型,返回预测的健康状态。

3 CWRU轴承试验台验证

3.1 数据集介绍与试验设计

本试验采用美国凯斯西储大学的CWRU轴承数据集[21]。轴承型号为SKF6205-2RS,试验平台如图4所示。通过电火花加工模拟轴承的多种健康状况,数据通过16通道的数据记录仪采集得到,采样频率为12 kHz。数据集包含正常状态和外圈故障、内圈故障、滚动体故障3种故障类型,轴承故障尺寸包含177.8 μm,355.6 μm和533.4 μm,共10类不同的健康状态。

图4 CWRU轴承试验台Fig.4 CWRU bearing experimental platform

在数据采集试验中,根据负载不同设置4种不同工况:0,0.75 kW,1.49 kW,2.24 kW,一种工况对应一个数据集。每个数据集包括4 000个训练样本和2 000个测试样本。每次试验从4个数据集中选取2个数据集,分别作为一个迁移任务的源域和目标域,共12个不同的迁移任务。

试验中超参数λ和μ的选择经过网格搜索法进行优化,分别从{0.001,0.005,0.01,0.05,0.1}和{1,5,10,15,20}寻优范围中选择参数λ和μ。如图5所示,为0~1迁移任务中选择不同λ和μ的诊断精度,因此设置超参数λ=0.01,μ=10。每次循环批量大小Batch size=64,学习率ε=0.000 1,设定迭代次数Epoch=100。

图5 不同λ和μ的诊断精度Fig.5 Diagnosis accuracy with varying λ and μ

3.2 对比方法

为验证本文方法的诊断性能,与5种不同方法进行对比分析。根据比较目的不同,将5种方法分为3种类型:

(1)传统迁移学习方法:迁移成分分析(transfer component analysis,TCA)[22]、联合分布自适应(joint distribution adaptation,JDA)[23]。TCA和JDA在源域和目标域处于不同数据分布时,将2个领域的数据一起映射到一个高维的再生核希尔伯特空间。在此空间中,最小化源域和目标域数据的距离,同时最大程度地保留它们各自的内部属性。

(2)未使用迁移学习的CNN。对比试验CNN的网络与提出的架构相同,其损失函数仅使用交叉熵计算分类损失,即L=Lc。

(3)MMD和CORAL。未使用相似性度量,分别利用MMD损失和CORAL损失降低领域间特征分布的差异。MMD和CORAL与CNN的架构相同,最小化FC2层上特征的分布差异,即损失函数为L=Lc+λD,λ为域适应权重系数。

3.3 试验结果分析

12个迁移任务的故障诊断准确率如表2所示,可以看出所提方法的诊断性能优于对比方法,得到以下3个观察结论:

表2 CWRU试验台不同方法的故障诊断结果Tab.2 Fault diagnosis results of different methods on CWRU experimental platform %

(1)对于不同工况下的故障诊断任务,本文方法在12个迁移任务中准确率平均值为86.81%,优于对比方法。

(2)在故障诊断试验中,TCA和JDA将振动数据映射到高维空间中最小化域间距离,CNN、MMD、CORAL和本文方法直接从振动信号中学习特征,能够防止丢弃有用的条件表示信息,因此使用深度学习方法学习到的特征优于传统方法提取的特征。在相同的CNN架构中,在FC2层使用CORAL减小分布差异的诊断结果优于MMD。

(3)与迁移学习方法CORAL相比,本文提出方法在12个迁移任务中获得了更高的健康状况,本文方法比CORAL更有效地学习到具有高相关性的特征,减少域间数据的分布差异。

4 自搭建轴承试验台验证

为进一步验证本方法性能,在实验室自搭建轴承数据采集实验平台上进行了验证,如图6所示。

图6 自搭建轴承试验台Fig.6 Self-built bearing experimental platform

自搭建试验平台采集电机负载为0,1 kN,2 kN和3 kN时不同健康状况的轴承振动信号,试验采用的轴承型号为SKF6205-2RS,轴承健康状况分别为正常、外圈故障、内圈故障和滚动体故障,轴承故障尺寸为0.2 mm,0.4 mm和0.6 mm。如表3所示,将上述10种不同的健康状态分别设置为0~9类标签。其他试验设置与CWRU试验相同。

表3 自搭建轴承故障数据Tab.3 Fault data of self-built bearing

在本试验台上进行了12个迁移任务的试验,如图7所示。在不同的迁移任务中,本文方法平均诊断精度为82.7%。与CNN、MMD和CORAL相比,本文方法的准确率高于对比方法,证明加入相似性度量后能够有效提高模型的诊断效果。

图7 自搭建试验台故障诊断结果比较Fig.7 Comparison of fault diagnosis results on self-built experimental platform

图8为本试验中0~1迁移任务结果的混淆矩阵。结果表明,本文方法在正常和9种故障状态下的平均测试精度为94.7%,标准偏差为5.3%,优于对比方法,证明了本文方法学习特征具有更高的故障相关性,在不同工况下具有较好的区分度。试验结果进一步验证了本文方法的有效性和优越性。

图8 0→1迁移任务测试数据分类的混淆矩阵Fig.8 Confusion matrix for the classification of test data of 0→1 transfer task

5 结 论

本文将相似性度量迁移学习应用于故障诊断领域,提出了一种轴承变工况跨域故障诊断新方法。将迁移学习和相似性度量结合,增加高相关性特征的贡献度,减小非相关特征的影响;通过相关对齐损失最小化源域和目标域特征之间的分布差异,最大化输入特征与中心特征之间的相似性。与未加入相似性度量的迁移学习诊断方法相比,本文所提模型经过训练后,能够有效地获得相关性较高的泛化特征,可以获得更高的轴承健康状态识别精度,从而有效解决特征分布偏移带来的故障诊断难点问题,具有较好的应用前景。

猜你喜欢

源域相似性度量
一类上三角算子矩阵的相似性与酉相似性
鲍文慧《度量空间之一》
基于参数字典的多源域自适应学习算法
浅析当代中西方绘画的相似性
代数群上由模糊(拟)伪度量诱导的拓扑
突出知识本质 关注知识结构提升思维能力
度 量
基于隐喻相似性研究[血]的惯用句
从映射理论视角分析《麦田里的守望者》的成长主题
V4国家经济的相似性与差异性