APP下载

基于多源域深度迁移学习的机械故障诊断

2022-05-16杨胜康孔宪光王奇斌李中权

振动与冲击 2022年9期
关键词:源域适配器故障诊断

杨胜康,孔宪光,王奇斌,程 涵,李中权,2

(1.西安电子科技大学 机电工程学院,西安 710071;2.上海杭和智能科技有限公司,上海 201111)

机械故障是风力电设备、航空发动机、高档数控机床等国家大型机械装备安全可靠运行的“潜在杀手”[1]。现如今,对于如何准确诊断机械故障已成为装备故障预测与维护管理的研究热点。

为及时发现机械故障,使机器处于正常运行状态,提出了多种机械故障诊断方法,这些故障诊断方法可分为信号处理方法[2-3]和数据驱动方法[4]。信号处理主要是通过小波分解[5]、经验模态分解[6]、变分模态分解[7]等信号处理方法采集振动信号进行时频特征分析,进行故障特征提取实现故障诊断。随着大数据时代的到来[8],传统的信号处理方法逐渐被基于机器学习和深度学习技术的数据驱动方式所替代。以支持向量机[9],人工神经网络[10]、决策树随机森林[11]等为代表的机器学习方法在故障诊断领域展开应用研究。由于机器学习方法需要大量的有标签数据,进行监督学习故障特征。而真实的工业环境中常常面临无标签信息的工业数据,机器学习方法无法满足这种需求,因此以深度置信网络(deep belief networks,DBN),深度自编码器等无监督特征学习的深度学习技术迅速得到广泛应用。Shao等[12]利用优化后的DBN进行滚动轴承故障诊断方法研究,获得较好的故障诊断效果。Zhou等[13]对深度自编码进行改进应用于故障诊断。李涛等[14]利用自适应卷积神经网络进行旋转机械故障诊断,增强模型的稳定性和适应性。

尽管机器学习和深度学习技术在故障诊断领域有不错的诊断性能,但是针对不同工况、不同设备之间以及引入新故障模式的故障诊断问题仍然难以达到理想的效果。随着迁移学习[15]在图像识别与分类领域的成功应用,近年来,迁移学习在故障诊断领域的应用成为研究热点。Wen等[16]提出基于堆栈式稀疏自编码器的深度迁移学习方法,应用不同工况下的滚动轴承故障诊断。Yang等[17]提出基于特征迁移的卷积神经网络,并引入多层MMD(maximum mean discrepancy)实现特征的域适应,将实验室轴承故障知识迁移到现场作业机械环境的轴承上,实现了不同设备之间故障诊断迁移学习。Zhang等[18]针对引入的新故障问题,提出基于深度神经网络结构修正的迁移学习故障诊断方法,对训练好神经网络结构进行修正并对参数进行补充,利用少量目标域数据进行训练获得较好故障诊断分类效果。Xu等[19]针对故障诊断中的样本不平衡引起的域自适应问题,提出一种卷积迁移特征判别网络,在变转速不平衡故障数据下具有很好的域适应特征提取能力。Li等[20]针对小样本数据下不同工况不同故障类型的问题,提出基于域对抗学习网络的迁移学习故障诊断模型。Zhang等[21]提出一种双判别器生成对抗网络学习模型提高模型在不平衡数据集上的故障诊断精度。Zhang等[22]设计了一种专门的联邦学习框架解决在迁移学习过程中数据隐私和数据孤岛问题。Li等[23]提出了一种两阶段迁移对抗迁网络实现对旋转机械出现未知新故障的智能诊断。Huang等[24]针对耦合故障诊断问题,建立深度对抗胶囊网络模型将耦合故障解耦为单一故障,进而提高模型在实际工业场景中的诊断效果。

以上研究主要是从单源域出发利用域适应或域对抗学习方法解决变工况、不同设备、新工况故障数据不足以及出现未知故障的旋转机械故障诊断问题。然而在实际工业场景中,由于单一工况或单一设备的个性,进行单源域迁移学习会出现域不匹配造成负迁移和模型泛化能力不足的现象。而从多种工况的数据出发,即进行多源域下迁移学习任务,能够集成多源域故障特征信息,提取更好的域不变公共特征,学习到故障知识,将对于未知工况下的故障诊断具有较好的诊断效果。因此,本文将结合锚适配器集成和深度神经网络提出基于多源域深度迁移学习的机械故障诊断方法,利用锚适配器集成,充分集成多源域故障特征信息,学习域不变公共特征,减少源域与目标域之间的分布差异,进而达到较好的诊断效果。

1 锚适配器构建与集成

多源域迁移学习故障诊断中,源域和目标域在所有数据上可能不是紧密相关的。但是,从源域和目标域的相同邻近区域随机选择数据点,基于这些数据点进行迁移学习可以获得较好的分类效果。因此,Zhuang等[25]基于该思想建立基于锚适配器集成的迁移学习框架,本文将从多源域中随机选择锚点进行锚适配器的构建与集成,用于多源域迁移学习故障诊断。

1.1 锚适配器构建

锚适配器的结构如图1所示,主要包括相似度计算和生成锚适配器矩阵两部分,其具体的构建流程如下。

图1 锚适配器构建

(1)

(2)

1.2 锚适配器集成

(3)

因此,最终锚适配器集成分类器输出的计算公式如式(4)所示

(4)

2 多源域深度迁移学习机械故障诊断

基于锚适配器集成的迁移学习框架,利用深度神经网络模型具有挖掘数据深层次特征的优势,采用深度神经网络模型进行多源域故障诊断迁移学习特征提取,进而提出基于多源域深度迁移学习的机械故障诊断方法,其故障诊断模型如图2所示。基于多源域深度迁移学习的故障诊断模型主要由深度特征提取网络、源域分类损失和源域与目标域特征分布均值差异三部分组成。深度特征提取采用深度神经网络(deep neural networks, DNN),为了保证模型能够尽可能多地提取不同工况下的融合特征,DNN网络共享权值和偏差,从而降低计算成本。引入最大均值差异损失函数是为了减小源域和目标域之间的特征分布差异,使得不同转速下样本特征的边际概率分布尽可能一致,使深度特征提取网络、该迁移学习网络更好地学习不同工况下的域不变特征。在提取到域不变特征之后,利用有标签的源域数据训练得到较好的故障分类器,从而用于目标域工况下的故障诊断。

图2 基于多源域深度迁移学习的故障诊断迁移学习模型

2.1 深度特征提取网络DNN

故障模型的深度特征提取网络采用一个共享参数的3层深度神经网络模型进行深层故障特征的提取,分别为输入层、隐藏层和特征输出层,最后采用SoftMax分类器进行故障分类。假设x,f为神经网络的输入和特征向量,隐藏层输出向量定义h,则前向过程如下

(5)

式中:W1为输入层和隐藏层之间的权值矩阵;W2为隐藏层和特征输出层之间的权值矩阵;b1和b2分别为隐藏层和特征输出层的偏置。则深度神经网络模型的分类损失函数定义

(6)

2.2 最大均值差异

(7)

基于MMD的定义,多源域故障诊断迁移学习中的MMD计算如下式所示

(8)

因此,DNN的迁移学习故障诊断模型的总损失函数定义如下

λ·[DMM(Fs1,Ft)+DMM(Fs2,Ft)]

(9)

式中,λ为MMD项的惩罚系数。该损失函数由源域的分类损失函数以及源域和目标域特征分布最大均值差异的损失函数两部分组成。其分类损失函数可以保证模型具有较好的分类性能,MMD损失项可以减小不同域特征分布的差异,提高域特征的相似性和不变性。模型训练过程通过采用Adam优化算法来最小化式(9),Adam算法能够有效地加速训练过程,解决大量参数优化的问题。

2.3 多源域深度迁移学习故障诊断流程

本文提出的基于多源域深度迁移学习的故障诊断方法流程如图3所示。

图3 基于多源域深度迁移的故障诊断方法流程

首先,从多源域中随机选择q个样本作为锚点,计算每个锚点与多源域数据和目标域数据的相似度,并基于相似度生成新的源域和目标域适配器数据,并构建基于锚适配器的源域-目标域数据对。其次,对每一个数据对采用基于深度神经网络模型的故障诊断迁移学习方法进行模型训练,得到q个分类器,并利用生成的新目标域数据进行故障分类预测,得到q个预测结果。最后,通过采用加权集成的方式,对所有锚适配器对应的分类器进行集成,实现最终故障诊断模型的构建,用于对目标域数据进行测试,获得最终故障诊断结果。

3 结果与讨论

3.1 试验设置

选取凯斯西储大学实验室[26]的轴承数据集作为试验数据对所提方法进行验证,试验设置如图4所示,主要由感应电机、检测轴承和加载电机组成,测试轴承支撑电机轴。采用电火花加工方法对电机轴承(6205-2RS JEM SKF)进行了故障植入,分别内圈、滚子元件和外圈处引入直径0.177 8 mm、0.355 6 mm、0.533 4 mm、0.711 2 mm的单点故障。每个轴承在4种不同的负载(1 797 r/min,1 772 r/min,1 750 r/min,1 730 r/min)下测试。在驱动端附近的外壳上安装了一个带有磁吸式底座的加速度计来收集振动信号,采样频率为12 kHz。

图4 轴承故障试验设置

分别采集4种不同工况下的数据对所提方法进行验证,每一类工况下包含12类的数据:正常,0.177 8 mm(滚子、内圈、外圈(3点钟方向、6点钟方向));0.355 6 mm(滚子、内圈、外圈(6点钟方向));0.533 4 mm(滚子、内圈、外圈(3点钟方向、6点钟方向))。每种工况下每一故障类别数据包含300个样本,每个样本是一个采集到的振动信号段,由400个样本点组成,并通过傅里叶变换获得频域数据,从频域数据样本中随机选择225个样本作为训练数据,其余75个样本作为测试数据,其数据具体划分如表1所示。

表1 12类轴承数据描述

采用锚适配器集成与深度神经网络结合的多源域迁移学习方法进行多工况下轴承故障诊断,采用模型网络结构为200-100-50-12,激活函数采用Sigmoid函数,其网络模型的学习率为0.02,相关参数如表2所示。此外,设置锚适配器的个数n为24,特征相似度的度量MMD的惩罚系数为2。

表2 DNN模型参数

3.2 结果与对比分析

3.2.1 单源域与多源域迁移结果对比分析

将4种不同负载(1 797 r/min,1 772 r/min,1 750 r/min,1 730 r/min)的轴承故障数据集标记为(Hp0, Hp1, Hp2, Hp3)。将Hp0和Hp1同时作为源域,有标签,Hp2作为目标域,无标签,进行多种工况与单一工况迁移学习(Hp0→Hp2、Hp1→Hp2、Hp0-Hp1→Hp2)故障分类,采用所提方法进行5次故障分类试验,其余任务采用类似方式进行同样方式进行故障分类,分类结果如表3和图5所示。

从表3结果进行对比分析,可以发现单一工况任务的迁移学习任务,如Hp0→Hp3和Hp1→Hp3两种任务的平均准确率分别为0.917 3和0.984 8,而对于Hp0-Hp1→Hp3的准确率可达0.997 3,其分类准确率明显高于Hp0、Hp1分别迁移到Hp3两种单一工况迁移学习任务;此外,通过图5中可以看出除了任务C1之外的其他任务比较,两种工况共同进行迁移学习任务的分类准确率明显高于其中任意单一源域工况迁移到目标域工况的任务,其中,多工况迁移学习的分类精度相比于其中任意一种单一工况的迁移学习最高可提升8.78%;而且通过对比其他单一工况迁移学习和两种工况共同迁移学习任务的分类精度变化趋势可以看出多源域迁移学习模型的稳定性明显比较好。

表3 多源域深度迁移故障分类结果

图5 单源域迁移与多源域迁移故障诊断结果对比图

单源域迁移学习任务Hp0→Hp3和Hp1→Hp3以及多源域迁移学习任务Hp0-Hp1→Hp3的特征分布,如图6所示。从图6中任务Hp0→Hp3的特征分布可知,故障类别7、10没有完全被区分,同样从任务Hp1→Hp3的特征分布看出,故障类别5、7的部分样本被误分类到故障类别10中,导致任务Hp0→Hp3和Hp1→Hp3的精度不足;然而从任务Hp0-Hp1→Hp3的特征分布可以看出,12种故障深度特征完全被区分,使得任务Hp0-Hp1→Hp3的分类准确率率明显高于对应的单源域迁移学习任务。因此,结合锚适配器集成和深度神经网络的多源域迁移学习故障诊断方法能够从不同工况源域数据中综合考虑多种工况下的故障特征信息,可以学习到较为稳定的域不变特征,进而对于目标域工况获得比较好的分类性能,提高模型精度。

(a)Hp0→Hp3

3.2.2 与其他迁移学习方法对比分析

为了更客观地测试所提方法的性能,与其他迁移学习方法进行对比来证明本文所提方法在故障诊断方面具有更好的稳定性和准确率。这些方法主要包括:迁移成分分析(transfer component analysis, TCA)、联合分布适应方法(joint distribution adaptation, JDA)、平衡分布适应方法(balanced distribution adaptation, BDA)、公共关系对齐方法(co-relation alignment, CORAL),这些方法的主要参数描述如表4所示。

表4 不同方法的主要参数

此外,并与基于卷积神经网络的迁移学习网络(deep convolutional transfer learning network, DCTLN)[27]和域对抗神经网络(domain adversarial neural networks, DANN)[28]两种方法的诊断结果对比分析。利用以上6种迁移学习方法进行同样的12类多源域迁移学习故障诊断任务,不同方法在12类任务上的分类结果准确率如表5和图7所示。

从表5的对比结果可知,基于多源域深度迁移学习故障诊断模型相比于其他方法在12个不同的迁移学习故障诊断任务上具有最好的分类性能,并且该方法的在12个不同任务的平均准确率为0.994 5,而TCA、JDA、BDA、CORAL、DTCLN和DANN的平均准确率分别为0.872 7,0.903 3,0.894 1,0.859 8,0.941 3和0.957 9,通过对比可以看出该方法明显比其他6种迁移学习方法的性能好。此外,根据对比标准差分析以及图6可知,其他6种方法在不同的任务上性能表现不是很稳定,尤其是BDA,BDA的标准差为0.051 7,从图7中也可知对于不同任务其性能波动最大。然而本文方法在12个任务上的标准差为0.003 8,明显比其他方法小,从图7可知其性能波动较小,进一步说明该方法在不同的任务能够呈现出较好的稳定性,具有较好的泛化能力。

表5 不同迁移学习方法对于多源域故障诊断的准确率

图7 不同方法故障诊断准确率对比图

以多源域迁移学习任务Hp0-Hp1→Hp3为例,进行其他对比方法TCA、JDA、BDA、CORAL、DTCNN和DANN在该任务上的特征分布可视化,如图8所示。

从图8可知,TCA、JDA、BDA和CORAL相比于DTCNN和DANN,对于可判别特征学习能力较差,进而可以从表5和图7可知TCA、JDA、BDA和CORAL在多源域迁移学习任务上的故障诊断效果没有DTCNN和DANN效果好。尽管DTCNN和DANN有较好的特征学习能力,与本文方法在任务Hp0-Hp1→Hp3上特征分布图6(c)相比,在域不变特征学习能力方面仍然不足。

对比图6(c)和图8可以可看出,本文方法可以从多个域中提取可判别的域不变特征,进而导致本文方法相比于其他不同方法在任务Hp0-Hp1→Hp3上具有较好的故障诊断精度。

(a)TCA

4 结 论

针对单源域迁移学习出现的负迁移和泛化能力差的问题,提出了基于多源域深度迁移学习的机械故障诊断方法,并通过滚动轴承数据集验证所提方法的有效性。主要结论如下:

(1)结合锚适配集成和深度神经网络的多源域深度迁移学习故障诊断方法,集成了滚动轴承多源域数据的故障信息,更好地从源域数据中学习公共的域不变故障特征信息。通过滚动轴承故障诊断案例分析,多源域迁移学习相比于其中的任意单源域迁移学习有较好的诊断效果,最高可提升8.78%。

(2)与其他方法相比,本文所提方法对于不同的多源域迁移学习方法具有较好的稳定性和诊断效果,提高了模型的泛化能力,为机械故障诊断提供一种新的途径。

猜你喜欢

源域适配器故障诊断
基于包络解调原理的低转速滚动轴承故障诊断
基于参数字典的多源域自适应学习算法
数控机床电气系统的故障诊断与维修
基于3D打印的轻型导弹适配器
潜空导弹垂直发射出筒适配器受载变形仿真研究
电源适配器怎么选
从映射理论视角分析《麦田里的守望者》的成长主题
美国麦格普公司新型M—LOK相机三脚架适配器
基于LCD和排列熵的滚动轴承故障诊断
江淮同悦纯电动汽车无倒档故障诊断与排除