APP下载

基于格拉姆角场和迁移深度残差神经网络的滚动轴承故障诊断

2022-11-21古莹奎

振动与冲击 2022年21期
关键词:残差灰度故障诊断

古莹奎, 吴 宽, 李 成

(江西理工大学机电工程学院,江西 赣州 341000)

滚动轴承作为机械装备的关键零部件之一,其运行状态的好坏直接影响到整个装备的性能。由于机械装备本身结构复杂且服役环境恶劣,滚动轴承经常发生各种故障,造成直接或间接的经济损失。因此,对滚动轴承进行实时状态监测及故障诊断是非常有必要的[1]。

传统故障诊断在特征提取阶段,主要采用时域、频域或时频域等信号处理方法对测得的信号进行分析,提取相应状态的故障特征[2-4]。在模式识别阶段,利用提取到的故障特征对相应的机器学习模型进行训练,如决策树、支持向量机(support vector machine, SVM)和人工神经网络等[5-7]。这些方法已取得了许多成果,但也有着不可忽视的缺陷。在特征提取阶段,传统故障诊断方法需要大量相关知识和经验,不同类型的振动信号往往适用的处理方法不同。此外,提取到的特征通常适用于特定工况,很难找到一种普适性方法[8]。在故障模式识别阶段,机器学习模型通常只被用作分类器,不能挖掘到更深层次的信息。

深度学习作为一种相对较新且发展迅猛的机器学习方法[9],能够有效克服传统故障诊断方法在特征提取阶段的上述缺点,并在故障诊断领域得到广泛应用。目前已有不同种类的深度学习方法,如长短时记忆网络、深度置信网络和稀疏自编码器(sparse autoencoder,SAE)等[10-12],其中最具代表性的为卷积神经网络(convolutional neural network,CNN)[13]。由于CNN在图像处理领域具有天然的优势,因此将信号编码为二维图像输入CNN进行故障诊断是近几年的研究热点。肖雄等[14]提出了一种基于灰度图数据增强和CNN的故障诊断方法,将数据增强后的灰度图输入CNN进行故障诊断。吴晨芳等[15]提出将时频域信号转换为灰度图,利用改进的LeNet-5对灰度图进行特征提取。以上方法虽取得了不错的诊断精度,但也存在一定的不足。

灰度图编码方法一定程度上能反映振动信号的特征,但在编码过程中会造成振动信号时间信息的缺失,从而造成故障特征信息的缺失。庞新宇等[16-17]提出一种格拉姆角场(Gramian angular fields,GAF)编码振动信号和CNN结合的行星齿轮箱故障诊断方法,将振动信号编码成格拉姆角差场(Gramian angular difference fields,GADF)和格拉姆角和场(Gramian angular summation fields,GASF)的同时,保留了振动信号的时间信息,提高了行星齿轮箱故障诊断的精度。刘红军等[18]提出GADF与改进的CNN相结合的故障诊断方法,使用全局均值池化层代替传统CNN的全连接层,取得了较高的诊断精度。但这些方法也存在一些不足,例如将GADF输入CNN进行特征提取时,CNN网络需要人为地调整网络层数和卷积核大小,且训练过程中容易出现过拟合现象。

深度残差神经网络(deep residual neural network,ResNet)的提出,较好地解决了上述问题[19]。ResNet通过在输入和输出之间添加一条直接连接的Skip Connection,可以让神经网络具有自适应退化到浅层网络的能力,同时也使得梯度弥散和梯度爆炸等现象也得到了明显改善。但ResNet在训练过程中,由于其参数量多,收敛速度相对较慢,容易陷入局部最优解。为解决此类问题,Shao等[20]提出了一种利用迁移学习来加速神经网络训练的方法,先预训练好的网络参数提取浅层特征,再使用不同故障模式下的时频图像对网络参数进行训练微调,从而实现更快速和更高精度的故障诊断。

本文将迁移学习方法引入滚动轴承故障诊断,提出一种基于GAF图像编码技术与迁移深度残差神经网络(transfer deep residual neural network,TRN)相结合的故障诊断方法,将振动信号转化为GADF和GASF两种图像,通过基于迁移模型的ResNet18提取不同故障模式下对应的GAF图像中的特征,并加以分类,继而达到故障诊断的目的。

1 GAF图像编码与迁移深度残差神经网络

1.1 GAF图像编码

(1)

(2)

式中,N为正则化极坐标系统张成空间的常数因子。

当α∈[0,π]时,cos(α)为单调的,随着时间的推移,放缩之后的数值映射到极坐标系中有且仅有一个结果,这种做法相较于笛卡尔坐标系的好处在于,通过极坐标系里的半径R,保持了绝对的时间关系,编码过程如图1所示。

图1 GAF图像编码示意图Fig.1 Schematic diagram of GAF image encoding

在不同目标区间内放缩的数据具有不同的角度边界。将放缩后的时间序列映射到极坐标系之后,通过考虑每个点之间角度差或角度和的值来反映不同时间间隔内的时间相关性,GADF及GASF的定义如下[21]

通过上述变换可将给定时间序列转化为沿对角线对称的二维特征图像,并保留时间序列内的时间相关特征。

1.2 基于迁移学习的深度残差神经网络

ResNet通过在各个卷积层的输入和输出之间添加Skip Connection实现网络退化机制,输入x通过两个卷积层,得到特征变换输出F(x),然后与输入x进行对应元素相加,得到最终输出H(x)

H(x)=F(x)+x

(5)

H(x)称为残差模块,被Skip Connection包裹的卷积神经网络需要学习的映射为F(x)=H(x)-x,故被称为残差神经网络。

在卷积层中,使用尺度明显小于输入特征图尺度的卷积核对其进行局部特征提取,建立两个相邻卷积层之间的稀疏连通性。卷积层计算如下

(6)

在卷积层中,输出特征图的每个通道对应一个卷积核,不同通道对应不同的卷积核。

在连接最后的输出层时,需要先经过一个全局均值池化层,以大幅减少参数数量,从而减少过拟合现象的产生,提高网络模型的整体泛化能力。全局均值池化主要是计算输入特征图的每个通道的平均值,表示为

(7)

在全连接输出层,使用Softmax函数作为分类器,将多个神经元的输出映射到[0,1]内,并保证概率之和为1。假设类别总数为K,Softmax函数表示为

(8)

式中:xi为输出层中第i个神经单元的输出特征;qj为输入样本x属于第j类的预测概率。

使用交叉熵损失函数评估预测值和真实值之间的误差,定义为

(9)

式中:p(x)与q(x)分别为样本x的真实概率分布和预测概率分布;pj(x)为属于第j类输入样本x的预测概率。

采用故障识别精度Acc对模型进行评估,定义为[22]

(10)

迁移学习是深度学习的一种策略,通过将从源域上学习到的知识迁移到目标域上,提高在目标域上的泛化性能[23]。对于神经网络模型而言,一般认为网络模型是逐层提取特征,随着网络层数的加深,对抽象特征的提取能力越强。对于相似的任务,假设特征提取方法相似,则网络前端训练好的网络层可以迁移到新的分类任务中使用,而网络后端可以依据新的分类任务进行具体设定。

基于模型的迁移学习如图2所示,首先训练左端任务A,将在任务A中学习到的知识,迁移到任务B时,能够调用任务A中网络模型前端数层的网络参数,并将后面的数层替换为新的分类子网络后再进行网络的训练。通过迁移任务A前端数层的网络参数到任务B的神经网络模型中,可以使用更少的训练样本,大幅度减少训练代价,提高模型的泛化能力。对于图片分类来说,在ImageNet数据集上进行的预训练模型是一个较好的选择。

图2 基于模型的迁移学习Fig.2 Model-based transfer learning

TRN是一种基于模型迁移的ResNet18网络。以采集到的振动信号为例,将其编码为GAF图并做为网络输入,构建TRN模型,如图3所示。主要由4个残差模块组组成,分别以不同颜色加以区别。每个残差模块组包含两个残差模块,即包含了17个卷积层和一个全连接层,模型结构参数如表1所示。每个残差模块的第一个卷积层进行批量归一化操作,并采用ReLU函数作为激活函数,且每个残差模块组的第一个卷积层和TRN结构中的第一个卷积层进行卷积运算时,步长为2,其余卷积层步长均为1。全连接层神经元个数为512,经过Softmax函数之后对应有10个输出。网络训练损失函数使用交叉熵损失函数,优化算法选择Adam优化算法。将ResNet18模型在ImageNet上进行训练,将训练完备的ResNet18网络全连接层之前的网络参数迁移至故障信号GAF编码的特征图像分类网络中,继而达到故障诊断的目的。

表1 TRN模型结构参数Tab.1 Structural parameters of TRN model

图3 TRN网络模型结构Fig.3 TRN network model structure

2 滚动轴承故障诊断试验与分析

2.1 数据采集和GAF图像编码

轴承故障试验台如图4所示,试验选用6205型深沟球轴承,轴承故障位置设置为内圈、外圈和滚动体,故障类型均为点蚀故障;故障等级分别为轻微点蚀、中度点蚀和重度点蚀3种级别,共计9种故障状态,如图5所示。

图4 轴承故障试验台Fig.4 Bearing fault test bench

(a) 滚动体点蚀1级

(b) 滚动体点蚀2级

(c) 滚动体点蚀3级

(d) 内圈点蚀1级

(e) 内圈点蚀2级

(f) 内圈点蚀3级

(g) 外圈点蚀1级

(h) 外圈点蚀2级

(i) 外圈点蚀3级图5 9种故障类型轴承Fig.5 9 types of fault bearings

使用CA-YD-187T02压电加速度传感器进行振动信号采集,采样频率设置为20 480 Hz,转速为1 500 r/min。将采集到的振动信号按顺序截取为长度相同的时间序列,每个时间序列为500个数据点,每类故障状态构造240个时间序列。

采用GAF图像编码,将每个时间序列转化成为相应的GADF和GASF图。采用One-hot编码方式为9种故障状态和正常状态的GAF编码图像进行标注,并按照8∶2的比例划分训练集和测试集。

2.2 GAF-TRN模型构建及故障诊断流程

将GADF和GASF图像进行预处理,调整尺寸为224×224大小作为模型输入到TRN进行分类诊断,TRN模型结构如图3所示。将振动信号编码为GADF和GASF两种图像的结果如图6所示。

(a) GADF编码图像

(b) GASF编码图像 ①滚动体点蚀1级;②滚动体点蚀2级;③滚动体点蚀3级;④内圈点蚀1级;⑤内圈点蚀2级;⑥内圈点蚀3级;⑦正常轴承;⑧外圈点蚀1级;⑨外圈点蚀2级;⑩外圈点蚀3级。图6 GADF和GASF对轴承不同故障状态信号编码图Fig.6 GADF and GASF coding diagram for different fault state signals of bearings

基于GAF-TRN的故障诊断流程如图7所示。步骤如下。

图7 GAF-TRN故障诊断流程图Fig.7 GAF-TRN fault diagnosis flow chart

步骤1对采集到的一维振动信号进行归一化处理,然后均等分割成若干片段,每个片段按照GAF编码为GADF或GASF二维图像,并按比例划分训练集和测试集。

步骤2将图像输入TRN模型中的ResNet网络中,并将在ImageNet上训练好的ResNet18网络参数迁移至GAF的ResNet网络中。

步骤3提取图片特征信息,获得不同故障状态下的特征信息,并更新迁移后的网络参数。

步骤4通过Softmax分类器建立与其相应故障类型的映射关系,继而实现故障诊断。

2.3 GADF-TRN和GASF-TRN对比试验

分别将GADF和GASF两种类型的图像作为TRN的输入,进行对比试验。文中对比试验的运行环境均为PyCharm,模型均由PyTorch深度学习框架实现,并在Intel core i5-9300H处理器和GTX1650显卡的计算机上运行。

经过40次迭代后,得到的准确率曲线和损失曲线,如图8所示。由图8可知,GADF-TRN在训练集上的准确率达到了100%,在测试集上的准确率稳定在99.30%。反观GASF-TRN在训练集上准确率也达到了100%,但是训练过程没有GADF-TRN稳定,有较明显的波动,更重要的是在测试集上的识别准确率为96.48%,明显低于GADF-TRN模型。由此可知,GADF编码图相较于GASF编码图更能凸显不同故障状态之间的差异性,GADF-TRN在诊断滚动轴承点蚀故障方面较GASF-TRN效果更为准确,且该模型具有更为良好的鲁棒性。

(a) 准确率

(b) 损失曲线图8 GADF和GASF迭代40次后的准确率和损失曲线Fig.8 Accuracy of recognition and loss curves of GADF and GASF after 40 iterations

2.4 对比分析

2.4.1 与传统图像编码方法对比

灰度特征图编码是一种常用的一维信号转化为二维图像的编码方式。为验证本文提出的GADF编码的优越性,现将两种编码方法进行对比分析。对于灰度特征图编码而言,也是一个数据映射的过程。取灰度等级为256级,样本点数为M,灰度图尺寸为w×h,其中M=w×h。每个样本点对应像素点的灰度值为255×(ci-cmin)/(cmax-cmin),其中c为每个样本点的振幅大小。根据该方法,设置每个样本长度为484,编码出的灰度图尺寸为22×22,每种故障模式生成240张灰度图,同样按照8∶2的比例划分训练集和测试集。灰度图编码结果与本文所提方法的对比结果,如图9所示。

(a) 灰度图编码

(b) 两种编码方法的准确率和损失曲线图9 灰度图编码特征图和两种编码方法对比结果Fig.9 Grayscale map coding feature map and comparison results of two coding methods

由图9可以看出,基于灰度图编码的诊断精度为94.65%,明显低于GADF编码方式的诊断精度。究其原因在于,灰度图编码忽略了时间序列内部样本点之间的时间相关性,而GADF编码方式的优点在于表征数据特征的同时,保留了样本点之间的时间依赖性。

2.4.2 不同诊断方法与GADF-TRN的对比

采用GADF图像作为输入,训练集和测试集的比例划分仍为8∶2,增加未经迁移的ResNet18网络、卷积神经网络、稀疏自编码器、支持向量机和BP(back propagation)神经网络5种方法做对比试验,每种方法进行10次试验,并对所得结果取平均值并计算相应的标准差。试验结果如图10、表2所示。

图10 6种方法在测试集上的识别率对比Fig.10 Comparison of recognition rates of the 6 methods on the test set

表2给出了6种模型训练集和测试集的识别率及其波动范围和标准差。由分析可知,GADF-TRN在测试集上的识别率最高,达到99.30%,其识别率波动范围仅为0.17%,且收敛速度较快,识别精度具有良好的鲁棒性;GADF-ResNet18识别精度次于GADF-TRN,为96.67%,但整体收敛速度慢于GADF-TRN,原因在于GADF-TRN利用迁移模型参数的方法,从一定程度上缓解了模型误差反向传播时陷入局部最优解的情况,同时通过迁移模型参数的方法,避免了从零开始训练,提高了优化函数的收敛速度,有效缩减训练时间。

表2 6种模型的对比结果Tab.2 Comparison results of the 6 models

对于GADF-CNN模型,在本试验训练集上达到了100%的识别精度,但是在测试集进行验证时,识别精度仅为93.96%,出现了轻微程度的过拟合,原因在于故障特征较为简单,所使用的CNN模型相对于要提取的特征来讲过于复杂。本文提出的GADF-TRN方法,是基于残差网络中残差模块的原理,使得模型具有回退机制,可以自适应地退化为层数较浅的神经网络,相较于网络层数固定的CNN,明显改善了过拟合现象造成的影响;对比仝钰等和刘红军等的研究中的GADF-CNN模型,GADF-TRN具有更快的收敛速度和更少的过拟合现象,在迭代16~18个回合时就趋于完全收敛,而GADF-CNN模型则需要迭代40个回合时才开始收敛,GADF-CNN需要精调参数减少过拟合现象带来的影响;GADF-TRN则不需要人为调整网络结构参数就能达到减少过拟合现象的效果;至于GADF-SAE、GADF-SVM和GADF-BP 3种方法,识别率分别为85.62%,70.13%和67.02%,识别精度整体偏低,收敛速度缓慢,识别率波动范围较大,且具有相对较差的鲁棒性。

2.4.3 与其他迁移学习方法的对比

采用4种常见的迁移学习方法与TRN进行对比试验,将同样在ImageNet数据集上训练完备的VGG16,VGG19,ResNet34和ResNet50网络的特征提取层参数分别迁移至以不同故障模式下GADF图像作为输入的相应网络中,然后进行训练,每种方法进行10次试验并取训练结果的平均值。对比试验结果如表3所示。

表3 不同迁移学习方法下的对比结果Tab.3 Comparison results under different transfer learning methods

由表3可知,以上5种基于迁移学习的方法中,VGG16和VGG19在训练集上能够得到很高的准确率,但是在测试集上分别得到89.66%和78.83%两个较低的准确率,原因在于模型的层数深,导致模型的特征提取能力远高于数据的复杂程度,出现了过拟合现象。TRN,ResNet34和ResNet50由于网络结构中都含有跳跃短接,能够自适应的将深层网络回退至较浅层的网络,减少了过拟合现象的影响,而且从训练集准确率和测试集准确率来看,这3种网络的诊断精度均在99.00%以上。从网络参数量上来看,VGG16和VGG19参数量比另外3种网络高出10倍以上,加大了模型的训练困难程度。在TRN,ResNet34和ResNet50 3种网络中,ResNet34在测试集上的准确率最高,为99.42%,比TRN在测试集上的准确率仅高0.12%,但ResNet34网络的参数量几乎是TRN网络参数量的2倍,导致模型训练时的计算量成倍增加。综上所述,GADF-TRN相比其他迁移学习方法,在保证高精度的同时,具有更少的计算量,加快了模型的训练速度,降低了训练成本。

2.4.4 结果分析

为进一步探究GADF-TRN诊断结果内部的详细分类情况,采用混淆矩阵和t-分布随机邻域嵌入(t-distributed stochastic neighbor embedding, t-SNE)来表征具体分类情况,如图11所示。

(a) 混淆矩阵

(b) t-SNE降维图图11 混淆矩阵和t-SNE降维图Fig.11 Confusion matrix and t-SNE dimensionality reduction map

从混淆矩阵可以明显看出,GADF-TRN对于滚动体2级和3级点蚀、内圈2级和3级点蚀以及外圈2级和3级点蚀的识别准确率均达到了100%,对滚动体1级点蚀、内圈1级点蚀、外圈1级点蚀和无故障轴承的诊断精度虽未达到100%,但也均在97.40%以上。同样,通过t-SNE对提取到的高维特征映射到二维非线性可分空间进行降维分析,可以明显看出,每种故障状态均有良好的区分。

3 结 论

提出了一种GADF-TRN的故障诊断方法,以提高针对滚动轴承点蚀类型故障的识别精度。通过滚动轴承的试验对本文提出的方法进行验证,并与其他诊断方法之间进行对比分析,得出以下结论:

(1) 通过GAF对信号进行编码,相较于传统编码方法,保留了不同时间间隔之间的相关性,可以将故障特征更加充分地表征到相应的二维图像。同时利用残差神经网络的自适应回退机制减少过拟合现象带来的影响,提高诊断精度。

(2) GADF编码对原始信号的表征能力略强于GASF编码,同时GADF与通过迁移模型参数得到的TRN结合,提高了收敛速度,避免陷入局部最优解,减少了训练代价,从而进一步提高了故障诊断的精度和效率。结果表明GADF-TRN在轴承故障诊断中具有良好的可行性和鲁棒性。

(3) 相较于其他迁移学习方法,GADF-TRN在保证高诊断精度的同时,减少了模型参数量和模型训练时的计算量,具有更快的训练速度。

猜你喜欢

残差灰度故障诊断
采用改进导重法的拓扑结构灰度单元过滤技术
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于双向GRU与残差拟合的车辆跟驰建模
基于包络解调原理的低转速滚动轴承故障诊断
Bp-MRI灰度直方图在鉴别移行带前列腺癌与良性前列腺增生中的应用价值
基于残差学习的自适应无人机目标跟踪算法
基于深度卷积的残差三生网络研究与应用
数控机床电气系统的故障诊断与维修
基于最大加权投影求解的彩色图像灰度化对比度保留算法
基于量子万有引力搜索的SVM自驾故障诊断