基于二维图像和CNN-BiGRU网络的滚动轴承故障模式识别

2021-12-20张训杰李贤均

振动与冲击 2021年23期

张训杰，张敏,2，李贤均

(1.西南交通大学机械工程学院,成都 610031； 2.西南交通大学轨道交通运维技术与装备四川省重点实验室,成都 610031)

滚动轴承作为旋转机械的核心部件，其健康状况将直接影响到旋转机械的性能、稳定性以及寿命[1]。研究表明40%～50%的旋转机械故障都与滚动轴承失效有关[2]，为保障旋转机械作业安全，对滚动轴承进行有效的故障诊断就显得意义重大。采用机器学习的智能故障诊断算法在滚动轴承故障诊断领域得到广泛运用[3-5]。尽管这些方法已经取得了较好的效果，但机器学习算法一般结构较浅，从而限制了分类器在故障诊断问题中学习轴承信号中所包含的复杂非线性以及非平稳性关系的能力。

为解决这些问题，越来越多的深度学习模型应用在滚动轴承故障诊断领域[6-9]。其中，卷积神经网络(convolutional neural network,CNN)作为一种端到端的学习模型，极大地简化了故障诊断步骤，因此得到了广泛关注[10]。Zhang等[11]利用一维卷积神经网络直接对滚动轴承原始信号进行故障诊断，省去了特征提取等预处理环节。曲建玲等[12]提出了基于卷积神经网络的层级化智能故障诊断模型，可同时识别出滚动轴承的故障位置以及故障程度。Wang等[13]对卷积神经网络做出进一步改进，利用粒子群优化算法确定网络的主要参数，以适应滚动轴承故障诊断。以上模型都是基于一维卷积神经网络而建立的，因为轴承振动信号是一维数据，但卷积神经网络更容易从高维数据中提取特征信息[14]。这是因为卷积神经网络最本质的结构构想包括3个关键方面：局部连接、权值共享以及池化，这使得卷积神经网络更适合处理二维数据，其在计算机视觉领域尤其是在图像特征自动提取与图像分类识别中已经得到广泛运用并取得很好的效果[15]。

因此有学者开始研究将轴承振动信号转换为图像数据，进而使用二维卷积神经网络完成分类识别。Zhang等[16]对轴承振动信号进行均分，再把分得的每一段信号按顺序作为图像矩阵的行，实现一维信号向二维图像的转换，最后通过卷积神经网络完成故障诊断。张弘斌等[17]采用连续小波变换提取轴承信号的时频特征，以此构建二维图像，并将3种相关联的图像融合在一起，输入至深度卷积神经网络以实现分类识别。Hoang等[18]将轴承信号的振幅进行归一化处理，并将其作为相应图像中所对应的像素值，得到各类信号的振动图像，之后同样由卷积神经网络通过对振动图像分类来识别轴承的故障状态。以上模型通过图像转换，成功将滚动轴承故障诊断与二维卷积神经网络联系在一起，并取得了较满意的诊断结果。但诊断过程依然存在以下一些缺陷：由振动信号转换的二维图像多为灰度图像，包含的特征信息有限，相比之下，彩色图像囊括更丰富的颜色特征信息，特别是在图像分类的应用中[19]；同时，构建不同的二维图像并将之融合在一定程度上增加了图像转换的复杂性；另外轴承振动信号包含着对时间的依赖性，尤其是对于不同故障程度的振动信号，这种时间关系显得尤为重要。振动信号在转换为图像的过程中，这种对时间的依赖性同样映射到图像特征空间中，而卷积神经网络更多地是提取图像局部空间特征，以上模型都难以将这种时间依赖特征提取出来。

综上所述，一方面由滚动轴承振动信号转换的二维图像需尽可能多的包含原始特征信息;另一方面以二维卷积神经网络为基础建立的诊断模型要能够有效识别出图像特征中对于时间的依赖性。针对以上问题，本文利用格拉姆角场(Gramian angular fields,GAF)方法[20]将滚动轴承振动信号转换为二维彩色图像，并提出基于二维卷积神经网络与双向门控循环单元(gated recurrent unit，GRU)相结合的诊断模型自动提取图像的空间特征与时间特征，最终由分类器实现分类识别。

1 方法

1.1 格拉姆角场

格拉姆角场能够将时间序列数据转换为图像数据[21-22]。滚动轴承故障振动信号在采集过程中多为加速度信号，在直角坐标系中是典型的一维时间序列，其横坐标表示采样点或者时间值，纵坐标则表示每个点对应的幅值大小，单位为m/s2。通过格拉姆角场方法，将时序数据转化成图像数据，实现过程如下。

步骤1假定一段时间序列数据X={x1,x2,x3,…,xn}，通过式(1)将其归一化至区间[-1,1]或者[0,1]内

(1)

步骤2对缩放后的时间序列在极坐标系上进行编码，将新得到的幅值编码为角余弦，其对应的时间戳编码为半径

(2)

步骤3对格拉姆角场进行定义，利用每个点之间的三角和或差来识别不同时间间隔的相关性。格拉姆角和场(Gramian angular summation fields,GASF)与格拉姆角差场(Gramian angular difference fields,GADF)的定义公式分别如式(3)和式(4)所示

AGSF(i,j)=[cos(φi+φj)]=

(3)

AGDF(i,j)=[sin(φi-φj)]=

(4)

图1 格拉姆角场编码示意图Fig.1 Gramian angular fields coding schematic

1.2 卷积神经网络

卷积神经网络通常由输入层、卷积层、池化层、全连接层以及输出层组成。卷积层主要对输入数据进行特征提取，由输入层而来的数据信息与卷积层的卷积核进行卷积运算，其数学表达式为

(5)

卷积层后通常都连接着一个池化层，用于信息过滤并减少网络中参与计算的参数，防止发生过拟合。其计算公式为

(6)

1.3 双向门控循环单元

门控循环单元由Chung等[24]于2014年开发。作为循环神经网络(recurrent neural network,RNN)的变体之一，GRU能有效地解决RNN在训练过程中出现的梯度消失问题。与长短期记忆网络(long short-term memory,LSTM)相比，GRU更像是其简化版，GRU只有两个门(更新门和重置门)，在一定程度上减少了网络的参数，进而提升了模型的训练速度。在GRU内部，更新门(z)指定相关信息保留至下一个状态，而重置门(r)则决定如何将先前的信息状态与新的输入信息结合起来。在处理时间序列数据时，GRU能有效学习到其中的长期依赖关系，其具体计算过程为

zt=σ(Wz·[x(t),h(t-1)])

(7)

rt=σ(Wr·[x(t),h(t-1)])

(8)

(9)

(10)

式中:σ(·)与tanh(·)为激活函数；x(t)为输入数据；h(t-1)为前一状态的输出数据；Wz、Wr以及Wh分别为更新门、重置门以及输出待定值的权重矩阵。

双向控循环单元(bidirectional gated recurrent unit，BiGRU)包含了两个普通的GRU[25]，每个GRU分别沿一个方向对输入序列进行处理(时间正序和时间逆序)，然后将各自的输出合并在一起。由格拉姆角场转换的二维图像依然保留着对于时间的依赖性，而双向GRU能够捕捉到可能被单向GRU忽略的特征信息，从而提高GRU的性能，双向GRU结构如图2所示。

图2 双向GRU结构图Fig.2 The structure of bidirectional GRU

1.4 基于CNN-BiGRU网络的诊断模型

针对由格拉姆角场转换而来的二维图像，本文提出基于CNN-BiGRU的识别模型，其网络结构如图3所示。

图3 CNN-BiGRU网络结构图Fig.3 The structure of CNN-BiGRU network

模型中通过第一层批量输入由滚动轴承振动信号转换的二维图像；第二层为卷积层，通过卷积运算，学习输入图像的局部特征；第三层为池化层，对输入的特征图进行下采样，去掉部分冗余信息。经过第一轮卷积层与池化层的运算，模型完成了第一阶段的特征学习。之后增加3组卷积层与池化层，使模型逐渐从低层次的原始故障特征学习到高层次的本质故障特征。将由CNN提取到的特征图展平为一维向量，并将其送入到双向GRU中，每个GRU层分别从正向和反向处理这段向量，确保模型不仅能由正序获得积聚依赖信息，而且也能从逆序获得来自未来的积聚依赖信息，保持对时间特征的敏感性，并进一步剔除冗余信息，达到丰富特征信息的目的。最终得到的特征信息包含有原始图像的空间特征与时间特征，将其展平后再送入全连接层进行重新整合以及参数的微调并映射到样本标签空间，由Softmax层完成对故障信息的分类。整个网络在各个特征学习阶段后都引入Dropout层，使网络在运算过程中随机停止部分神经元参与工作，防止模型发生过拟合。模型的架构如表1所示。

表1 模型架构说明Tab.1 Illustration of model structure

2 试验分析

本文所提出的滚动轴承故障模式识别的整体流程图,如图4所示。振动信号进行样本扩充处理后，通过格拉姆角场转换为二维图像，利用训练集与验证集训练设计的CNN-BiGRU网络模型，最后在测试集上验证模型分类的有效性。

图4 故障模式识别整体流程图Fig.4 Overall flow chart of fault pattern recognition

2.1 数据来源

本文的试验数据为美国凯斯西储大学(CWRU)的开放滚动轴承故障振动信号[26]，试验平台如图5所示，由1.5 kW的电动机(图5左侧)、扭矩传感器(图5中间连接处)、功率测试计(图5右侧)以及电子控制器(图5中未标出)组成。

图5 CWRU滚动轴承试验平台Fig.5 CWRU rolling bearing test device

该试验平台检测了的驱动端轴承(型号为SKF6205)和风扇端轴承3种故障位置，包括内圈损伤、滚动体损伤以及外圈损伤，损伤直径为0.177 8 mm、0.355 6 mm以及0.533 4 mm共计9种故障状态。试验选取了驱动端轴承的内圈故障位置的3种损伤直径的振动信号与正常振动信号作为研究对象，其中测量转速为1 797 r/min，采样频率为12 kHz。以864个采样点作为一个样本长度。为了更大地获取试验样本，以满足深度学习基于庞大数据的要求，试验中采用重叠样本的方式，对数据进行增强处理，以扩大样本的数量[27]，原理如图6所示。即在对振动信号划分样本时，每一段信号与其后的一段信号有一部分是重叠的，这样既保证了对信号的充分利用，也进一步地扩充了样本的数量。原始数据数据采集完成后，构建的数据表，如表2所示。

图6 样本扩充方式Fig.6 Sample expansion mode

表2 试验样本数据表Tab.2 Test sample data sheet

2.2 图像转换

扩充完的样本通过格拉姆角场转换为二维图像，生成图像的像素分辨率设置为100×100。将4种状态的样本分别取一张作为展示，其中左侧为振动信号时域波形图，右侧为转换的二维图像，且对应图像为信号的唯一转化结果，体现了两者之间的双射关系，如图7所示。从图中可以看出每类图片相同位置的颜色深浅以及纹理形状都有着较大的差异，这是因为不同振动信号的幅值在时间上的依赖关系不一样，当轴承存在故障时，测得的振动数据表现出明显的冲击性，而正常轴承的信号就相对随机，只有轻微冲击性，这就导致每类轴承振动信号所转换的图片彼此之间都有较明显的区别，为做图像识别在方法上提供了可能性。

(a)正常

2.3 网络训练

试验模型使用基于python的keras框架，所用计算机的配置为CPU i7-9750H，GTX 1660 Ti，8 GB内存。在投入网络训练前，需对图像数据进行归一化处理，即将所有图像乘以1/255缩放。训练过程中，采用Adam自适应优化器，其学习率设置为0.001，损失函数使用categorical_crossentropy函数，batch_size为40，循环迭代次数为64轮。随着训练迭代次数的增长，模型不断学习，其训练过程如图8所示，为了减少噪声的影响，使图像更具可读性，将每个精度和损失值都替换为指数移动平均值，从而使得曲线变得更为平滑。从图中可以看出，模型训练至20次迭代后，准确率和损失值逐渐趋于平稳，说明模型从训练集中已经学习到较好的规则，并且训练曲线紧紧跟随验证曲线表明模型没有发生过拟合。模型总的训练时间为576.36 s，测试时间为7.53 s。

(a)精度变化

通过对测试集的识别分类，得到的混淆矩阵如图9所示。图中横纵坐标的数字0～3分别表示试验轴承振动信号的类型(正常，内圈轻度损伤，内圈中度损伤，内圈重度损伤)，矩阵的对角线代表着每类状态的识别准确率。从图9可以看出，对于正常状态、内圈损伤轻度损伤状态以及内圈重度损伤状态的轴承，模型完全识别正确，即达到100%的准确率，而对于内圈中度损伤状态的轴承模型也能保证较高的识别准确率，只有极少数样本被误判到内圈重度损伤故障状态。试验的总准确率达到99.63%，表明本方法的可行性。

图9 混淆矩阵Fig.9 Confusion matrix

2.4 与其他图像数据对比分析

文献[28]提出了一种基于连续小波变换与改进生成对抗网络的电机轴承故障诊断方法，该方法通过连续小波变换将电机振动信号转换为小波时频图，将其预处理后作为对抗网络的输入，以完成对电机轴承的故障模式识别。本文将表2的4种工况样本进行连续小波变换得到时频图，并将其压缩至100×100的大小，与格拉姆角场图像保持一致。将4种轴承状态转换的时频图各取一个样本作为展示，如图10所示。

(a)正常

将时频图作为本文模型的输入数据，经过训练后得到测试结果，如表3所示。从表3可以看出，模型对于连续小波变换转换的时频图的识别准确率为98.25%，略低于在格拉姆角场转换图像数据集上取得的准确率。这表明通过格拉姆角场转换的图像包含更丰富的特征知识，对于模型的分类识别具备更优越的效果。

表3 时频图分类结果Tab.3 Time-frequency diagram classification results

2.5 与其他算法对比分析

为验证本文提出模型的有效性，将本文方法与常见的深度学习算法CNN与深度神经网络(deep neural network,DNN)以及支持向量机(support vector machine,SVM)进行对比分析。在试验中，CNN的结构与CNN-BiGRU类似，CNN将CNN-BiGRU的门控循环单元替换为一层全连接层，并在该层使用dropout机制防止过拟合。除此之外，CNN的参数与CNN-BiGRU完全一致。而搭建的DNN网络主要包含两个隐藏层，其神经元个数分别设置为128与64，同时也在每层隐藏层中使用Dropout来防止模型发生过拟合。最后SVM的核函数选用高斯径向基核函数。

每个模型使用相同的图像数据集进行试验，试验的最终结果如图11以及表4所示。从图11可以看出3种深度学习方法的识别准确率都达到96%以上，远远高于SVM的识别准确率。这表明了深度学习方法在故障诊断领域有着极强的识别能力，同时也说明了本文转换得到的图像集的可用性。CNN-BiGRU的准确率比CNN与DNN都有所提高，表明本文提出的方法具有更优越的效果。同时从表中可以看出CNN-BiGRU能够保持较高的诊断率，稳定性更好。相比于CNN，CNN-BiGRU的平均准确率提升了0.4%，且方差更低，说明CNN-BiGRU具备更好的诊断效果。

图11 不同算法的试验结果Fig.11 Test results of different algorithms

表4 不同算法10次试验结果Tab.4 Results of 10 test with different algorithms

为了验证本文提出方法的特征提取能力，利用t-SNE降维技术[29]，将CNN、DNN与本文提出模型的最后一个隐藏层提取到的图像特征进行二维平面可视化，如图12所示。从图12可以看出3种方法对图像数据都有着高效的特征提取性能，代表每种故障类型的故障特征在空间具有明显的可分性。但在空间聚簇性上，CNN-BiGRU明显优于CNN与DNN。比如代表内圈轻度损伤的特征在CNN与DNN的特征空间中分布在了不同的空间位置，而在CNN-BiGRU的特征空间中分布在了相似的空间位置；代表内圈重度损伤的特征也在CNN-BiGRU的特征空间中表现出更密集的聚簇性。这进一步提升了本文提出模型对于滚动轴承故障类别的识别精度。

(a)DNN特征

2.6 不同故障位置试验对比分析

为了更进一步地验证本文提出方法的可行性，试验又选取了测量转速为1 797 r/min，采样频率为12 kHz下的驱动端轴承3种不同故障位置且同一故障程度的振动信号与正常振动信号作为研究对象，如表5所示。

表5 试验样本数据表Tab.5 Test sample data sheet

试验过程中，将使用训练集与验证集训练好后的模型用于测试集进行分类，与其他方法的某一次对比试验结果，如表6所示，从表6可以看出CNN-BiGRU的准确率明显优于CNN与DNN以及SVM，进一步表明本文提出方法的拥有更好的识别稳定性，其对于滚动体损伤状态的轴承模型的识别准确率最低，这也与工程实际情况一致，而其他位置的识别率都能达到100%，测试集最终的识别总准确率达到99.28%。

表6 不同算法的试验结果Tab.6 Test results of different algorithms %

在此基础上，增加滚动轴承的故障类别数目进行测试，选择同等条件下驱动端轴承3种故障位置分别对应的3种损伤直径的振动信号与正常振动信号作为研究对象，将故障类别数目扩充至10类。利用设计的CNN-BiGRU进行分类识别，总的准确率为97.40%，诊断性能较为良好，验证了本文方法的有效性。相信在对模型超参数进行进一步调试后，能够取得更好的效果。

3 结论

为充分利用卷积神经网络在图像分类识别中的优势，本文通过格拉姆角场方法将滚动轴承振动信号转换为二维图像数据，在不丢失原始数据信息的前提下，保留了信号对于时间的依赖性。在此基础上，提出基于CNN-BiGRU网络的分类模型，利用CNN对于图像强大的自动提取特征能力提取关于图像的空间特征，再由BiGRU进一步筛选其时间特征，最终由分类器实现模式识别。试验证明，本文所使用的方法对于滚动轴承不同故障程度以及不同故障位置的振动信号识别都取得了较好的效果，准确率均优于常见的深度学习算法与机器学习算法。通过特征可视化对比分析，本文提出的模型拥有更好特征提取能力，因此其故障识别准确率更高。上述试验与结果表明，本文所提出的方法对于滚动轴承故障模式识别有一定的实用价值，为智能故障诊断提供了一个可行的方案。