基于CNN-ETR的滚动轴承故障诊断研究

2021-07-13陈功胜唐向红1b陆见光1b杨瑞恒

兵器装备工程学报 2021年6期

陈功胜，唐向红，1b，2，陆见光，1b，2，杨瑞恒

(1.贵州大学 a.现代制造技术教育部重点实验室; b.机械工程学院，贵阳 550025； 2.贵州省公共大数据重点实验室，贵阳 550025)

滚动轴承在机械设备中占据着举足轻重的地位，通常也是机械设备中最容易出现故障的部分[1]，据机械故障统计，旋转机械中的滚动轴承故障比例占据了机械故障的40%[2-3]。因此，开展轴承故障诊断研究具有重要意义。

传统故障诊断方法是提取传感器采集原始振动信号中的有用特征，常用的方法有：短时傅里叶变换(STFT)[4]，包络分析(EA)[5]，小波变换(WT)[6]等。传统的方法是基于理论出发对问题进行分析，虽然在原理上具备可解释性，但诊断精度低。随着“互联网+智能制造”的快速发展，以数据驱动的机器学习方法逐渐应用到故障诊断中。如SVM[7]，朴素贝叶斯[8]，K最近邻[9]等，与传统信号处理方法不同，这些算法在诊断精度及直观性方面都有较大的提升，但也需要更高的计算能力。这类方法在很大程度上取决于人工特征提取的质量，这就依赖于专家经验和先验知识[10]。

因此，为了克服这一问题，实现特征自提取。近些年，一些学者将深度学习技术应用到故障诊断领域的研究，如深度置信网络(DBN)、深度自动编码器(DAE)[16]、卷积神经网络(CNN)等。其中CNN在轴承故障诊断中的应用最为广泛。文献[11-13]中提出将一维卷积神经网络应用于滚动轴承自适应故障诊断方法。这些研究虽然省去人工提取特征的工作，但基于一维时序信号的处理方法仍存在着丢失特征的缺陷，而将原始时序信号转变为灰度图像信号后进行特征提取会很大程度上改进这个问题[14]。文献[15]中以滚动轴承时频图像作为研究对象输送至ResNet进行分类，实验证明了该方法的有效性。文献[16]中提出一种将振动信号进行灰度转换，然后输入卷积神经网络进行分类，从而实现了对航空故障中介轴承的快速分类的方法。WAN等[17]提出了将深度自动编码器与卷积神经网络相结合的方法，先利用小波变换构造不同状态下的时频图，再采用卷积神经网络对DCAE降噪后的时频图进行故障分类，实验结果验证了该方法可在高噪声情况下具备更高的识别率。上述研究表明，首先将时域信号转为图像形式，然后输入卷积神经网络进行特征提取与分类，同样能取得出色的分类效果。结合CNN的结构特点，其自带的softmax分类器存在着易陷入局部最优的缺陷[18]。由于极限树回归计算分裂的方式具有随机性，选取完全随机所得到最优分叉值，这就有效避免了softmax分类的不足。针对该问题，本文提出一种二维卷积神经网络与极限树回归相结合的自适应轴承故障诊断方法。在此基础上增加随机搜索算法，相较于网格搜索，可快速地检索到该模型较优参数组合。最后将CNN-ETR算法与传统的DT、CNN、CNN-DT算法进行比较，验证了CNN-ETR模型对轴承故障具有很好的分类能力。

1 CNN-ETR算法

1.1 卷积神经网络

CNN具有自动提取复杂的非平稳振动信号特征的强大能力。通常CNN包括若干卷积层、池化层、一个全连接层和一个输出分类器。图1为卷积神经网络基础架构。

图1 卷积神经网络基本结构示意图

根据上述结构，CNN的处理流程如下，无论输入是图像还是数据集都将转换为数组，并将其传递到输入层。然后由卷积层创建的卷积核在前一层的矩阵上进行卷积操作，获得低级特征子图。为了增强神经网络模型的表达能力，引入ReLU让卷积神经网络具有非线性输出的能力。

(1)

(2)

在经过重复的卷积和池化操作后，高级特征矩阵会进一步映射为一维向量。最后，通过softmax分类器对运行状态进行分类。若为N种输入信号，类别标签设为i所对应输出yi概率为：

(3)

其中：wi表示由第i个输出神经元连接的权重矩阵；bi是偏置；而x表示softmax层的输入。

1.2 极限树回归

极限树回归作为集成分类模型的一种，当特征属性以类别为标准时，随机选择具有类别的样本作为左分支，其他类别样本作为右分支，可以应用基尼系数进行分类

(4)

其中：m为数据集中样本类型的数量；Pi是第i类样本的占比。当特征属性以特征值为标准时，利用与特征值比较大小将样本分类，可以应用均方误差进行分类

(5)

1.3 随机搜索

为了提高该算法的准确性，除了将本文模型设计不要过于复杂的同时，仍需对极限树回归中的超参数(评估器、最大深度及学习率等值)的选优。由于集成模型的超参数个数较多，如果使用网格搜索，那么搜索所需时间会将呈指数级增长，而随机搜索会在超参数空间内随机搜寻数十或上百个点，可快速的检索到较优的参数组合，这种做法比网格搜索要快很多，因此本文选用随机搜索算法。

2 CNN-ERT诊断流程

CNN-ETR模型主要包括两部分：训练CNN模型用来提取故障轴承特征；然后将CNN全连接层的128维特征向量输入极限树回归中进行训练及测试，从而诊断出轴承故障。此外，为了进一步提高该模型的诊断精度，采用随机搜索匹配适用模型的较优参数组合。CNN-ERT诊断流程如图2所示。

图2 CNN-ETR诊断流程框图

3 实验

3.1 实验数据

本研究采用了CUT-2实验平台(见图3)进行数据采集，测试轴承放置在试验台的右端。实验轴承型号为6900ZZ，使用电火花加工技术在轴承内圈、外圈及滚动体上分别布置直径为0.2 mm与0.3 mm的故障(见图4)。轴承故障如图所示，在电机转速为1 500 r/min，采样频率为2K时，选取10种故障类型，每类故障类型包含330个样本，每个样本包含512个数据点(见表1)。样本按照随机75%的训练集和25%的测试集进行划分并用于训练及测试。本次实验在电脑Win10×64位操作系统，处理器为：Inter(R)Core(TM):i5-6500CPU@3.20GHz，RAM：8GB的配置环境下进行的。

图3 CUT-2轴承实验平台

表1 CUT-2实验数据

3.2 确定实验参数

3.2.1激活函数的选择

本次实验选择最常用的Sigmoid、Tanh、ReLU及PReLU四类激活函数进行了比较，为了避免实验结果出现偶然性，采用了10次交叉验证方法，从表2中可以看出，在同等条件下，选用ReLU激活函数能达到最佳实验精度。

表2 不同激活函数性能表

3.2.2优化器的选择

本次实验选用较为常用的Adam、SGD、RMSprop三类优化器，且分别在学习率为0.000 1、0.001、0.005、0.01、0.05五种情况下测试出每种分类器的性能。

如图5所示，Adam优化器在学习率为0.005时取得了最佳分类效果，此外，该优化器在设定区间内(0.000 1～0.05)稳定性最好，因此本次实验选取学习率为0.005的 Adam 优化器。

图5 不同优化器及学习率直方图

3.2.3批处理样本数目

批处理样本数目指模型每轮更新参数所需训练的样本数量。若批样本处理数目选择较少，即会增加模型陷入局部最优的风险和模型训练时间；若批样本处理数目选择较少，则无法保证模型参数的最佳优化方向[11]。本研究在选取ReLU激活函数，选取Adam优化器及学习率为0.005的条件下测试不同大小的批量训练数据对模型的性能影响。数据大小分别取8、16、32、64、128，实验结果如表3所示，当批量训练数据大小为64时，该模型在测试集上取得最佳的分类表现。因此选取批量训练数据大小为64。

表3 块大小取得的准确率

根据上述的参数选择，CNN-ETR模型最终确定的模型参数如表4所示。

表4 CNN-ETR模型参数

4 实验结果与分析

4.1 实验结果

为了展示该模型对不同类型故障的提取能力，使用t_SNE技术分别提取不同层的特征映射成二维并进行可视化。具体效果如图6所示。图6(a)为输入原始信号样本的分类结果，可以看出信号之间具有亢余性，导致各类别难以区分。在经过多次的卷积池化操作后，图6(b)展示全连接层的特征提取结果，除第六类样本中少量样本被误分在第五类，及第一类样本中少量样本被误分入第四类中，其余类别的样本均能很好的聚拢在相应区域内。

图6 不同层级的特征可视化效果图

在上述的基础上，更为直观地考察CNN-ETR模型在识别故障轴承的能力及具体细节，本文引入混淆矩阵对诊断结果进行量化分析，在图7中，可以清楚的观察到该模型对每类轴承诊断情况。从总体上来看，该模型准确率平均维持在99%以上，近一半类别故障轴承诊断精度甚至达到了100%，证明了该模型在故障轴承的类别诊断方面具有出色的表现。

图7 多分类混淆矩阵元素图

4.2 泛化能力实验

考虑到在实际工程应用中，滚动轴承发生故障的方式多样化，因此本文对CNN-ETR模型的泛化能力进行了实验，以验证不同故障占比率对该模型精度的影响。在总样本容量保持不变的基础上，分别对故障占比率处于70%～94%的数据进行测试。实验结果如图8所示，可以看出仅故障占比率在76%及82%时，对应的故障识别率略低于99%，分别为98.94%、98.95%，其余测试结果均稳定在99%及以上。证明了该模型具有较好的鲁棒性，对轴承运转状态监测有着重要意义。

图8 故障占比率对算法精度的影响曲线

4.3 对比实验结果与分析

由于极限树回归由多个决策树组成，为了验证CNN-ETR算法的有效性，本文选取DT、CNN、CNN-DT算法分别进行了对比实验。并将所有实验的准确率、精确率、召回率及F1指标进行了绘制。在决策树模型中，在对数据进行标准化后，选取C4.5生成树算法使用熵，其他参数默认初始化配置。为了增加实验可信度，每种模型取20次重复性试验的平均值。所得结果如图9所示。

图9 对比算法有效性的直方图

从上述可以看出，使用DT模型分类时，准确率、精确率、召回率及F1指标均为最低，这是因为DT模型对有时间序列的数据并不敏感，此外当其在某一节点发生分类错误时，那错误会沿着该节点一直延伸下去。在使用ETR进行分类时，可以看出该模型在组合了大量决策树的基础上，其分类能力有了明显的提升，但依旧在很大程度上取决于人工提取特征的质量。值得关注的是，借助卷积神经网络强大的特征自提取能力，CNN的故障诊断准确率为90.2%，而CNN-DT的故障诊断准确率达到了95.7%，相比于卷积神经网络的训练结果有了较大的改进。CNN-ETR采用了随机搜索算法，可快速搜索极限树回归模型中较优的参数组合，并利用该模型实现快速分类，该算法的故障轴承诊断准确率达到了99.6%，比CNN-DT算法还要高出3.9%，由此从四项分类指标中验证了CNN-ETR模型的有效性。