APP下载

端对端长短时序特征的轴承故障诊断*

2022-11-09黎红志唐向红陆见光

组合机床与自动化加工技术 2022年10期
关键词:时序轴承准确率

黎红志,唐向红,陆见光,杨 青,何 强

(贵州大学a.现代制造技术教育部重点实验室;b.公共大数据国家重点实验室,贵阳 550025)

0 引言

滚动轴承作为许多机械设备的核心部件,其稳定性是保障设备能够正常工作的关键[1],滚动轴承故障常常是造成设备故障的主要原因之一[2-3],因此准确快速进行滚动轴承故障诊断对降低经济损失有着重要意义[4]。

近年来,基于传感器监控、状态监控和预测方面取得了进展[5],智能故障检测也随着传感器技术的发展备受关注。将机器学习(machine learning,ML)和(deep learning,DL)技术应用于滚动轴承故障诊断的关键问题是开发一种能够在相对较短的时间内获得满意诊断性能的网络结构[6]。为了实现滚动轴承故障检测的ML和DL技术,则需要提取信号的特征用于诊断,以达到更高的精度。其特征可以分为时域和频域[7]。

FERNANDEZ等[8]提出了一种结合了支持向量机(support-vector-machine,SVM)、包络分析和专家系统,该方法实现了轴承故障的早期检测和诊断。然而随着测量技术的快速发展,数据集越来越大,经典的ML算法在基于这些数据集上存在缺陷[9]。因此,深度神经网络(deep neural network,DNN)、卷积神经网络(convolutional neural network,CNN)和循环神经网络(recurrent neural network,RNN)等被应用在轴承故障诊断中[10]。HAN等[11]都提出了基于改进CNN的故障诊断方法,并成功应用于振动信号的无监督学习及故障特征提取,显著提高了轴承与齿轮箱的故障诊断率。然而,以上研究中都忽略了所采集振动信号的长短时序特征。对此,BIE等[12]提出了基于长短期记忆神经网络(long short term memory network,LSTM)的故障诊断方法,有效利用了振动信号的长时序特征,但该方法训练时间太长且忽略了与短时序特征融合。PAN、沈涛等[13-14]提出了不同的CNN+LSTM轴承故障诊断方法,把短时序特征和长时序特征都合理利用并融合了长短时序特征,提高了模型的精度和稳定性。但LSTM的时间复杂度问题导致其训练时间长,且以上研究中都对原始振动信号进行了预处理,未实现故障的端对端诊断。端对端的故障诊断方法,为实现时时故障诊断提供了可靠性,并且降低了计算成本。虽然KHORRAM等[15]提出了一种端对端的CNN+LSTM故障诊断方法,但仍然没有解决LSTM运行时间较长的问题。

针对以上问题,本文提出一种将CNN与门控循环单元(gated recurrent unit,GRU)结合的模型。该方法能在减少诊断时长的前提下充分利用原始振动信号长短时序特征的融合,并最终实现端对端的滚动轴承故障诊断。

1 相关理论

1.1 卷积神经网络CNN

卷积神经网络CNN是一种前馈神经网络,区别于其他神经网络模型,卷积运算操作赋予了CNN处理复杂图像的特殊能力。CNN神经元之间采用局部连接和权值共享的连接方式,典型的CNN由3个主要部分构成:卷积层、池化层、全连接层。卷积层负责提取图像中的局部特征,其卷积过程表达式如下:

(1)

池化层对输入的特征图进行压缩,一方面使特征图变小,简化网络计算复杂度,另一方面进行特征压缩,提取主要特征,分为最大池化和平均池化。

全连接层在整个CNN中起到“分类器”的作用,负责把所有局部特征结合变成全局特征,用来计算最后每一类的得分并输出分类结果[16],在输出层用Softmax函数输出各分类的概率,表达式为:

(2)

式中,p(yi)为分类的概率值;yi为前向传播的输出。

1.2 门控循环单元GRU神经网络

门控循环单元GRU神经网络来源于长短期记忆LSTM神经网络,长短期记忆LSTM是一种特殊的RNN,主要解决了长序列训练过程中梯度消失和梯度爆炸的问题。简单来说,就是相比普通的RNN,LSTM能够在更长的序列中有更好的表现。

但由于LSTM引入了很多内容,导致参数变多,也使得训练难度增大了很多,因此,KYUNGHYUN等[17]提出了GRU神经网络。GRU是LSTM神经网络的一种变体,为了克服RNN无法很好处理远距离依赖而提出了LSTM。GRU保持了LSTM效果的同时又使结构更加简单,两者的内部结构分别如图1和图2所示。

图1 LSTM内部结构 图2 GRU内部结构

记忆体表达式:

(3)

候选隐藏层表达式:

(4)

更新门表达式:

zt=σ(Wz*[ht-1,xt])

(5)

重置门表达式:

rt=σ(Wr*[ht-1,xt])

(6)

式中,W、Wz和Wr为待训练参数矩阵;tanh为激活函数,表达式为:

(7)

σ是Sigmoid激活函数,其表达式为:

(8)

它可以使门限的范围在0~1之间。

2 端对端长短时序特征的轴承故障诊断方法

本文提出的LSS(long and short time series features)模型网络,模型成分主要分为一维卷积层CNN、池化层、GRU层以及分类输出部分,损失函数采用分类交叉熵函数,梯度下降采用Adam优化器,卷积层采用全零填充,池化层采用最大池化函数,模型图如图3所示。

图3 LSS模型结构

具体算法流程步骤如下:

步骤1:将原始振动信号直接输入模型,采用一维卷积进行特征提取,为了降低特征复杂度以及维度,采用池化层采用最大池化进行处理;重复过程3次,这一操作降低了输入GRU部分数据的复杂度,既可以加快GRU网络处理信号的速度,同时也避免了Flatten操作,尽可能保留了输入数据的长时序特征,确保了模型精度。

步骤2:GRU层网络结构,通过更新门、输出门的选择过滤更新操作进一步对特征进行提取,主要提取长时序特征。

步骤3:最后利用全连接层把各层提取的长短时序特征融合,并用Sigmoid函数和Softmax函数分类输出故障的分类结果。

步骤4:算法流程步骤如图4所示。

图4 算法流程

3 实验及结果分析

3.1 数据准备

为了验证本文所提到方法的有效性,实验数据采用CUT-2轴承实验平台采集振动信号,实验平台如图5所示。本实验采用的轴承型号为6900ZZ,其故障采用人工干预的方法,即通过电火花加工技术分别在滚动轴承的内圈、外圈、球体上进行点蚀,形成直径为0.2 mm和0.3 mm的故障,如图6所示。使用加速度传感器采集轴承振动信号,采样频率2 kHz,轴承转速1500 r/min。

图5 CUT-2轴承实验平台

图6 轴承故障位置

此次实验的数据集分为10种轴承状态,其中9种故障状态,1种正常轴承状态,分别给样本标签赋值0-9,详细信息如表1所示。每类故障采集500个样本,样本长度为1024,按照4:1:1的比例把数据集分割为训练集、验证集、测试集。

表1 CUT-2平台数据集组成

3.2 实验参数设置

经过多次实验测试,最终确定LSS模型的参数设置如表2所示。

表2 LSS模型参数设置

3.3 实验结果对比与分析

本次实验硬件环境:Windows10 64位操作系统,NVDIA GeForce RTX2060 GPU,内存16 G。软件环境:anaconda,pycharm2021.1版本,Tensorflow2.1框架。

(1)不同的激活函数对模型的识别存在一定的影响,常用的3个激活函数都有各自特点,为了选择最佳的激活函数,本文对Sigmoid、tanh、Relu这3个常用的激活函数分别进行了5组实验,结果如表3所示。

表3 不同激活函数对识别率的影响

可以看出,Sigmoid激活函数的平均准确率最高,平均测试时间与最少的Relu激活函数的平均测试时间相差甚小,平均损失函数都与最低的tanh激活函数的平均损失函数相差也甚小,在准确率优先的前提下,所以选取Sigmoid激活函数作为模型的激活函数。

(2)考虑到不同的批处理样本数对识别率的影响,以及GPU对2的幂次的batch可以发挥更佳的性能,为了选择最佳的批处理样本数,所以本文对16、32、64、128-50、128-100、256-50、256-100分别进行了5组实验,由于随着批处理样本数的增加,会出现欠拟合现象,所以,16、32、64的epochs(迭代次数)设置为25,128、256分别对epochs为50、100进行了实验,计算实验的平均值。为了更直观看到对比结果,绘制如图7的统计图。

图7 不同批处理样本数对识别率的影响

可以看出,批处理样本数为32时,平均准确率为0.999 6,为实验最高,且损失值为实验最低,所以本文选取32为批处理样本数。

(3)为了直观展示本文所提出方法对故障的诊断分类效果,验证其收敛性、稳定性和准确性,本文对准确率和损失值随迭代次数以及精确率、召回率、F1-Score三个方面的数值进行分析,结果如表4、图8、图9所示。

表4 LSS模型三指标

由表4可知,本文所提方法对正常状态和7种故障状态的诊断精确率、召回率、F1-score均为1,即除个别故障类别外,其余故障识别精度均可达到100%。

图8 LSS训练测试准确率 图9 LSS训练测试损失值

由图8、图9可知,本文所提方法前期收敛快,整个过程波动小,在迭代30次左右模型诊断效果基本趋于稳定,且对各故障的诊断都能达到较高的效果。

(4)为了分析本文方法在提取并利用长短时序特征融合上的效果,将忽略长时序特征的模型与LSS进行实验对比,引入混淆矩阵进行一个直观的可视化展示,如图10、图11所示。

图10 忽略长时序特征的混淆矩阵 图11 LSS混淆矩阵

可以看出,利用GRU层提取长时序特征并与短时序特征融合,模型的准确率有所提升;除个别故障外,其余识别准确率都为100%。所以,本文所提方法模型能有效利用不同层的长短时序特征交互加强实现端对端的滚动轴承故障诊断识别。

(5)为更好验证本文所提到方法在不同迭代次数下的有效性以及优越性,将其与不同模型进行了对比,每种网络都重复实验10次,其中设置迭代次数(epochs)为25次时实验5次,设置迭代次数为100次时实验5次,其余参数均与本文方法相同。各模型的对比结果如表5、表6所示。

表6 不同模型对比结果(epochs=100)

可以看出,epochs=100时的准确率有所上升,又因为单独的GRU模型效果很差,训练时间过于长,所以为了更直观对比,选取epochs=100的平均实验结果,并剔除GRU模型,如图12所示统计图。

图12 不同模型对比结果(epochs=100)

从图12结果可以看出本文所提出的方法对故障的识别平均准确率达到了0.999 2,且平均损失值最小,平均训练时间与准确率较高的CNN+LSTM、ResNet模型相比最快,这是因为GRU是LSTM的改进,在训练过程中需要调整的参数量少,从而降低了时间复杂度;ResNet有18层网络结构,所以平均训练时间较长。

(6)为了验证该模型的泛化性和鲁棒性,在所有参数不变的情况下,对凯斯西储大学(case western reserve university,CWRU)的公开滚动轴承数据进行实验,实验轴承为6205-2RS JEM SKF的深沟球轴承,安装在电机壳体的驱动端支撑电机轴,电机负载约为1 hp,轴承转速为 1772 r/min。使用电火花加工技术在实验轴承的内圈、滚动体、外圈上布置单点故障,故障直径分别为 0.007 in、0.014 in和 0.021 in,其中轴承外圈故障位置为6点钟方向,采样频率为12 kHz。

以同样的参数制作数据集,具体的实验样本信息如表7所示。实验结果如图13、图14所示。

表7 CWRU数据集组成

(a) CWRU数据测试准确率 (b) CWRU数据测试损失值

图14 CWRU数据混淆矩阵

从图13、图14可看出,除个别故障外,其余故障识别精度均可达到100%。所以本文所提方法同样能对凯斯西储大学的数据进行准确的故障诊断,证明该方法具有良好的泛化性。

4 结论

针对现有滚动轴承故障诊断中的突出问题,本文提出了一种端对端长短时许特征的轴承故障诊断方法,其有效性在两个实验平台上得到了充分验证,主要优势有以下几点:

(1)有效利用了CNN高效快速的特征提取能力和数据降维能力,弥补了GRU运行时间长的劣势;

(2)利用最大池化层来替代Flatten层,避免了长时序特征的割裂,为GRU层提取长时序特征提供了可行性;

(3)考虑到GRU的在时间复杂度和空间复杂度上的优势,所以用GRU来提取长时序特征,能更快做到滚动轴承故障诊断;

(4)实验是直接将原始振动信号输入模型进行故障诊断,所以该方法具有端对端的滚动轴承故障诊断能力。

然而,该模型作为CNN-RNN的改进,有着RNN结构本身的一大弊端,即不可并行计算,这在数据量和模型体量逐步增大的未来,需要考虑到模型的泛用性,未来工作也将从小样本提高模型准确率以及大样本提高诊断速度的角度去研究。

猜你喜欢

时序轴承准确率
顾及多种弛豫模型的GNSS坐标时序分析软件GTSA
异步立式感应电机轴承系统设计
清明
基于GEE平台与Sentinel-NDVI时序数据江汉平原种植模式提取
无轴承电机的结构设计
泵用电机水润滑轴承选择与应用
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
你不能把整个春天都搬到冬天来