APP下载

双通道特征融合CNN-GRU齿轮箱故障诊断

2021-10-18甄灿壮易剑昱蔡秉桓徐天鹏尹文豪

振动与冲击 2021年19期
关键词:双通道训练样本齿轮箱

张 龙, 甄灿壮, 易剑昱, 蔡秉桓, 徐天鹏, 尹文豪

(华东交通大学 机电与车辆工程学院,南昌 330013)

齿轮箱主要由齿轮、轴承和轴组成,是机械传动系统中关键的部件。由于齿轮箱结构复杂,工作环境恶劣,齿轮箱中的齿轮和轴承经常发生故障,发现不及时可能造成不可估量的损失。因此对其进行状态监测和故障诊断显得重要。

传统的故障诊断方法通常包括特征提取、特征选择和故障分类3个步骤[1]。其中特征提取是关键的步骤,它直接影响着故障分类的好坏。传统的特征提取方法包括时域、频域、时频域3种提取方法。均值、方差、峭度等是常见的时域特征;包络谱、频谱等是常见的频特征;经验模态分解[2]、小波变换[3]、短时傅里叶变换[4]、变分模态分解[5]等是常见的时频域特征。但上述这些方法存在着依赖人工提取特征的缺点,其提取的特征往往只对特定的数据有效,模型的鲁棒性和推广性较差。

近年来,深度学习[6]被众多学者应用到齿轮或轴承的故障诊断中,利用其多个非线性映射级的网络模型,对输入的振动信号进行逐层提取特征,能够自适应挖掘出数据之间内在的联系,摆脱了人工提取特征的的依赖,克服了传统特征提取方法的固有缺陷,在故障诊断上的应用越来越广泛。卷积神经网络(convolutional neural network,CNN)是常用的深度学习方法,它是一种典型的多层前馈神经网络,端对端的算法结构使整个过程无需人工提取特征。Janssens等[7]利用卷积神经对滚动轴承进行故障诊断,试验结果表明要优于人工提取特征和随机森林分类器。朱丹宸等[8]利用多个传感器测的一维信号 转化为二维灰度图像作为卷积神经网络的输入,试验结果表明相对于传统的支持向量机和PNN(probabilistic neural network)方法有更高的识别率。Eren[9]建立了适应于轴承振动信号的一维卷积神经网络,这种端到端的处理方式在保证故障检测精度不受影响的情况下,尽可能简化了数据预处理,提高了诊断效率。上述研究中都属于用CNN去挖掘数据的特征,由于CNN的原理启发于生物的感受野,因此善于挖掘数据空间上的局部重要的信息特征。然而振动信号是时序的,在时间维度上也蕴含着丰富的信息。循环神经网路(recurrent neural network, RNN)善于处理时序数据问题。RNN种类很多,目前应用最广泛是Hochreiter等[10]提出的长短时记忆网络(long short term memory network, LSTM),是一种改进之后的循环神经网络。其在网络结构上和RNN明显的不同点在于:隐含层节点的输入包含了该隐含层节点在前一个时刻的输出,这也是擅长处理序列数据的根本原因。Li等[11]提出了一种基于离散小波变换(discrete wavelet transformation,DWT)和LSTM的分类方法,通过DWT提取轴承的故障特征,LSTM进行分类,取得不错的诊断效果。Hinchi等[12]利用LSTM建立滚动轴承剩余使用寿命模型,该模型很好地反映滚动轴承退化趋势。但LSTM相对于RNN结构更加复杂,参数量更多,导致训练难度和训练时间增加,同时也会消耗更多的内存资源。而门控递归单元(gate recurrent unit,GRU)属于LSTM的变种,在网络的的表达能力和LSTM几乎一样出色。但相对于LSTM结构更加简洁,参数量更少。

基于上述原因,将CNN的空间处理能力和GRU时序处理能力的优势结合,提出一种双通道特征融合CNN-GRU齿轮箱故障诊断方法。即采用并列式结构令CNN与GRU双通道同时提取齿轮箱原始振动信号的故障特征,然后将双通道提取的特征向量合并成一个融合特征向量,输入到SoftMax进行故障分类。用齿轮实测数据和西储大学轴承数据进行验证,试验结果表明,本文所提方法具有较高的识别准确率,具有实用性和可行性。

1 理论基础

1.1 卷积神经网络(CNN)

CNN是一种典型的多层前馈神经网络[13-14],其网络一般由滤波级与分类级两部分组成,其中滤波级包含卷积层、池化层与激活层3个部分。分类级包含全连接层,其作用是将滤波级提取到的特征进行降维、融合、分类等操作。

卷积层通过卷积核对信号进行卷积操作,卷积结果为信号的特征图,卷积层有3个超参数,分别为卷积核的大小、步长和填充,输出特征图的尺寸与这3个超参数有关。其输出特征图尺寸O计算公式为

(1)

式中:I为输入对象的尺寸;K为卷积核的尺寸;S为步长;P为填充,若O为小数一般向下取整。

卷积运算可表达式为

(2)

图1 一维卷积过程

池化层又称下采样层,作用对象为卷积层提取的特征图,对特征图进行降采样,且不受反向传播修改。最大池化公式可表示为

(3)

式中:al(i,t)为第l层中的第i个特征图第t个激活值;c为池化宽度。

激活层是指通过非线性激活函数将线性模型转化成非线性模型,使神经网络可更好的解决线性不可分问题。Relu为目前CNN最流行的激活,其函数表达式为

f(x)=max(x,0)

(4)

当x>0时,梯度恒为1,不存在饱和问题,克服了梯度消失,加快了收敛速度;当x<0时,为硬饱和区,输出值为0,提高了网络的稀疏性与泛化性能。

全连接层的目的是把连接层中的每一个节点都与上一层的所有结点相连,通过这种方式将滤波级提取的特征进行分类,其本质其实就是一个BP(back propagation)神经网络。全连接层的正向传播公式为

(5)

1.2 门控递归单元(GRU)

RNN是专门用于处理时间序列数据的人工神经网络。LSTM是RNN的一种改进网络,通过引入额外的门控制正向和反向信息的传播,解决了RNN梯度消失的缺陷[15]。而GRU结构简洁,参数量较少,所以本文选用GRU作为研究对象。

在结构上,LSTM通过遗忘门、输入门、输出门3个门来控制隐含层的输入、输出与状态信息,而GRU只有两个门:更新门与重置门。GRU内部结构示意图,如图2所示。rt与zt和分别代表更新门和重置门,门控状态与LSTM一样都是通过前一刻的状态信息ht-1和当前时刻的输入xt来获取的,阈值区间为(0,1)。

图2 GRU内部结构示意图

GRU单个隐含层前向传播过程如下。

(1) 更新门zt。更新门作用上一时刻的隐含层的输出ht-1与当前时刻t的输入样本xt,其逻辑值为门控状态。

zt=σ(Wxzxt+Whzht-1+bz)

(6)

(2) 重置门rt。同理,重置门作用上一时刻的隐含层的输出ht-1与当前时刻t的输入样本xt,其逻辑为门控制状态。

rt=σ(Wxrxt+Whrht-1+br)

(7)

(8)

(4) 当前隐含层的输出。是通过更新门控制输出的,更新门可以进行遗忘和选择记忆两个操作,遗忘操作作用的对象是上个时刻隐含层的输出,其操作表达式为:选择记忆操作作用的对象是当前时刻节点即时信息其操作表达式为

(9)

2 双通道特征融合CNN-GRU模型结构

双通道特征融合CNN-GRU齿轮箱故障诊断方法模型,如图3所示。该模型分为3个部分:上通道层、下通道层与识别层。上通道为CNN通道,CNN上通道包含两个卷积层、两个池化层、一个Flatten层和一个隐含层a。下通道为GRU通道,下通道由GRU单元和一个隐含层组成b。识别层包含特征融合层与Softmax分类层。上下通道的输入都为齿轮箱原始振动信号,CNN上通道通过逐层的卷积挖掘振动信号在空间维度上的信息特征,而GRU下通道通过更新门和重置门挖掘振动信号在时间维度上的信息特征,融合层将振动信号空间与时间维度上的信息特征进行融合,Softmax层对融合特征进行归类。

图3 双通道特征融合CNN-GRU齿轮箱故障诊断结构图

3 试验数据介绍与分析

3.1 齿轮试验数据介绍

本齿轮箱故障数据来自于浙江大学[16-17],图4所示为一个齿轮箱故障试验台。可以模拟齿轮箱的不同的健康状况。该试验台主要由交流电机、联轴器和两级齿轮箱组成。电机的驱动功率为0.75 kW,通过变频器可控制其转速,最大转速可达3 000 r/min。联轴器用于连接交流电机与齿轮箱的输入端。齿轮箱内部输入级、中间级、输出级齿轮的各齿数分别为32,64,96,所有轴承均为SKF 606-2RSH型深沟球轴承且在本实验无故障发生,而齿轮则可能出现缺齿、断齿、齿根裂纹和齿面胶合剥落4种故障类型。如表1所示。本试验通过3个齿轮与其4种故障类型的组合模拟了齿轮箱的10种多故障状态,并依次编号1~10。

图4 齿轮箱故障试验台

表1 故障类型

3.2 数据处理与分析

已知齿轮箱共有10种故障类型,每种故障类型共采集了768 000个点,于是将每种故障数据结构转变成375×4×512的三维形式。每种故障类型样本总数为375,单个样本的结构为4×512,4对应的是GRU下通道GRU单元个数,512为每个GRU单元的输入,通过该处理就建立样本数据的内在联系。针对于CNN上通道样本集,将每种故障数据结构转变成375×2 048的二维形式。样本标签采用独热编码,故每种故障类型的样本标签结构为375×10。随机从每种故障类型中选取336个样本作为训练样本集,15个作为验证样本集,余下24个作为测试样本集,因此CNN上通道每种故障类型的训练样本集结构为336×2 048,验证样本集为15×2 048,测试样本集结构为24×2 048;GRU下通道每种故障类型的训练样本集结构为336×4×512,验证样本集为15×4×512,测试样本集结构为24×4×512;对应的每种故障类型的训练样本集标签为336×10,验证样本集标签为15×10,测试样本集标签为24×10,表2为模型结构网络参数。

表2 双通道特征融合CNN-GRU模型结构网络参数

4 试验结果分析

训练时单次训练迭代大小、批大小、Adam算法学习率分别为30,200,0.001。程序首次运行时,训练样本与验证样本的损失与准确度随着单次训练迭代变化曲线,如图5和图6所示。

图5 训练样本与验证样本损失的变化

图6 训练样本与验证样本的变化

首先观察训练样本与验证样本的损失随着Epochs的变化情况,训练样本与验证样本两者损失曲线在前10个单次训练迭代曲线斜率绝对值大且十分光滑,且基本保持了水平同步变化,这表明模型正在迅速收敛;在第10~第25个单次训练迭代区间,训练样本与验证样本两者损失曲线斜率绝对值逐渐减小,向0趋近,两者损失值在经历了15个单次训练迭代从0.025附近下降到约0.010,表明模型在进一步的学习且将要完成收敛;训练样本与验证样本两者损失曲线在最后5个单次训练迭代基本重合,曲线斜率绝对值无限接近0,损失值不再发生变化,表明模型已完成训练且收敛成功。

观察模型训练样本与验证样本准确度随着单次训练迭代变化情况。从整体上看,除前5个单次训练迭代之外,训练样本与验证样本准确度变化曲线十分光滑,不存在波动的折线,表明模型稳定性较高。

测试样本的分类结果如图7所示。针对浙江大学齿轮箱数据,程序首次运行时双通道特征融合CNN-GRU模型在240个测试样本识别准确率达到了100%。为了避免偶然性结果,对程序进行多次运行,取多次运行的平均结果作为模型的最终准确率。10次运行结果为3次100%、6次99.6%、1次为99.2%,计算其均值为99.7%,最终双通道特征融合CNN-GRU齿轮箱故障诊断模型在240个测试样本的诊断准确率为99.7%,平均误判样本个数0.72个,如表3所示。

图7 测试样本分类结果

表3 双通道特征融合CNN-GRU模型10次运行结果

为了验证本方法的优越性,采用一维卷积神经网络、BP神经网络、支持向量机、随机森林4种模型进行对比验证,最终诊断结果对比如表4所示。从表4可知,本文提出的双通道融合CNN-GRU故障诊断模型以99.7%的准确率优于BP神经网络、支持向量机、随机森林、一维卷积神经网络4种故障诊断模型。

表4 5种分类模型准确率

5 轴承数据分析

为了进一步验证本方法的优越性及鲁棒性。采用凯斯西储大学数据进行分析。图8为数据来源的试验台,该试验装置由一台功率为1.5 kW三相电机,一个扭矩传感和一台测功机组成,选用型号为SKF 6205-2RSJEM深沟球轴承作为待测轴承。为了模拟不同类型的故障数据,利用电火花技术在轴承的内圈、滚动体、外圈上加工出直径为0.177 8 mm,0.355 6 mm和0.533 4 mm不同程度的缺口,人为的植入内圈、滚动体和外圈故障。加速度传感器分别装在试验台电机端、风扇端及支撑座上,用于采集轴承振动信号,采样频率设置为12 000 Hz。

图8 试验台照片

本次验证分析试验预设的训练、验证和测试数据样本的数量和大小与齿轮箱的数据集保持一致,由于原始故障数据的点数不够支撑数据集的建立,例如内圈轻度故障数据的点数为121 991,远远小768 000(375×2 048),于是采用重叠取样的办法对原始故障数据进行增强,扩展样本数。图9为重叠采样处理过程,即从原始故障数据的第一个点开始,向右采集2 048个点后右平移50个单位,然后再向右采集2 048个点,重复此过程,直到满足样本数。表5为选取的轴承故障类型及数据集。

表5 轴承故障类型及数据集

图9 重叠取样

5.1 试验结果分析

将凯斯西储大学轴承数据样本集导入到模型中,训练时单次训练迭代大小、批大小、Adam算法学习率分别为15,200,0.001。程序首次运行时,训练样本与验证样本的损失准确度随着单次训练迭代变化曲线,如图10和图11所示。

图10 训练样本与验证样本Loss的变化

图11 训练样本与验证样本的精度变化

训练样本与验证样本损失曲线十分光滑,模型稳定性高。在前8个单次训练迭代两者损失值迅速下降,模型快速拟合。第8个单次训练迭代后两损失曲线重合,曲线缓慢下降,斜率绝对值最终接近0,模型完成收敛;训练样本与验证样本准确度曲线在前6个单次训练迭代迅速上升,准确度值接近1.0。在第8个单次训练迭代后准确度曲线重合,斜率为0,值达到最大1.0。因此程序首次运行时,本章所提出的模型对凯斯西储大学轴承数据240个测试样本的识别准确率为100%,程序首次运行时最终的分类结果,如图12所示。

图12 测试样本分类结果

程序运行10次的结果如表6所示。其平均准确率达到了100%,因此,针对凯斯西储大学轴承数据,本文所提方法达到了100%,具有较好的鲁棒性及实用性。

表6 10次运行结果

6 结 论

(1) 采用并列式结构,提出了一种双通特征融合CNN-GRU齿轮箱故障诊断模型。该模型CNN上通道负责挖掘原始振动信号在空间维度上蕴含的信息特征,而GRU下通道负责挖掘原始振动信号在时间维度上蕴含的信息特征,将上下通道提取的信息特征融合成一个特征向量,输入到Softmax层从而实现故障分类。

(2) 针对浙江大学齿轮箱数据,该模型在240个测试样本中10次平均结果达到了99.7%的故障识别准确率优于BP神经网络、支持向量机、随机森林、一维卷积神经网络4种故障诊断模型。

(3) 为进一步测试本方法的鲁棒性及应用性,选用凯斯西储大学轴承数据对模型进行分析。针对该轴承数据,本章所提模型以100%的识别准确率验证了本文方法的优越性及鲁棒性。

猜你喜欢

双通道训练样本齿轮箱
单侧双通道内镜下腰椎融合术研究进展
风电齿轮箱轴承用钢100CrMnSi6-4的开发
近端胃切除双通道重建及全胃切除术用于胃上部癌根治术的疗效
人工智能
提高齿轮箱式换档机构可靠性的改进设计
宽带光谱成像系统最优训练样本选择方法研究
融合原始样本和虚拟样本的人脸识别算法
基于稀疏重构的机载雷达训练样本挑选方法
杭州前进齿轮箱集团股份有限公司
采用6.25mm×6.25mm×1.8mm LGA封装的双通道2.5A、单通道5A超薄微型模块稳压器