APP下载

基于稀疏自适应S变换和深度残差网络的轴承故障诊断方法

2022-09-14李峰陈皖皖杨义

电机与控制学报 2022年8期
关键词:时频残差轴承

李峰, 陈皖皖, 杨义

(上海电力大学 电气工程学院,上海 200090)

0 引 言

滚动轴承作为机械设备的关键组成,在工作过程中承担着连接部件、承受载荷等重要作用,一旦故障将会造成严重的经济损失[1]。因此,有必要研究一种轴承故障诊断方法,及时发现和诊断轴承故障状态,提高机械设备的运行可靠性。

滚动轴承在运行过程中不可避免地会产生机械振动,这些振动包含了大量的设备状态信息,可通过获取振动信号的时频特征信息实现其运行状态的监测。目前,常用的时频分析方法有短时傅里叶变换[2]、Wigner-Will分布[3]、小波变换[4]和S变换[5]等,其中,短时傅里叶变换时频分辨率固定、自适应性较差,Wigner-Will分布时频分辨率较好,但存在交叉干扰,小波变换方向性差、缺乏相位信息[6-8]。S变换则融合了短时傅里叶变换和连续小波变换的优点,具有很好的时频分析能力,但其自适应能力有限,限制了其在实际工程的应用。而稀疏自适应S变换通过对窗函数进行二维优化[9], 可获得更高分辨率和更强自适应性的时频矩阵,保证了振动信号时频特征提取的准确性。然而,时频图像特征维度较高,依靠传统人工提取图像特征并进行识别的方法难以取得很好的效果。

随着人工智能的快速发展,深度学习方法在轴承故障诊断方面的应用得到了快速的发展。其中,卷积神经网络(convolutional neural network,CNN)作为深度学习的重要分支,基于局部感知和权值共享机制减少网络参数,具备自适应性好,计算成本低等特点,在高维图像特征识别方面得到广泛应用。深度残差网络(deep residual networks,ResNet)是卷积神经网络深层结构拓展模型,解决了传统深层网络存在的模型性能退化的问题,具备很强的特征学习和特征表达能力[10],在图像识别领域取得突破性进展。

针对上述问题,本文从轴承振动信号的时频特性出发,提出了一种基于稀疏自适应S变换和深度残差网络的轴承故障诊断方法。首先,利用稀疏自适应S变换提取振动信号的时频图像特征;然后,将其输入至深度残差网络中,据此建立了基于深度残差网络的轴承故障诊断模型。最后,以凯斯西储大学轴承故障振动信号为例进行分析,以验证所提方法的有效性。

1 稀疏自适应S变换

S变换是基于短时傅里叶变换和小波变换基础改进的时频分析方法,既有多尺度分析能力,又保留了信号的相位信息。对信号x(t)的一维连续S变换定义为[11]:

(1)

式中:ω(τ-t,f)为窗函数;τ为时移参数;t为时间;f为频率。

通常S变换的离散形式可以利用快速傅里叶变换实现,对于离散信号x(kT)(k=0,1,2,…,N-1)的S变换离散表达式为:

(2)

式中:N为采样点数;T为采样间隔;j、m、n的取值范围为0,1,2,…,N。

由于S变换的时频窗函数的窗宽随频率的变化而固定,在实际运用中时频聚集性较差。稀疏自适应S变换在S变换的基础上优化了窗口函数,自适应的对非平稳信号频率成份的突变进行正则化处理,提高了时频分析能力,具体计算过程为[12]:

1)对离散信号x(kT)的频谱x(n/NT)进行平滑处理,得

(3)

2)对xζ(n)进行Min-Max归一化处理后,计算各个频率上最佳窗口长度,得

(4)

式中xnor(n)为xζ(n)归一化后的值。

3)基于各个频率窗长即可得到自适应窗,所得稀疏自适应S变换为:

(5)

式(5)在式(2)基础上进行了窗口优化,增强了S变换时频分析能力,同时未改变其计算复杂度,可以更好的应用于复杂信号的分析。

2 深度残差网络

2.1 卷积神经网络

传统CNN主要由输入层、卷积层、池化层等组成[13],典型的CNN网络结构如图1所示。

图1 CNN网络结构Fig.1 Network structure of CNN

CNN的输入为统一尺寸的图像,经过卷积层和池化层交替作用,得到图像的低维特征矩阵,最终由全连接层和输出层实现分类。对输入图像X,经一层卷积层后特征图Yi可表示为

Yi=f(Wi⊗X+bi)。

(6)

式中:Wi为第i层卷积核的权值;b为偏置;f为非线性函数;⊗为卷积运算符。

池化层对上层图像特征进行约简,减少网络参数,提高网络鲁棒性,计算公式为

Yc=f(βdown(Yi)+bc)。

(7)

式中:β为乘性偏置;down为下采样函数;f为非线性函数。目前常用的池化方式有最大池化和平均池化两种。其中,最大池化更多地保留图像特征的纹理信息,平均池化则更多的保留整体的图像信息。

CNN的全连接层用于融合网络所学习到的深度特征,最常使用softmax函数来实现分类任务。

在进行图像识别任务时,CNN实现了特征提取和分类过程的统一,避免了传统的图像特征提取步骤。因具备局部感知和权值共享机制,CNN神经元只感受图像的局部特征,同一特征平面上的神经元权值彼此共享,计算成本大大降低。

2.2 深度残差网络

传统卷积神经网络的深度越深,网络可以提取到的信息越丰富,其非线性表达能力越强。但随着网络层数的增加,存在着梯度消失或爆炸现象,会致使识别准确精度降低。深度残差网络在传统网络的基础上增加了残差学习模块,如图2所示。

图2 残差学习模块Fig.2 Residual learning module

其中:x为输入值;F(x)为残差映射;H(x)为输出值;Relu为激活函数。由图2可知,残差单元的输出由多个卷积层级联的输出和恒等映射后的输入构成,实现网络梯度从高层次向低层次更好地传播,从而有效地避免了模型性能退化问题[14]。

综上,可得基于稀疏自适应S变换和深度残差网络的轴承故障识别流程如图3所示。

图3 轴承典型故障识别流程图Fig.3 Typical fault identification flow chart of bearing

3 实验数据

为了验证上述所提方法的有效性,采用美国凯斯西储大学滚动轴承振动数据集进行测试,该试验台由电动机、扭矩传感器、功率测试计等器件组成。该试验台模拟了正常运行、内圈故障、滚子故障和外圈故障4种运行工况,故障直径设置为7、14和21 mils。测试时,电机分别在1 797、1 772、1 750和1 730 r/min转速下运行,并在驱动端、风扇端和基座放置了加速度传感器,采样频率设置为12和24 kHz。其中,12 kHz采样频率、1 797 r/min转速下正常运行和7 mils故障直径的驱动端振动信号波形图如图4所示。

图4 轴承振动信号时域波形Fig.4 Time domain waveform of bearing vibration signals

从轴承振动数据集中选取12 kHz采样频率,1 797 r/min转速下驱动端振动数据构成样本数据集,具体分布情况如表1所示。数据集由4种故障状态及3种故障程度各100个样本构成。

表1 数据集样本分布Table 1 Sample distribution of data sets

4 结果分析

4.1 振动信号的时频特征

限于篇幅,仍以滚动轴承驱动端正常运行和7 mils故障直径时的各工况振动数据为例进行分析,时频结果如图5和图6所示。由图5可知,S变换方法所提取的时频特征能量泄露严重,相邻特征频率之间存在严重的混叠,不能很好地区分各频率成份信息。由图6可知,相较于S变换,稀疏自适应S变换所提取的时频特征能量聚集性高,故障频率清晰,具有较高的时频分辨率和特征表达能力。

图5 S变换振动信号时频图Fig.5 S transform spectrum of vibration signal

图6 稀疏自适应S变换振动信号时频图Fig.6 Adaptive sparse S transform spectrum of vibration signal

4.2 深度残差网络结构设计及参数确定

考虑到深度残差网络的运算成本、识别精度以及故障样本的时频分布特征,本文在VGG网络结构的基础上添加了残差学习单元,构造了残差网络ResNet18网络结构,网络模型如图7所示。

图7 残差网络模型Fig.7 Residual network model

由图7可知,深度残差网络模型共包含1个卷积层,2个池化层,1个全连接层,8个残差块,其中每个残差模块中包含两个卷积层。同时,利用全局平均池化层替代一层全连接层,减少参数和计算量,避免了全连接层带来的过拟合风险[15]。在每次进行卷积运算后,需要进行一次批量归一化和非线性运算,以此加快模型的收敛速度,缓解梯度消失或爆炸的问题。

在进行诊断任务时,网络参数的选择对深度残差网络识别性能有很大的影响,如优化器、初始学习率、批大小等。因此,在进行诊断任务前需要确定如下网络参数的最佳值。

1)优化器。

优化器用于计算和更新影响模型性能的网络参数,使其趋近于最优值。目前,较为常用优化器有SGDM、Rmsprop和Adam,相同参数下深度残差网络不同优化器的迭代曲线结果如图8所示。由图8可知,Rmspro优化器在训练过程中,多次出现了小范围的震荡,不能保证很好的收敛性。相较于SGDM优化器,Adam优化器收敛速度更快,稳定性更好。因此,优化器的选择为Adam型。

图8 不同优化器的残差网络迭代曲线Fig.8 ResNet iteration curves of different optimizers

2)初始学习率。

学习率表示了权重参数逆梯度方向上调节的步长,直接影响了模型的收敛状态。初始学习率设置过小则会导致收敛速度慢,设置过大则会导致网络模型无法收敛。图9中给出了不同初始学习率下深度残差网络的损失值结果。由图9可知,残差网络的损失值随初始学习率的增加,呈现出先增加后下降趋势。当初始学习率设置为10-4时,模型的损失值最小。因此,设置模型初始学习率为10-4是较为合理的。

图9 不同学习率下残差网络损失值结果Fig.9 Results of residual network loss under different learning rates

3)批大小。

网络在训练的过程中,每次调整参数前所选取的样本数,即为批大小,其影响着模型的训练成本、泛化能力等。当学习率固定时,存在一个最佳批大小,最大限度地提升网络性能[16]。残差模型初始学习率为10-4时,默认的批大小为32,为了使模型性能最佳,设置不同批大小进行训练所得结果如表2所示。由表2可知,在一定范围内残差网络的训练时间和损失值随着批大小的增加而减少。当批大小为64时,训练时间和损失值达到最小,继续增大批大小,网络性能反而有所效降,则初始学习率为10-4时,残差网络模型的最佳批大小选择为64。

表2 不同批大小下残差网络结果对比Table 2 Comparisons of ResNet results under different batch sizes

4.3 轴承故障状态的诊断结果

综合上述深度残差网络主要参数的分析结果,确定网络使用Adam优化器,初始学习率为10-4,批大小为64,所得诊断结果如图10所示。由图10可知,训练集准确率曲线在迭代16次之后,识别率基本稳定于100%,表明该训练模型具有较高的识别性能。测试集准确率曲线随着迭代次数的增加迅速上升并趋于稳定,最终稳定于100%。

图10 深度残差网络的训练及测试曲线Fig.10 Training and testing curves of ResNet

为了进一步说明所提方法的有效性,本节将本文方法与现有研究成果进行了对比:1)EMD-FCM方法[17],利用EMD-PWVD将振动信号转化为轮廓时频图像,计算时频图像的能量分布特征并将其输入至模糊C均值(fuzzy C-means, FCM)聚类算法中去完成分类任务;2)DWT-RF方法[18],使用DWT对振动信号进行分解,然后构造sigmoid熵特征向量矩阵,输入到随机森林(random forest,RF)算法中进行诊断;3)VMD-KFCM方法[19],将采集的振动信号通过VMD算法进行预处理,然后基于核模糊C均值聚类(Kernel-based fuzzy C-means clustering, KFCM)算法对典型故障进行分类;4)STFT-SDAE模型[20],将原始振动信号进行短时傅里叶变换得到时频图样本,再将二维时频图像进行灰度化处理,然后提取样本的GLCM纹理特征向量,输入到结合堆栈去噪自编码网络(stacked denoising auto-encoders, SDAE)中进行学习,实现轴承故障状态识别;5)EMD-SVM方法[21],采用改进的EMD算法对振动信号进行分解并提取能量信息特征向量,结合SVM算法实现轴承运行状态的诊断;6)WT-DCNN模型[22],利用小波变换(wavelet transform, WT)算法构建振动信号的时频图像,结合可变形卷积神经网络DCNN来实现轴承运行状态的判别;7)S变换-SAE模型[23],通过S变换提取振动信号的时频特征,据此构建基于稀疏自编码网络(sparse autoencoders,SAE)的轴承故障诊断模型;8)VMD-AlexNet模型[24],基于VMD算法和分层模糊熵算法提取出故障特征指标,应用AlexNet网络对轴承典型故障进行识别;9)LWPT-多分类器方法[25],利用提升小波包变换(lifting wavelet packet transform,LWPT)的分解结果,提取各分量样本熵组成特征向量,输入至由BP神经网络、Elman神经网络与RBF神经网络构建的多分类器模型中进行故障诊断;10)稀疏自适应S变换-ResNet18模型,利用稀疏自适应S变换提取振动信号的时频图像,结合深度残差网络模型实现轴承各机械运行状态的识别。为了保证结果具有比较性,上述算法中的故障数据均来自于美国凯斯西储大学轴承数据集,对比结果如表3所示。

表3 识别结果对比Table 3 Comparison of recognition results

由表3可知,时频分析方法在轴承故障诊断中得到了广泛应用。虽然一些方法在不同的运行工况下可以达到很高的识别精度,但却未对传统时频分析方法中存在的难题进一步讨论和解决。其中,部分识别方法中,为了提高识别精度而引入大量的协助算法,在状态识别过程中步骤较为麻烦,程序较为繁琐,基本丧失了普适性及推广性。本文所提稀疏自适应S变换可以有效解决传统时频分析方法存在的问题,同时,引入深度残差网络模型执行诊断任务,具有很强的动态学习能力和泛化性能,保证了识别性能的稳定。实验结果表明,即使在10种滚动轴承工况下进行诊断任务,该方法也能达到100%的识别准确率。

5 结 论

本文在轴承振动信号时频分布特性的基础上,提出了基于稀疏自适应S变换与深度残差网络的故障诊断方法,结果表明:

1)基于稀疏自适应S变换的特征提取方法能有效实现轴承振动信号的高分辨率时频表示,避免了传统S变换存在的时频信息丢失问题,提高了时频分析的准确性。

2)深度残差网络的优化器、初始学习率等网络参数的确定结合了轴承振动信号的特征信息,增强了网络的识别性能。相较于传统的CNN模型,深度残差网络选用较小尺寸的卷积核,减小了模型的计算复杂度,加快了模型的训练速度。

3)所提出的基于稀疏自适应S变换和深度残差网络的故障诊断模型,在不同故障状态和故障严重程度的轴承振动信号的分析和识别中,体现出了良好的分类性能,实现了高效、准确的轴承机械运行状态的识别。

猜你喜欢

时频残差轴承
轴承知识
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于双向GRU与残差拟合的车辆跟驰建模
轴承知识
轴承知识
轴承知识
基于残差学习的自适应无人机目标跟踪算法
高聚焦时频分析算法研究
基于深度卷积的残差三生网络研究与应用
基于稀疏时频分解的空中目标微动特征分析