APP下载

基于多种卷积核特征提取自适应融合的滚动轴承故障诊断方法

2023-11-15尚东方申浩王正

轴承 2023年11期
关键词:特征提取故障诊断卷积

尚东方,申浩,王正

(1.中国矿业大学 安全工程学院,江苏 徐州 221116;2.黄河水利职业技术学院,河南 开封 475001;3.上海电机学院 电气学院,上海 201306)

随着科技发展的日新月异,电动机设备的功能越来越强大,设施越来越复杂,作为电动机关键部件的电机轴承极易损坏,对其故障诊断的要求也越来越高[1]。目前,对于电机轴承故障诊断的主要方法有基于模型的方法和基于数据的方法。传统的机器学习方法在故障诊断领域取得了不错成果,如文献[2]提出一种基于信息熵的轴承故障特征提取方法,将提取的故障特征向量作为优化支持向量机(SVM)的输入,使用集成经验模态分解提取各阶分量的信息熵,通过主成分分析(PCA)提取主要信息,利用Grid Search优化SVM参数并对故障信息进行分类,从而快速有效地识别了不同的轴承故障信息。

随着AlexNet的问世,深度学习方法逐渐进入故障诊断领域并成为众多学者的研究对象[3-5],如文献[6-8]将深度信念网络(Deep Belief Network,DBN)以及堆叠自编码器(Stacked Auto Encoder,SAE)应用于故障诊断领域,着重于提取输入的故障特征,均取得了较好的诊断效果。目前,将卷积神经网络(Convolutional Neural Networks,CNN)应用于轴承故障诊断领域的研究更为广泛:文献[9]将多通道原始轴承信号经过短时傅里叶变换转换为二维时频图像,送入深度残差网络进行故障分类,准确率得到了很大提升;文献[10]提出了一种具有残差结构的一维扩张卷积网络方法,将锯齿形扩张卷积引入神经网络模型,并在网络中添加注意力模块进行特征增强,很大程度上提高了故障识别率。上述方法均是将轴承信号输入卷积神经网络模型提取故障特征从而达到诊断效果,但实际工况复杂,干扰因素较多[11],使用单一卷积核构成的卷积神经网络模型的特征提取能力有限,很大程度上会堆叠重复特征,存在较多的冗余信息。

针对以上问题,本文提出一种基于多卷积核(Multiple Convolution Kernels,MCK)卷积神经网络的滚动轴承故障诊断方法(MCK-CNN)。经过预网络特征提取后产生输出特征图,再将其分别输入基于Involution卷积核搭建的NET1和常规Convolution卷积搭建的NET2进行故障特征提取,然后通过CBAM模块自适应融合二者提取的特征,使网络更加关注有判别能力的特征以提高网络诊断能力,最后通过Softmax函数输出分类结果。

1 理论背景

1.1 二维卷积

二维卷积的目的是提取图片中的特征,卷积核相当于过滤器,通过在特征图上的不停移动提取输入特征图的信息。其卷积过程如图1所示。

图1 二维卷积

卷积的运算过程可表示为

(1)

1.2 Involution卷积

Involution卷积没有像Convolution卷积一样采用固定尺寸的权重作为可学习参数,而是基于特征图生成对应的Involution核,从而确定卷积核的尺寸与输入特征矩阵的大小在空间维度上是可以对齐的[12]。Involution算子可以表示为

(2)

式中:X为输入图片的通道数;H为Involution卷积核,H∈RH×W×K×K×G,通用形式为Hi,j=φ(XΨi,j);φ为Involution卷积核生成函数;Ψi,j为坐标(i,j)邻域的集合,表示特征图上包含Xi,j的某个邻域,生成图如图2所示。

图2 Involution卷积

1.3 卷积注意力模块

卷积注意力模块(Convolutional Block Attention Module,CBAM) 包含2个独立的子模块[13],通道注意力模块(Channel Attention Module,CAM)和空间注意力模块(Spartial Attention Module,SAM)如图3所示。

图3 CBAM结构图

给定一个特征图作为输入,CBAM的运算过程总体分为2个部分:1)对输入按通道进行全局最大池化和均值池化,将池化后的2个一维向量送入全连接层运算后相加,生成一维通道注意力并与输入元素相乘,获得通道注意力调整后的特征图F′;2)将F′按空间进行全局最大池化和均值池化,将池化生成的2个二维向量拼接后进行卷积操作,最终生成二维空间注意力并与F′按元素相乘得到输出F″。

2 基于MCK-CNN的滚动轴承故障诊断方法

2.1 MCK-CNN模型

本文采用的神经网络模型结合了Involution卷积和Convolution卷积,而且可通过CBAM注意力机制进行自适应特征融合,如图4所示:将通过小波变换产生的时频图裁剪为64*64*3的尺寸输入神经网络模型;经过NET0中9个5*5的卷积核提取特征以及扩充维度之后产生60*60*9尺寸的输出,通过最大池化层下采样压缩特征并去除冗余信息后得到30*30*9尺寸的输出特征图并分别作为NET1和NET2的输入;在NET1中,Involution卷积根据输入特征图尺寸产生对应的Involution卷积核并进行逐个像素点的特征提取,得到30*30*9尺寸的Involution输出特征;在NET2中,输入分别经过6个1*1的卷积核和9个1*1的卷积核升降维度后产生30*30*9尺寸的Convolution输出特征;通过CBAM注意力模块自适应分配Involution和Convolution特征所占权重并进行融合,通过Softmax函数输出分类结果。

图4 神经网络模型结构图

2.2 算法流程

基于MCK-CNN的滚动轴承故障诊断方法包含3个模块,其流程如图5所示:

图5 故障诊断流程图

1)数据处理。通过电动机驱动端的传感器获取滚动轴承一维振动信号并通过小波变换转换为二维时频图,经过裁剪、翻转等操作后将数据集划分为训练集、验证集和测试集,进行网络初始化后将训练集、验证集输入神经网络模型。

2)网络训练。将划分后的数据集经过卷积层NET0进行简单的特征提取以及维度扩充,得到输出特征图后分别送入基于Convolution卷积的NET2和基于Involution卷积的NET1进一步提取特征,由CBAM模块自适应融合NET2和NET1分别产生的特征,最后展平成一维送入全连接层并通过Softmax函数输出分类结果。训练完成后输出准确率曲线和损失函数曲线,保存网络权重。

3)网络性能测试。将测试集输入训练好的网络模型中,计算得到混淆矩阵。

3 试验分析

3.1 轴承数据集

为验证MCK-CNN模型的性能和泛化能力,采用CWRU轴承数据集[14]以及实验室采集的轴承数据进行试验分析,数据集的划分见表1。CWRU轴承数据集轴承型号为6205,采样频率为48 kHz,转速为1 797 r/min,N代表正常轴承,OR,IR,B分别代表外圈、内圈、钢球故障,007,014,021分别表示直径0.178,0.356,0.534 mm的故障。实验室轴承测试平台如图6所示,在电动机驱动端的横向、径向、轴向分别安装传感器采集得到三通道的振动信号,采样频率为10 kHz,转速为1 420 r/min,试验轴承型号为6206-2RS,故障类型如图7所示。

表1 试验轴承数据集

(a) 正常轴承 (b) 保持架故障

3.2 模型性能测试

试验配置如下:CPU为Intel(R)Core(TM)i5-10400 CPU@2.90GHz,显卡为RTX2060,运行程序软件为PyCharm Community Edition 2020.3 x64。神经网络模型设置参数为:学习率设为0.002,迭代次数为50,batchsize为32。由于输入图片64*64*3的尺寸较小,在Involution卷积操作中的压缩率r和组数G均取为3。

为更好地验证MCK-CNN模型的故障诊断性能,在保证NET0的基础上设置了只有NET1(Involution卷积)或NET2(Convolution卷积)的网络进行对比分析,结果如图8所示:

1)对于实验室轴承数据集,由于故障类型仅有4类,各模型的故障检测准确率均较稳定,在只有Convolution卷积进行特征提取的状态下准确率即可达到94%,在Involution卷积进行二次特征提取的状态下准确率达到了97%;当把二者提取的特征通过CBAM模块进行自适应融合之后,模型准确率达到了99%,故障识别率得到了较大程度的提高。

2)对于CWRU轴承数据集,在10种故障类型情况下,MCK-CNN模型的故障识别率达到了99.25%,仍高于仅通过单一卷积核提取特征的网络模型,说明其能够有效进行滚动轴承故障识别。

3.3 网络模型对比

为进一步验证本文算法的优越性,选取2个较为前沿的神经网络模型算法进行对比:1)通过短时傅里叶变换将一维轴承振动信号转为时频图再输入改进的深度残差网络(STFT-DRNN)模型;2)将一维轴承振动信号输入由空洞卷积搭建的神经网络(FAC-CNN)模型。

由于实验室轴承数据集的故障类型较少,3种网络均取得了较好的故障识别率,因此在相同试验条件下采用CWRU轴承数据集进行试验。学习率为0.02,batch_size为32,迭代50次,试验结果如图9所示:MCK-CNN达到了99.25%的故障识别率,比FAC-CNN,STFT-DRNN分别高出1.50%和2.75%;另外,相对于同样将轴承一维振动信号转换为二维时频图的STFT-DRNN,MCK-CNN模型的训练时间仅为其50.4%,极大缩短了模型训练耗时;因此,本文所提MCK-CNN模型可以高效、准确地实现滚动轴承故障诊断。

4 结束语

建立了一种用于滚动轴承故障诊断的多卷积核特征提取自适应融合的神经网络模型(MCK-CNN),并采用公开轴承数据集验证了该方法在理论上和实际上的可行性。采用多种卷积核共同提取输入信号特征时,由于每类卷积核的故障特征提取方式不同,侧重点不同,可以更全面、充分的提取故障特征,自适应融合则可以提高模型的训练效率,从而高效、准确地实现滚动轴承的故障诊断,具备较好的实用性。

猜你喜欢

特征提取故障诊断卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
从滤波器理解卷积
基于Daubechies(dbN)的飞行器音频特征提取
基于傅里叶域卷积表示的目标跟踪算法
Bagging RCSP脑电特征提取算法
因果图定性分析法及其在故障诊断中的应用
基于MED和循环域解调的多故障特征提取
一种基于卷积神经网络的性别识别方法
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断