APP下载

改进多线性主成分分析网络及其在滚动轴承故障诊断中的应用

2022-01-27郭家昕程军圣

中国机械工程 2022年2期
关键词:张量故障诊断准确率

郭家昕 程军圣 杨 宇

1.湖南大学机械与运载工程学院,长沙,4100822.汽车车身先进设计制造国家重点实验室,长沙,410082

0 引言

滚动轴承作为关键零部件被广泛应用于机电设备,滚动轴承出现故障常会造成严重的事故和经济损失,因此,开展滚动轴承故障诊断研究具有重要意义。

滚动轴承的传统智能诊断方法普遍存在依靠专家知识以及人工提取数据特征工作量大的问题,近年来,卷积神经网络(convolutional neural network,CNN)作为一种经典深度学习模型[1],可以自主深度挖掘数据特征,成为了滚动轴承智能诊断领域的研究热点。然而,CNN模型在训练过程中存在参数爆炸、梯度扩散和反向传播计算成本高的缺点[2-7],这导致其在滚动轴承故障诊断领域的应用中存在训练时间较长、训练小样本数据易出现过拟合的问题[8]。针对以上问题,CHAN等[9]提出了一种基于CNN的简单深度学习模型,即主成分分析网络(principal component analysis network,PCAnet)模型,该模型由卷积层中的PCA滤波器组、非线性处理层中的哈希编码以及输出层中的级联块状直方图组成。PCAnet模型相比于CNN模型,结构有所简化,无需反向传播,训练参数大大减少,一定程度上解决了梯度消失、梯度扩散、训练时间长的问题以及训练样本少时效果不佳的问题。

滚动轴承故障诊断领域中,绝大多数振动信号的各类时频图均是彩色图像,即列、行、色彩模式的三阶张量,其中蕴含了丰富的原始信号空间结构信息。传统的PCAnet模型及其同类方法对图像进行分类时,均先将多维张量对象转化成一维向量,再对其进行特征提取,而一维向量则会不可避免地破坏多维图像中的空间结构,同时也可能造成维度灾难[10],因此这种方法在对多维图像进行自动特征提取时表现欠佳。针对PCAnet模型的这一缺点,WU等[11]提出了多线性主成分分析网络(mutilinear principle component analysis networks,MPCAnet)模型,该模型是对PCAnet的张量扩展,它从多维空间中提取了图像的高级语义特征,有效地利用了多维图像空间结构关系,从而使自动提取的特征尽可能最小化张量对象的类内不变性。MPCAnet卷积层中的MPCA滤波器组对高阶张量对象进行处理时不需要对其进行向量化展开,直接输出低维的同阶张量,保留了高阶结构,需要估计的参数更少且计算要求更低[12],同时越来越多的学者也证明了张量形式更适合对多维图像进行分类识别[13]。实践证明,MPCAnet在多维图像的分类中取得了更好的效果,仅一层的MPCAnet的分类准确率就超过了两层的PCAnet[11]。

目前绝大多数基于图像分类的滚动轴承故障诊断方法,其分类对象都是由运行设备的原始振动信号经过时频分析产生的时频图,工程实际中的原始振动信号通常存在噪声干扰,具有非平稳和非线性的特点,而MPCAnet在提取数据深层特征时忽略了特征间的非线性关系,不能保证原数据特征线性可分,特征聚类性一般。由于非线性拟合能力较差,所以模型需要更多的训练样本数据,而工程实际中滚动轴承的故障样本往往很难获得。针对这一问题,本文在MPCAnet的基础上引入核(Kernel)变换,将原始数据特征映射到了高维核空间实现高度线性可分[14],同时进行降维并训练得到滤波器组。改进后的模型仅需要少量样本数据就可以提取到聚类性较强的高维图像深层特征,泛化能力进一步增强,一定程度上解决了工程实际应用中故障样本难以获取的问题。与此同时很大程度上增大了样本特征之间的差异度,模型的非线性拟合能力得到提高,较原方法的分类精度有所提高。本文提出的改进多线性核主成分分析网络(multilinear kernal principle component analysis network,MKPCAnet)模型由多线性主成分分析(MPCA)、核主成分分析(KPCA)、二值化哈希层和分块直方图四部分组成。将该方法运用到不同类型的滚动轴承故障诊断实例中,结果表明本文提出的基于MKPCAnet的滚动轴承故障诊断方法具有较高的准确性和鲁棒性。

1 改进多线性主成分分析网络

1.1 多线性主成分分析算法

MPCA是PCA从向量到高阶张量的一个延伸[15],PCA是将向量投影到向量,MPCA是将张量投影到张量。MPCA可以比PCA捕获更多原始张量的变化信息和局部特征,通过多线投影进行输入张量的特征提取。它将原始问题分解为一系列多投影子问题,具有投影结构相对简单、运算量较少的优势,适合处理旋转机械振动信号三维时频图像。

将N阶张量表示为X∈RI1×I2×…×IN,由N个指标In(n=1,2,…,N)表示,每个指标In都是张量X的n-mode。

张量X与矩阵U∈RJn×In的n-mode积定义为

(1)

通过投影矩阵{(V(n))T∈RPn×In,n=1,2,…,N},可以将一组(M个)张量对象{Xm∈RI1×I2×…×IN,m=1,2,…,M}映射为另一组(M个)张量对象{Ym∈RP1×P2×…×PN,m=1,2,…,M},其中Pn

Ym=Xm×1(V(1))T×2(V(2))T×…×N(V(N))T

(2)

m=1,2,…,M

式(2)也可以用矩阵的形式表示如下:

Xm(n)=V(n)Ym(n)(V(n+1)⊗V(n+2)⊗…

⊗V(N)⊗V(1)⊗V(2)⊗…⊗V(n-1))T

(3)

式中,⊗表示kronecker积;Xm(n)为张量Xm的n-mode的展开矩阵;Ym(n)为张量Ym的n-mode展开矩阵。

MPCA的目标是确定满足总张量散射ψY最大化条件的N个投影矩阵{V(n)∈RPn×In,n=1,2,…,N},即

{V(n)}=argmaxV(1),V(2),…,V(N)(ψY)

(4)

式(4)的解法如下。令{V(n),n=1,2,…,N}为式(4)的解,其他投影矩阵为V(1),…,V(n-1),V(n+1),…,V(N),矩阵V(n)由Pn个特征向量组成,对应于如下矩阵的最大的Pn个特征值:

(5)

Vφ(n)=V(n+1)⊗V(n+2)⊗…V(N)⊗

V(1)⊗V(2)⊗…⊗V(n-1)

(6)

Xm(n)由式(3)给出。

最终得到了投影矩阵{V(n),n=1,2,…N}和投影后的张量Ym。

1.2 改进多线性主成分分析网络

本文提出的改进多线性主成分分析网络模型由MPCA滤波器组、KPCA滤波器组、二值化哈希层以及分块直方图层四部分组成,模型结构示意图见图1。

图1 改进主成分分析网络模型结构示意图Fig.1 Flowchart of impoved multilinear principal component analysis network

1.2.1第一层卷积:MPCA层

MPCA层对应卷积神经网络中的第一层卷积层,类似于神经元局部感受野,起权值共享的作用。

(7)

(8)

1.2.2第二层卷积:KPCA层

MPCA层只进行线性变换,非线性拟合能力较差,故引入KPCA算法,当其核函数是非线性核时,能将线性不可分的数据映射到高维空间的线性子空间中,使得数据线性可分。输入张量数据在MPCA层进行卷积操作后得到第一层特征并输出到第二层,在第二层被映射到高维核空间中进行特征学习。

KPCA层对应卷积神经网络中的第二层卷积层。所有输入图像经过第一层变换后得到的特征值矩阵可以看作L1×M幅大小为I1×I2的“图像”,接着用第二层设置的大小为k1×k2的滤波器滑块遍历每幅图像Fi∈RI1×I2,i=1,2,…,L1×M,上述k1和k2均为奇数且1

yi,1,yi,2,…,yi,I1I2∈Rk1k2

(9)

中心化式(9)中的列向量值,得

(10)

(11)

i=1,2,…,L1M

分别求局部特征矩阵Yi的协方差矩阵:

(12)

接着求取L1M个协方差矩阵的平均矩阵:

(13)

(14)

其中,σ是实参数。接着对矩阵K取均值可得

(15)

(16)

Zi,j,h∈RI1×I2

(17)

i=1,2,…,M;j=1,2,…,L1;h=1,2,…,L2

1.2.3输出层:哈希和直方图

fm=

(18)

将网络输出得到的特征向量fm作为SVM分类器的输入,训练分类器,进一步输入测试图像进行分类。

2 MKPCAnet模型滚动轴承故障诊断

基于改进多线性主成分分析网络的滚动轴承故障诊断具体步骤如下:

(1)采用加速度传感器采集滚动轴承原始振动信号,本文选取小波变换的方法将振动信号转化为小波时频图。由其他方法变换得到的时频图像也可以作为本模型的输入对象。由于morlet小波的冲击适应性好[17],故本文选用morlet小波作为小波基函数进行连续小波变换来获得一维时间振动信号的时频图,为减少运算量,时频图大小统一处理为64×64×3,如图2所示。

图2 三阶张量小波时频图Fig.2 Third-order tensor wavelet time-frequency images

(2)根据不同输入数据集的特性,对比分析确定模型的参数。MKPCAnet模型参数包括:每层滤波器数目、模型层数、输出层中局部直方图块大小、块重叠区域比率以及KPCA层中的高斯核参数σ。

(3)将三维彩色小波时频图作为模型输入,样本划分为训练集和测试集,通过训练集来构建最优MKPCAnet故障诊断模型,验证测试集识别精度,达到故障诊断的目的。

3 实验数据分析

实验1数据来自美国凯斯西储大学轴承数据中心。采用型号为6205-2RS SKF的深沟球轴承,采样频率为48 kHz,每4800个采样点划分为一个样本。将样本进行连续小波变换所用尺度序列的长度设置为256,尺度范围为6~1536,得到每个样本的小波时频图。为保证模型性能评价的客观全面,数据集A用来识别故障类型及故障程度,负载设置为0HP,共1000个样本;数据集B只用来识别故障类型,每类故障由不同故障程度样本组合而成,负载设置为3HP,共1000个样本。故障类型见表1。

表1 轴承数据样本

将样本的三维彩色小波时频图作为CNN、PCAnet、MPCAnet以及本文提出方法MKPCAnet的输入。其中,CNN网络结构选取经典的AlexNet框架,包括5层卷积层和3层全连接层,输入图片大小设置为AlexNet网络固定输入格式227×227×3。PCAnet、MPCAnet以及MKPCAnet的输入图片大小统一处理为64×64×3。通过对比分析确定各自分类效果最优时的模型参数:三者均采用2层结构,每层滤波器数目均为8,两层滤波器的大小均为7×7。PCAnet输出层中局部直方图块大小为7×7,MPCAnet和MKPCAnet输出层中局部直方图块大小为24×32,三者块重叠区域比率均为50%。MPCAnet第一层为MPCA滤波层,第二层为PCA滤波层;MKPCAnet中的KPCA滤波层选择高斯核函数,通过对比分析确定效果最佳时的高斯核参数σ=6。

为了直观地展示本文提出模型的优越性能,使用t分布随机嵌入(t-SNE)算法对每种网络模型学习后的样本特征进行可视化处理。选取数据集B的四种故障类型(每类故障90个样本)进行展示。对比方法包括CNN学习特征、PCAnet学习特征、MPCAnet学习特征和本文提出方法的学习特征,特征可视化结果如图3所示。结果表明,相比CNN、PCAnet和MPCAnet,本文提出的MKPCAnet模型深度学习得到的特征在同类故障样本中聚类性更强,异类故障样本间的距离更远,可以更清晰地描述和区分不同故障状态下的轴承信号。

(a) CNN

分别在数据集A、B上进行实验,每种故障类型均取20%作为训练集,剩余样本作为测试集。取10次独立实验的平均准确率进行展示,结果见表2。

表2 识别准确率

由表2可以看出,PCAnet较传统使用随机梯度下降(SGD)优化算法进行梯度反向传播的CNN相比,可以在输入图像尺寸更小、网络层数更浅的情况下更精准地识别不同的故障类型和不同程度的故障。基于PCAnet模型进行改进的MPCAnet模型的分类准确率进一步提高。而本文提出的MKPCAnet在数据集A、数据集B中均取得了最高的识别准确率,这是由于MPCA层更有效地利用了多维图像的空间结构关系,加强了对图像高级语义特征的提取,KPCA层则提高了模型的非线性拟合能力,这一效果在设置负载的数据集B的测试结果中尤为明显。

为了验证本文提出方法的泛化能力,将数据集A采用不同数量的样本作为训练集,其余样本作为测试集,观察测试集的准确率。每种模型进行独立重复10次实验,平均分类精确率如图4所示。

图4 识别精度随训练集样本量变化Fig.4 Recognition accuracy changes with the sample size of training set

由图4可以看出,本文提出方法的准确率高于其他同类方法,同时优于CNN。在小样本训练的情况下,KPCA的引入对模型的改善尤为明显。本文提出的方法准确率较PCAnet提高了8.63%,较MPCAnet提高了3.03%,在每类仅有5%训练样本的情况下也能保证测试集达到93%以上的准确率,每类15%训练样本时测试集准确率达到了98%以上。说明该方法在小样本训练下表现优异且有着良好的泛化能力,一定程度上缓解了工程实际中故障样本难以获取的问题。

实验2数据来自湖南大学旋转机械故障试验台的滚动轴承数据,试验台架如图5所示。在试验台上,滚动轴承型号为6205-2RS SKF,通过激光切割技术模拟了内圈故障、外圈故障和滚动体故障。故障尺寸分别为0.2 mm、0.4 mm、0.6 mm,转速为986.1 r/min,采样频率为10 kHz,每条信号的长度为10 000个采样点,连续小波变换参数与实验1相同。

图5 旋转机械故障试验台Fig.5 Rotating machinery failure test device

为更真实地模拟工程实际运行条件,统一将施加载荷设置为2 kN。为验证本文提出方法在非平稳工况下的诊断鲁棒性,统一给所有信号样本添加10 db高斯白噪声,获取的样本描述见表3。

表3 轴承数据样本

各模型参数设置与实验1相同。每一类故障类型取5%的样本量作为训练集,剩余样本作为测试集。在处理器型号为IntelCorei7-8550U CPU @1.80 GHz的PC机上,基于MATLAB2018b平台记录训练时间和测试时间,实验结果如表4所示。

表4 识别准确率及平均运行时间

由表4可以看出,本文提出的MKPCAnet方法依旧表现出最高的识别准确率。值得一提的是,所有方法的训练时间相较CNN都有大幅缩短。虽然MKPCAnet的训练时间相较于结构更为简单的PCAnet和MPCAnet有所增长,但测试时间均在0.3 s左右,能够满足工程实践中的诊断要求。

进行10次随机独立重复实验,观察测试集准确率随训练集样本量变化的趋势,训练集样本量从每类故障样本量的1%到10%依次递增,结果如图6所示。本文提出方法仍拥有最好的识别效果,不仅识别精度最高而且表现稳定,具有较好的鲁棒性。对于本文提出的方法,当每类故障仅取2%的样本量作为训练集时,测试集就可以达到99.96%以上的准确率,远高于其他方法,满足工程实际应用需求。

图6 识别精度随训练集样本量变化Fig.6 Recognition accuracy changes with the sample size of training set

4 结论

本文提出一种改进的多线性主成分分析网络并用于滚动轴承故障诊断。改进后的模型由MPCA滤波器组、KPCA滤波器组、二值化哈希层以及分块直方图层组成。该网络使用张量对高维图像进行自动特征提取,充分利用了高维图像的空间结构关系,有效提取了图像的高级语义特征。在此基础上引入了核主成分分析的方法,提高了模型的非线性拟合能力,进一步提高了分类精度,在小样本训练和有噪声干扰的情况下,模型在分类性能和泛化能力上的提高尤为突出,有效缓解了工程实际中故障样本难以获取、信号采集过程振动噪声干扰等问题带来的诊断压力。实验结果表明本文提出的方法识别性能和鲁棒性均高于传统方法,对传统基于CNN模型的深度学习识别方法提出了挑战,对实际工程应用有重要参考意义。

本研究仍有一部分工作尚可继续深入研究,例如:可进一步研究模型中不同层数、不同滤波器尺寸和不同滤波器个数等参数对模型性能的影响,分析原因;可采用多种时频分析方法处理得到不同类别的时频图像,分别输入本模型横向对比诊断效果,找到更合适的信号预处理方法;可尝试将多源异构信号、多通道信号组成的张量对象作为本模型的输入进行故障诊断等。

猜你喜欢

张量故障诊断准确率
一类张量方程的可解性及其最佳逼近问题 ①
基于包络解调原理的低转速滚动轴承故障诊断
严格对角占优张量的子直和
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
一类张量线性系统的可解性及其应用
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
四元数张量方程A*NX=B 的通解
数控机床电气系统的故障诊断与维修