APP下载

基于迁移最小二乘支持矩阵机的滚动轴承故障诊断方法

2022-11-21潘海洋郑近德

振动与冲击 2022年21期
关键词:源域权重标签

伍 毅, 盛 丽, 潘海洋, 郑近德

(安徽工业大学 机械工程学院, 安徽 马鞍山 243002)

滚动轴承作为机械设备中最为重要的零部件之一,被广泛应用于现代工业生产中。当滚动轴承出现故障时,如不及时处理将可能产生严重的安全问题,因此,对滚动轴承开展相应的故障诊断研究具有重要意义。

模式识别技术作为常用的分类方法,被广泛应用于故障诊断领域,并取得了良好的应用效果,如经典的模式识别方法有支持向量机(support vector machine,SVM)[1]和人工神经网络[2]等。SVM作为一种基于结构风险最小化的分类方法,其通过最大化分类边界,以此在特征空间得到最优超平面,进而具有较好的稳定性、稀疏性和泛化能力。但是,SVM的对偶问题需要使用超松弛迭代法[3]进行求解,计算过程繁琐复杂,效率较低。为解决该问题,相关学者提出了孪生支持向量机(twin support vector machine,TSVM)[4]、最小二乘支持向量机(least square support vector machine,LSSVM)[5]等方法。TSVM可以将SVM一个较大的二次规划(quadratic programming,QP)[6]问题转换为解决一对尺寸较小的QP问题,与SVM相比运算速度更快;LSSVM是一种改进的支持向量机,其在求解非线性问题时,利用最小二乘法约束目标函数,通过等式约束代替不等式约束使得复杂的计算问题转换为只需求解一组线性方程组的问题,进而可得到权重矩阵和偏移量,计算过程更加简便。

然而,上述SVM及其改进方法都是基于特征向量进行建模分类,在进行特征提取时往往会遇见以下两个问题:① 当待分析对象故障较小或环境噪声较大时,难以利用有限的特征表示待分析对象的状态信息;② 当进行特征提取时,将破坏数据间的结构化信息,无法利用该特征建立准确的预测模型。针对特征向量分类方法的局限性,Luo等[7]提出了支持矩阵机(support matrix machine,SMM)。SMM作为一种新的模式识别方法,其充分利用矩阵行与列之间的相关性,可以最大化利用输入样本的结构化信息建立准确的预测模型。同时,SMM采用交替方向乘子法(alternating direction method of multipliers,ADMM)[8]来求解优化问题,使其具有良好的收敛性。由于SMM具有良好的分类性能,矩阵分类方法吸引了相关领域学者的研究和关注,一系列改进的SMM方法被提出,如稀疏支持矩阵机(sparse support matrix machine,SSMM)[9]、辛几何支持矩阵机[10]和辛交互支持矩阵机[11]等。

不幸的是,在实际工业生产中,滚动轴承的工作环境通常较为复杂,难以采集大量拥有标签故障样本数据。由于缺乏足够的带标签样本,传统分类器很难利用有限的故障样本建立准确的预测模型,进而无法达到满意的分类效果。迁移学习作为一种小样本分析方法,其将某个领域(源域)上学到的知识应用到不同但相关的领域(目标域)中,并充分利用源域和目标域的信息建立新的模型。因此,迁移学习的出现为解决小样本问题带来了新的契机,相关学者对此也进行了大量的研究,如Guo等[12]提出了一种基于迁移的支持向量机,该算法将源领域知识和目标领域知识综合为目标函数中的两个正则化项,并使用铰链损失以最大限度地扩大自适应目标分类器的边缘空间;Chen等[13]提出了一种基于迁移的L2-SVM(L2 norm support vector machine),选用L2-SVM作为算法的基本模型,将源域中知识引入到目标域分类学习中,构造新的分类模型。

考虑到迁移学习理论处理小样本的优越性和原始支持矩阵机的局限性,本文提出一种迁移最小二乘支持矩阵机(transfer least square support matrix machine,TLSSMM)分类方法。在TLSSMM的目标函数中,为了挖掘目标域样本与源域样本间的相似特征,将目标域权重矩阵与源域权重矩阵间的差最小化,以达到目标域模型与源域模型近似相等的目的。TLSSMM旨在使用源域数据信息进行训练以建立近似目标域的预测模型,然后利用少量含有目标域标签的样本微调得到最终模型,使其能够有效的解决标签样本稀少构建模型的问题。此外,在TLSSMM的目标函数中使用等式约束,使得复杂的计算变为只需求解一组线性方程组就可求得权重矩阵和阈值,计算效率得到显著提升。

综上所述,论文在支持矩阵机中融入迁移学习理论,通过比较目标域权重矩阵与源域权重矩阵间的差异性,自适应更新模型,使得预测模型更加准确。采用两种不同的滚动轴承故障数据对所提方法进行验证,实验结果表明,TLSSMM方法具有优异的分类性能和优良的故障诊断能力。

1 迁移最小二乘支持矩阵机理论

1.1 支持矩阵机

SMM是由Luo等于2015年在国际机器学习会议上提出的一种新方法,其通过引入核范数,并利用铰链损失项和正则化项解决凸优化问题。目标函数如式(1)所示

(1)

(2)

然而,在实际工业生产中,工作环境通常较为复杂,很难采集大量拥有标签的样本数据,由于含标签的数据较少,SMM难以利用有限的样本数据构造理想的预测模型。因此,有必要对SMM进行深入研究,提出适合小样本分析的分类方法。

1.2 迁移最小二乘支持矩阵机

为了更好的处理含标签样本稀少时的故障诊断问题,本文提出一种新的模式识别方法——迁移最小二乘支持矩阵机。在TLSSMM目标函数中,σtr[(Ws-Wt)T(Ws-Wt)]为目标域权重矩阵Wt与源域权重矩阵Ws间的差异项,通过最小化该项,以寻找不同域间的相似特征,进而均衡目标域模型与源域模型间的差异。同时,TLSSMM利用最小二乘损失将SMM目标函数中不等式约束项转换为等式约束,使TLSSMM可以直接求解线性方程组,缩短了训练时间,提升了分类效率。

σtr[(Ws-Wt)T(Ws-Wt)]

(3)

式中:Ws为源域中的权重矩阵;Wt为目标域中的权重矩阵;b为阈值;λ为核范数系数;C为损失项系数;σ为域权重矩阵差异项参数。在TLSSMM中,采用ADMM方法进行求解,通过引入辅助变量St,可以将目标函数重新表述为式(4)

(4)

其中

式(4)的增广拉格朗日方程为

L(Wt,St,bt,Λ)=H(Wt,bt)+G(St)+

(5)

式中:Λ为拉格朗日乘子;ρ为超参数。

为求解St和Wt,固定参数Wt,将其看作常数项,等式中的优化问题相当于求解式(6)最小化

(6)

(7)

(8)

优化问题式(8)的拉格朗日函数方程为

σtr[(Ws-Wt)T(Ws-Wt)]+

(9)

根据KKT(Karush-Kuhn-Tucher)条件,可以得到以下方程组计算

(10)

由式(10)可得

(11)

(12)

将式(11)和式(12)代入式(10),消去W和ξi,得到式(13)

(13)

2 实验分析

为了验证本文所提TLSSMM方法的分类性能,使用两类数据集(安徽工业大学滚动轴承振动信号数据集迁移安徽工业大学滚动轴承振动信号数据集+安徽工业大学滚动轴承振动信号数据集迁移凯斯西储大学滚动轴承信号数据集)分别进行分类测试分析,并采用5个指标作为模型评价,即准确率、精确率、召回率、F1得分和Kappa系数。由于TLSSMM方法的输入为矩阵,论文拟采用辛几何相似变换[16]构造矩阵样本,既可以完整的保护信号的特征信息,还具有良好的降噪性能,并能充分利用矩阵的数据结构信息(所有实验均在ADM Ryzen 7 4 800H with Radeon Graphics 2.90 GHz计算机上的MATLAB R2017a运行)。

1.2.1 实验1

在本实验中,拟使用的源域轴承数据和目标域轴承数据皆为安徽工业大学滚动轴承振动信号数据集,滚动轴承为SKF 6206-2RS1/C3深沟球轴承,实验台如图1所示。

图1 安徽工业大学滚动轴承振动信号采集实验台Fig.1 Rolling bearing vibration signal acquisition experimental platform of Anhui University of Technology

实验数据集包含正常、内圈故障、外圈故障、滚动体故障5类状态,其中内圈故障两种、外圈故障两种、滚动体故障和正常状态各一种。在负载为5 kN、转速为900 r/min时,每种状态采集100个训练样本构造源域数据集。同时,在转速为1 500 r/min、负载为5 kN条件下,每种状态采集98个样本(含8个有标签样本和90个无标签样本)构造目标域数据集,有标签样本作为训练样本来迁移更新预测模型,无标签样本作为测试样本集。源域和目标域详细样本信息,如表1所示。

表1 源域和目标域的数据样本详情Tab.1 Data sample details for source and target domains

在TLSSMM分类中,TLSSMM的分类性能与参数λ,C,σ息息相关。λ为核范数系数,其与权重矩阵的秩以及奇异值的数目有关。然而,λ越大,奇异值为0的数目越多,因此,λ的取值不宜较大,本文取值为λ=0.01;C为损失系数,其与模型在训练时的异常值相关;σ为域权重距阵差异项参数,反应两个领域之间数据分布的差异程度,当σ较大时,源域目标域的分类超平面将接近;反之,分类超平面将相对独立。为了使TLSSMM达到最优的分类性能,C的取值范围设置为{10-4,10-1,…,103},σ的取值范围设置为{10-4,10-1,…,103}。通过固定参数λ,逐步选取不同的C和σ进行训练,可得到C×σ个识别结果,如图2所示。最终选择的最优参数为λ=0.01,C=0.1和σ=10。同时,为了验证所提方法的优越性,选择SVM,SMM和SSMM进行对比分析,对SVM,SMM和SSMM方法同样进行参数选优,获得的最优参数,如表2所示。

图2 不同参数下TLSSMM的分类结果Fig.2 Classification results of TLSSMM under different parameters

表2 参数最优选择Tab.2 Optimal selection of parameters

为了得到迁移预测模型,对源域每类数据使用100个样本进行训练,获得初始预测模型;然后随机选择8个目标域样本更新预测模型,达到数据迁移的目的;最后通过比较目标域权重矩阵与源域权重矩阵间的差异性,得到最终预测模型。对最终预测模型使用90个目标域样本进行测试,TLSSMM的识别结果,如图3(a)所示。

(a) TLSSMM

(b) SSMM

(c) SMM

(d) SVM图3 4种方法识别图Fig.3 Identification results of four methods

由图3(a)可知,第2类和第5类出现样本错分现象,但错分的样本数较少。同样,采用SSMM,SMM和SVM分别使用8个目标域样本进行训练得到三种预测模型,用90个样本进行测试,识别效果如图3(b)、图3(c)、图3(d)所示。由图3可知,3种方法都出现了不同程度的错分现象。这是由于在样本标签较少的情况下,SMM所建模型的泛化能力较差,致使其识别率较低。SSMM具有稀疏性,能够消除部分冗余特征,减少对模型建立的干扰,但是效果仍然不理想。虽然SVM是一种小样本分析方法,但其基于特征向量作为输入元素,破坏了数据间的结构信息,无法建立准确的预测模型。TLSSMM采用辛几何相似变换构造轨迹矩阵,既可以完整的保护信号的特征信息还具有良好的降噪功能,同时,通过数据迁移使得模型具有小样本分析能力。因此,TLSSMM模型的泛化能力较好,识别率相对较高。通过实验分析表明,TLSSMM方法的错分率较低,具有优越的小样本分类能力。

为了更进一步的验证所提方法的综合性能,采用5个指标进行评价,表3为4种分类器在5种指标下的对比结果。在TLSSMM中,为了得到近似目标域的预测模型,通过目标域少量含标签的轴承数据微调源域预测模型以此建立新的模型,所以尽管目标域样本个数较少,所提方法仍然具有优异的分类性能。由表3可知,TLSSMM方法在5种指标值下均大于SMM,SSMM和SVM方法,因此,在相同目标域训练样本个数的情况下,TLSSMM方法的分类性能最好。

表3 4种分类方法的性能对比Tab.3 Performance comparison of four classification methods

为了避免偶然性,利用TLSSMM,SSMM,SMM和SVM方法对不同目标域训练样本个数(分别为2个、4个、6个和8个)条件下进行多组实验,分类结果计算平均值后如表4所示。由表4可知,TLSSMM方法在2个样本时准确率最低,在8个样本时准确率最高,且随着样本个数的增加,准确率逐步提高,这是由于TLSSMM是基于迁移的学习方法,具有优越的小样本分析能力,所以在样本标签较少时,其分类性能优于对比方法。同时,TLSSMM方法的计算时间最短为1.317 6 s,最长时间为1.429 4 s;SSMM方法最短时间为41.234 3 s,远远超过TLSSMM方法的计算时间;SVM方法虽然计算时间较短,但是其正确率相对较低;SMM方法最短时间为6.920 5 s,所需时间也较长。究其原因在于TLSSMM方法采最小二乘算法代替铰链损失,只需一次求解即可得出结果,不同于SSMM和SMM方法需要多次迭代求解二次规划,所以计算时间较短。

表4 4种方法不同样本数分类结果Tab.4 Classification results of four methods under different sample numbers

1.2.2 实验2

实验2的源域轴承数据采用实验1的安徽工业大学滚动轴承振动信号数据集,实验数据集包含正常、内圈故障、外圈故障、滚动体故障等4种状态,在转速900 r/min和负载5 kN条件下,每类数据训练样本100个。目标域数据为凯斯西储大学滚动轴承振动数据集,测试轴承为SKF6205-2RSJEM深沟球轴承,实验台如图4所示。

图4 凯斯西储大学滚动数据实验台Fig.4 Rolling data experimental platform of Case Western Reserve University

在实验2中,采集转速为1 772 r/min、负载为1 kN条件下的数据构造目标域数据集,每种状态选择80个作为测试样本,选择8个作为迁移更新模型训练样本。源域和目标域数据集详细信息,如表5所示。

表5 源域和目标域的数据样本详情Tab.5 Data sample details for source and target domains

TLSSMM通过源域的100个样本训练得到预测模型,然后使用8个目标域样本进行更新得到新模型,再用80个目标域测试样本进行分类。同样,利用SMM,SSMM和SVM方法分别使用目标域8个样本进行训练,再用80个样本进行测试,4种分类方法的分类结果混淆矩阵,如图5所示。由图5(a)可知,TLSSMM在第1类出现错分,错分个数较少;图5(b)中的SSMM第2类和第4类出现了严重的错分现象,识别率较低;图5(c)中SMM的分类效果和SSMM方法类似,在第4类出现较多错分现象;图5(d)中SVM除了第1类外,其他3类严重错分,整体识别率较低,这是由于SVM是基于特征向量作为输入,无法保证信号结构信息的完整性。因此,TLSSMM方法的分类性能优于其他3种对比方法。

(a) TLSSMM

(b) SSMM

(c) SMM

(d) SVM图5 4类方法测试结果的混淆矩阵Fig.5 Confusion matrix diagram of test results of four methods

接着,采用5个指标进行模型评价,5种指标对比结果如表6所示。由于在一定范围区间内,5类指标值越大,分类性能越好,所以在样本数较少的情况下,与SMM,SVM和SSMM方法相比,TLSSMM方法通过目标域少量样本更新源域预测模型得到的最终模型具有优异的分类性能。

表6 4种分类方法的分类性能对比Tab.6 Comparison of classification performance of four methods

同样,为了避免偶然性,对4种方法随机选择多组目标域训练样本进行重复实验,得到的多组分类结果如表7所示。TLSSMM方法在8个目标域样本时准确率最高,比SSMM高4.54%,比SMM高7.35%。从对比结果可以看出,TLSSMM方法有效解决了标签样本稀少构建模型的问题。同时,由表7可知,TLSSMM运行所需计算时间比SSMM运行时间快17.421 4 s,比SMM运行时间少1.103 7 s。这是由于TLSSMM方法的目标函数使用最小二乘约束和等式约束,原本复杂的计算问题转换为解一组线性方程组的问题,而SMM和SSMM方法的求解过程是一个二次规划问题,计算过程复杂,所以耗费时间较多。SVM的运算时间虽然最快,但是其准确率较低,无法满足实际诊断的需要。

表7 4种方法不同样本数分类结果Tab.7 Classification result of four methods with different sample numbers

综上所述,通过与SMM,SVM和SSMM方法对比,验证了本文所提迁移最小二乘支持矩阵机方法的分类性能。实验结果表明,TLSSMM方法在训练样本数稀少的情况下构建的模型仍然能够达到较好的分类效果,能够改善当含标签样本较少时难以构建训练模型的问题,同时通过最小二乘算法降低计算复杂度,改善多次迭代求解二次规划问题的复杂计算,缩短了训练时间,为滚动轴承故障诊断提供了一个新的方法。

2 结 论

本文所提TLSSMM从迁移理论角度出发,能够有效的解决实际工业生产中缺乏带标签样本的问题。TLSSMM通过将目标域权重矩阵与源域权重矩阵间的差异尽可能最小化,使得目标域权重矩阵近似等于源域的权重矩阵,利用目标域少量信息更新源域的训练预测模型,从而实现对少标签样本的分类预测;此外,TLSSMM结合最小二乘损失和等式约束,使其只需求解一组线性方程组即可求得权重矩阵和阈值。通过采用两个不同的滚动轴承故障数据集进行验证,实验结果表明,同其他分类方法相比,当带标签样本较少时,TLSSMM具备良好的计算能力和优异的分类性能。

猜你喜欢

源域权重标签
权重望寡:如何化解低地位领导的补偿性辱虐管理行为?*
基于参数字典的多源域自适应学习算法
权重常思“浮名轻”
无惧标签 Alfa Romeo Giulia 200HP
为党督政勤履职 代民行权重担当
不害怕撕掉标签的人,都活出了真正的漂亮
从映射理论视角分析《麦田里的守望者》的成长主题
让衣柜摆脱“杂乱无章”的标签
科学家的标签
组织知识传播与共享评价指标体系及其RS权重配置