APP下载

基于边界判别多流形分析的故障数据集降维方法

2021-12-20常书源赵荣珍何天经石明宽

振动与冲击 2021年23期
关键词:类间流形降维

常书源,赵荣珍,陈 博,何天经,石明宽

(兰州理工大学 机电工程学院,兰州 730050)

旋转机械振动信号蕴含表征设备工作状态的大量信息,对其进行多角度、多侧面特征提取是故障诊断领域中的常用方法[1]。但由多角度提取出的特征构造的高维特征集中往往包含大量的冗余信息,这无疑降低了数据的可区分度,为基于数据驱动的智能决策带来极大的挑战[2]。因此,数据降维方法受到研究者的广泛关注。

流形学习能够从高维数据中获取数据间有效的内部联系,从而得以保持数据的局部或全局结构特征,具有良好的属性约简能力[3]。若按照流形的构造方式进行划分,流形学习可分为单流形学习和多流形学习两类。经典的流形学习方法如等距映射[4],局部线性嵌入[5],局部保持投影[6]等,均为单流形学习方法,它们假设数据分布于同一个流形上,并以此作为建模依据,保证数据从高维空间映射至低维子空间时内部结构保持不变。然而已有研究表明,旋转机械具有复杂的故障机理,并非所有的故障都存在于同一流形,在诊断过程中使用单流形方法势必会影响辨识精度的进一步提升[7]。由此,面向分类的多流形学习方法成为故障数据集降维研究的主流方向。典型的多流形学习方法如边缘费歇尔分析(marginal Fisher analysis,MFA)[8-9],无参判别多流形学习(nonparametic discriminant multi-manifold learning,NDML)[10],协同判别流形嵌入[11],多流形局部图保持分析[12]和监督多流形鉴别嵌入[13]等,均是根据类信息定义流形间图和流形内图,然后利用相应的拉普拉斯图谱来搜索最优投影。现有的多流形图嵌入方法虽然能够使得投影后同类样本离得更近,异类样本离得更远,却不能保证多个流形间具有明确的界限,以使样本具有较好的可分性[14]。

边界判别投影(margin discriminant projection,MDP)[15]利用标记信息定义了数据的类内距离、类间距离和边界,且对数据的分布没有特定假设,计算简便。但MDP仅考虑了类间判别信息,未考虑数据结构信息,在降维过程中会扭曲数据的内部结构,进而影响降维后数据的可辨识度。因此,本文结合多流形学习和边界思想,提出一种新的边界判别多流形分析(margin discriminant multi-manifold analysis,MDMA)方法。MDMA方法考虑类内相似性,类间差异性,同类流形结构和异类流形结构,为避免出现小样本问题,将这4点归结为指数化[16]迹商优化结构,使投影后不同类数据流形尽可能相互独立的同时,类内距离最小化,类间距离最大化,能够更好地服务于分类目的。

鉴于上述分析,本研究拟对基于MDMA的故障数据集降维方法进行探讨,欲为故障数据集有效分类信息的获取,提供一种参考思路。

1 基本原理简介

1.1 边界的定义

MDP方法采用边界样本点来定义样本间的边界,并以此描述高维数据集的判别结构。本节介绍MDP方法中边界点和边界的定义。

定义1设定xi,xj为样本集X中的任意两个样本点,它们之间的距离定义为

(1)

(2)

Ci的类内距离定义为

(3)

∀xi∈Ci,xj∈Cj}

(4)

Ci和Cj的类间距离定义为

(5)

同类边界点和异类边界点统称为边界点。

(6)

1.2 多流形思想

MFA、NDML等多流形分析方法认为,在多分类问题中,并非所有类别的数据都分布于同一流形上,若使用单流形方法可能会在一定程度上破坏数据结构,进而对后续的模式辨识造成不利影响。因此多流形分析方法均采用构造同类本征图与异类惩罚图的形式来模拟多流形的分布。

1.3 指数化矩阵的性质

2 提出的边界判别多流形分析方法

在MDP方法降维的过程中,只关注数据的边界信息,忽略了数据的局部几何结构信息,从而导致原始样本点之间的局部几何拓扑结构发生扭曲,降低投影后数据的识别精度。而现有的多流形分析方法只强调令同类样本靠近,异类样本远离,但未考虑发生在不同类流形之间的混叠问题。因此,本研究将边界思想与多流形思想融合,提出一种边界判别多流形分析方法。该方法同时考虑了数据的边界相似性、边界判别性、类内局部相似性和类间局部差异性,采用图嵌入准则进行数据建模,设置正则化参数来平衡优化模型,避免出现冗余优化,并且采用指数化迹商方式构造目标函数以解决降维过程中可能出现的小样本问题。

2.1 MDMA图嵌入方法设计

2.1.1 相似边界图嵌入模型

相似边界图定义为G(MS)={X,W(MS)},用于描述同类样本点之间的相似性,其中的权值矩阵W(MS)定义为

(7)

(8)

式(8)可改写为

min tr(ATXL(MS)XTA)

(9)

2.1.2 判别边界图嵌入模型

判别边界图定义为G(MD)={X,W(MD)},用于描述异类样本点之间的差异性,其中的权值矩阵W(MD)定义为

(10)

(11)

式(11)可改写为

max tr(ATXL(MD)XTA)

(12)

2.1.3 类内局部相似图嵌入模型

类内局部相似图定义为G(LS)={X,W(LS)},用以描述局部邻域中同类样本点的分散程度,距离较近的点之间具有较大的相似性,其中的权值矩阵W(LS)定义为

(13)

式中,Nsk(xi)为距离xi点最近的k个同类样本点组成的集合。构建类内局部相似图可以在降维过程中保持同类样本之间的相似性和类内局部结构在投影后不发生扭曲,其图嵌入模型可定义为

(14)

同样,式(14)可改写为

min tr(ATXL(LS)XTA)

(15)

2.1.4 类间局部差异图嵌入模型

类间局部差异图定义为G(LD)={X,W(LD)},用以描述局部邻域中异类样本点的分散程度,起惩罚图的作用,异类近邻点之间应具有较大的相异性,因此,定义权值矩阵W(LD)为

(16)

式中,Ndk(xi)为距离xi点最近的k个异类样本点组成的集合。构建类间局部差异图可以在降维过程中保持异类样本之间的差异性和类间局部结构在投影后不发生扭曲,其图嵌入模型可定义为

(17)

其目标函数可写为

max tr(ATXL(LD)XTA)

(18)

权值式(7)和式(11)为引用边界判别投影(MDP)方法的权值公式,其中两种边界点的权值为1保持不变。本文提出的MDMA方法最终以服务分类为目的。对分类而言,边界点的作用要大于近邻点,因此边界点需要一个相对较大的权值,以保证在后续图嵌入模型融合时,边界点的作用能够充分发挥。换言之,式(13)和式(16)中两种近邻点的权值应较边界点小,设置为1/2。

2.2 构造的MDMA模型

为解决降维过程中可能出现的小样本问题,采用指数化迹商方法构造MDMA的目标函数。将目标函数式(9)、式(12)、式(15)和式(18)进行融合,可得MDMA方法的目标函数式

max tr(ATXLXTA)

(19)

式中:L=exp(L(MD)+αL(LD))[exp(L(MS)+βL(LS))]-1;exp(·)为指数化矩阵。参数α和β为两个正则化项(α,β∈[0,1]),用以平衡优化过程,防止出现冗余优化。其中:α为类间局部差异性在降维过程中的贡献度;β为类内局部相似性在降维过程中的贡献度。α越大,表明类间局部差异性在降维时起的作用越大;β越大,表明类内局部相似性在降维中起的作用越大。α和β的值可采用交叉验证方法选取。

2.3 MDMA方法的实现步骤

为降低计算复杂度,MDMA采用QR分解代替传统特征分解进行加速计算。

输入:D维空间数据样本集X={x1,x2,…,xn}∈RD,及其类别标签,低维特征空间目标维数d(d

输出:投影转换矩阵A,低维特征向量Y。

步骤1归一化处理原始高维数据集X,设定近邻数k,并分别计算相似边界图G(MS)、判别边界图G(MD)、类内局部相似图G(LS)和类间局部差异图G(LD)。

步骤2根据式(9)、式(12)、式(15)和式(18)计算出4种图的拉普拉斯矩阵L(MS)、L(MD)、L(LS)和L(LD),从而构造式(19)中MDMA目标函数的拉普拉斯矩阵L。

步骤3对样本集X进行QR分解,记作X=QR。

步骤4根据步骤2结果,计算RLRT,并对其进行特征分解。将分解得到特征值降序排列,取前d个特征值所对应的特征向量组成投影转换矩阵A=[a1,a2,…,ad]。

步骤5根据式Y=ATX,得到低维数据Y。

3 建立的基于MDMA的故障数据集降维方法

3.1 基于MDMA的故障数据集降维方法流程

基于MDMA的故障数据集降维方法设计流程图,如图1所示。首先,采集转子振动信号,利用文献[17]中的混合滤波方法对其进行消噪处理,并从不同侧面进行特征提取,建立高维故障特征集;然后将高维特征集输入MDMA进行维数约简,得到低维特征子集;最后将低维特征子集输入K-近邻分类器(K-nearest neighbour,KNN)进行模式辨识。

图1 基于MDMA的数据集降维方法流程图Fig.1 The flow char of dimension reduction method for data set based on MDMA

3.2 确定的降维评价指标

为实现故障数据的可视化,量化数据降维的效果,本文采用聚类分析中的Sb/Sw值作为降维评价指标。Sb/Sw越大,表明类内散度越小,类间散度越大,降维效果就越好;反之,降维效果就越差。Sb与Sw的计算方式为

(20)

(21)

故障数据集降维的最终目标是实现分类。由于KNN算法具有使用简单与准确率高的优点,选用KNN来验证降维所得低维特征子集的可分性。

4 试验结果与分析

4.1 实验Ⅰ

4.1.1 实验Ⅰ数据简介

本节试验的研究对象为图2所示的双跨度转子试验台,该试验台上12个电涡流传感器布置在6个关键面处相互垂直的方位上,通过不同方位采集转子系统的振动信号。在采样频率为5 kHz,转速为2 800 r/min的状态下分别模拟(转子不对中,质量不平衡,动静碰磨,支撑松动,正常)5种典型的转动状态。采集每种状态的数据样本80组,其中20组作为训练样本,60组作为测试样本。对每个通道的传感器拾取的振动信号按照表1提取时域、频域和时频域共35个统计特征参数,12个通道得到共计12×35=420个特征。

图2 双跨度转子试验台Fig.2 Double-span rotor test bench

表1 特征参数Tab.1 Characteristic parameters

将得到的高维特征集输入MDMA进行降维处理,选取LPP、MFA、MDP 3种方法进行对比。所有降维方法的目标维数参考文献[18],设置为4维(即d=状态类别-1=5-1=4)。其余参数采用交叉验证选取,MDMA中类内局部相似图和类间局部差异图的近邻参数选取为k1=6;正则化因子选取为α=0.3、β=0.7;KNN的近邻参数选取为k2=5。

4.1.2 可视化降维效果对比

将高维特征集输入MDMA等4种方法进行维数约简(为避免出现小样本问题,特征集输入LPP与MFA前经PCA预处理),测试样本经上述4种方法降维后的前3个主成分低维嵌入效果,如图3所示。

(a)LPP

由图3可以看出:LPP的可视化效果最差;MDMA可视化效果最好,降维后各故障状态类内明显聚集,类间明显分离且边界清晰,不同数据流形相互独立。除了MDMA方法,其余3种降维方法降维后故障状态类别之间都有不同程度的混叠。碰磨状态降维效果最好,不平衡、松动和正常3种状态降维效果较差。

4.1.3 评价指标与辨识精度对比

计算MDMA等4种方法降维所得低维特征子集的Sb/Sw指标,并同时计算低维特征子集输入KNN所得的辨识精度,以此进行方法的有效性评估。不同方法得到的Sb/Sw指标与KNN辨识精度,如表2所示。

表2 Sb/Sw指标与KNN辨识精度1Tab.2 Sb/Sw index and KNN identification accuracy 1

由表2可知:LPP的降维效果与识别精度最差,这是由于LPP属于无监督方法,并且只单方面关注数据的局部信息,丢失了大量对数据分类有用的信息;MFA的降维效果优于LPP,但由于降维时出现小样本问题,经PCA预处理后丢失了部分有用的判别信息,效果较MDP差。MDP能够避免小样本问题,并且在降维过程中利用数据的先验信息划分边界,因此降维效果与识别效果较LPP与MFA好。MDMA能够在降维的同时保持数据内部的边界信息和本征结构信息,并以此提升数据的可分性,同时也能够避免小样本问题,其评价指标和分类识别精度均为4种方法中的最高值,说明MDMA是一种有效的降维方法。

4.2 试验Ⅱ

4.2.1 试验Ⅱ数据简介

本节以图4所示的HZXT-DS-001型双跨度转子试验台为试验对象,在转速为3 200 r/min,采样频率为20 kHz的条件下,通过在转子上固定不同数量的质量块(每个质量块为12 g),分别模拟6种转子质量不平衡状态的试验,不平衡的设置方式如表3所示。试验共采集14个通道的信号,前12个通道为4个轴承座振动信号,测取每个轴承座两个径向方向(X,Y)和一个轴向方向(Z)的振动信号,由加速度传感器测得,第13和第14通道为转轴的径向振动,由非接触式电涡流传感器测得。同样采集每种状态的数据样本80组,选取其中20组用以训练,60组用以测试,并对每个通道采集的信号按表1提取振动信号的各项特征,拓展至14个通道,构造14×35=490维的混合域特征集。

图4 HZXT-DS-001型双跨度转子试验台Fig.4 HZXT-DS-001 double-span rotor test bench

表3 6种不平衡设置方式Tab.3 Six unbalanced settings

将得到的高维特征集输入MDMA进行降维处理,选取LPP、MFA、MDP 3种方法的降维效果进行对比。降维的目标维数设置为d=6-1=5维,其余参数采用交叉验证选取,MDMA中类内局部相似图和类间局部差异图的近邻参数选取为k1=6;正则化因子选取为α=0.3、β=0.8;KNN的近邻参数选取为k2=5。

4.2.2 可视化降维效果对比

将高维特征集输入MDMA等4种方法进行降维处理(为避免出现小样本问题,特征集输入LPP与MFA前经PCA预处理),测试样本经上述4种方法降维后的前3个主成分低维嵌入效果,如图5所示。

(a)LPP

由图5可以看出:经4种方法降维之后,6种不平衡状态类别之间皆有不同程度的混叠,其中LPP混叠最严重,不平衡2、不平衡4和不平衡5未分离;MDMA混叠最轻微,不平衡3和不平衡4之间存在少许混叠,其余4种状态完全分离,类间距明显,类间边界清晰。

4.2.3 评价指标与辨识精度对比

计算上述4种方法降维所得低维特征子集的Sb/Sw指标,并同时计算低维特征子集输入KNN所得的辨识精度,以此进行方法的有效性评估。不同方法得到的Sb/Sw指标与KNN辨识精度,如表4所示。

表4 Sb/Sw指标与KNN辨识精度2Tab.4 Sb/Sw index and KNN identification accuracy 2

由表4可知:LPP的降维与识别效果最差;MDMA的降维与故障识别效果最好,与KNN结合能够有效诊断转子故障,具有一定优势。

4.2.4 不同工况下降维效果对比

为进一步验证MDMA的降维性能,在不同工况下(改变试验台转速,分别设置2 800 r/min,3 200 r/min和3 600 r/min 3种工况)采集6种不平衡状态的振动数据,取40组3 200 r/min工况下数据作为训练样本,再分别取40组3种工况下数据为测试样本进行试验。各工况振动数据经LPP、MFA、MDP和MDMA 4种方法降维后的KNN辨识结果,如表5所示。

由表5可知,变工况下(2 800 r/min和3 600 r/min)基于不同降维方法的辨识精度均有所降低,但MDMA的识别精度优于其他3种方法,并且降低幅度较小,说明MDMA方法具有较好的降维能力与适应性。

表5 4种方法在不同工况下的KNN辨识精度Tab.5 KNN identification accuracy of four methods under different working conditions

5 结 论

本文将多流形思想与边界思想相结合,提出一种新的边界判别多流形分析方法。该方法同时考虑了数据的类内相似性、类间差异性、同类流形结构和异类流形结构,能够使降维后数据的类间距离最大化,类内距离最小化;并且在构造目标函数时采用指数化迹商优化结构,避免了降维过程中出现小样本问题。对振动信号从多域、多通道进行特征提取,构造高维故障特征集,将其输入MDMA进行维数约简;最后将得到的低维特征子集输入KNN模式识别,同时采用Sb/Sw评价指标对MDMA的降维性能进行评估。通过两个转子试验台实测数据的试验验证表明,MDMA方法相比其他方法能够使类间分离和类内聚集效果明显提高,类间边界更加明显,更有利于故障状态的判别。

猜你喜欢

类间流形降维
混动成为降维打击的实力 东风风神皓极
基于OTSU改进的布匹检测算法研究
基于贝叶斯估计的多类间方差目标提取*
紧流形上的SchrÖdinger算子的谱间隙估计
降维打击
迷向表示分为6个不可约直和的旗流形上不变爱因斯坦度量
Nearly Kaehler流形S3×S3上的切触拉格朗日子流形
基于类间相对均匀性的纸张表面缺陷检测
基于改进最大类间方差法的手势分割方法研究
一种改进的稀疏保持投影算法在高光谱数据降维中的应用