APP下载

基于多尺度正交PCA-LPP流形学习算法的故障特征增强方法

2015-06-04张晓涛唐力伟邓士杰

振动与冲击 2015年13期
关键词:流形投影尺度

张晓涛,唐力伟,王 平,邓士杰

(军械工程学院 火炮工程系,石家庄 050003)

多尺度主元分析(MSPCA)是一种典型的多元统计过程监控方法[1],通过数据的分布信息进行统计建模和描述数据的主要特征。李宏坤等[2]将MSPCA应用于滚动轴承故障增强检测中,使故障信号包络谱中故障谱线得到明显增强,尹刚等[3]将MSPCA用于发动机缸盖振动信号特征增强中,使得发动机不同故障的识别率得到显著提高。主元分析PCA方法适宜描述数据的全局分布方差,使数据在投影后空间沿坐标轴的分布方差最大,但投影过程中无法保证数据的局部非线性特征不变,对于含有非线性成分的数据MSPCA方法的效果有限,因此MSPCA需要在数据非线性特征保持方面做出相应的改进处理。

局部保持投影(LPP)是一种典型的流形学习局部特征非线性保持投影算法[4],由 He等[5]在拉普拉斯特征映射的基础上提出,局部保持投影在数据处理过程中能够保持数据样本局部流形结构不变,最早应用于人脸识别领域。文献[4]中论述LPP在投影过程最优保持了数据的局部邻域关系,可以发现数据的非线性流形。文献[6]中的局部保持PCA算法研究表明PCA融合局部保持投以可以实现整体方差最大以及局部邻域结构不变,由此可知LPP具有较强的数据局部非线性特征保持能力,但却在数据的全局分布特征把握上则效果不佳。文献[7]中进行了PCA与LPP联合的图像重构研究,该研究方法首先对高维图像数据进行PCA降维处理,然后再进行LPP降维处理,是PCA与LPP顺序结合的应用。

实际应用中,LPP需要引入相应处理,提高其全局信息处理能力。本文提出一种多尺度正交PCA-LPP特征增强方法,兼顾PCA的全局方差增强,以及LPP的局部非线性特征保持能力,结合小波包分解实现单维故障信号的多维构造及特征投影增强,通过投影矩阵特征值累积率区分有用特征成分子空间以及干扰成分子空间,并正交化处理消除投影分量间的信息冗余,通过重构拟合有用特征成分子空间得到特征增强信号,齿轮箱故障声发射实测信号处理结果表明,信号故障特征得到显著增强,表现在故障信号包络谱中谱线明显增强以及多样本的故障类型辨识率明显提升两个方面。

1 正交PCA-LPP流形学习算法

正交PCA-LPP流形学习算法是一种综合PCA和LPP两种方法特点的流形学习算法,能够在投影过程中实现数据分布的整体分布方差最大以及局部非线性流形结构保持。设高维空间RD中存在数据集X=[x1,x2,…,xN],正交PCA-LPP流形学习算法的目标是寻找投影矩阵W,将数据集X转换到低维投影空间Rd(d<D)中,d为有用特征成分子空间维度,通过Y=WTX实现有用信号成分与噪声干扰成分的有效分离。正交PCA-LPP流形学习算法的原理分析均是在此假设数据集基础上进行。

1.1 PCA全局方差最大目标函数

PCA寻找数据分布方差最大的坐标系,通过投影矩阵W实现数据集从原坐标系到新坐标系的变换,实现沿坐标轴方向的整体分布方差最大,其投影矩阵W的求取目标函数如式1所示[6]。

其中

PCA全局方差最大目标函数仅考虑数据的线性空间投影,通过在投影空间保留数据集的大部分方差信息,实现全局分布特征的增强,但PCA全局目标函数中没有考虑样本之间的局部几何关系,投影后数据的局部非线性信息丢失严重,对内含非线性成分的数据PCA方法处理效果较差。

1.2 LPP局部流形保持目标函数

局部保持投影LPP是一种非线性局部流形保持投影算法,能够使投影前后的数据局部近邻结构相似,其投影矩阵W的求取目标函数如式(2)所示[8]。

其中:sij为权重系数,所有权重系数构成权重矩阵S,对角矩阵Dii=∑jsij,L为拉普拉斯矩阵,权重系数sij由自适应邻域构造SG方法[9]进行构造,其具体计算原理如式(3)所示。

局部保持投影LPP在数据投影空间变换过程中,能够尽可能的保持数据局部流形结构相似,使数据局部细节特征得到保留增强,但局部目标函数没有考虑样本的全局分布特征,有可能导致数据全局特征投影后发生扭曲失真。

1.3 正交PCA-LPP整体投影目标函数

结合PCA全局方差最大目标函数与LPP局部流形保持目标函数,基于最大边缘准则[10]构造PCA-LPP整体目标函数,如式(4)所示,该目标函数同时考虑了PCA与LPP方法的特性,能够实现投影后数据特征的全面增强。

其中限定条件WTXDXTW=I可消除随机尺度因子的影响。

全局目标函数结合了PCA与LPP的投影目标函数,投影过程能够尽可能实现数据内含特征的增强,为进一步减小投影后数据集分量间的信息冗余,在计算第k投影分量过程中引入正交约束,如下所示:

其中:wk为投影矩阵W的某一列向量。

正交PCA-LPP的投影矩阵W通过联立求解式(4)和式(5)得到,应用拉格朗日乘子法[11]将上面两式转化为有约束最大值问题,则第k个投影分量约束函数如式(6)所示。

将上式的L(wk)对wk求导并置零后得到:

定义矩阵形式变量 Uk-1=[μ1,μ2,…,μk-1]T,Wk-1=[w1,w2,…,wk-1],将式(8)的联立形式改为矩阵形式如下:

由式(9)可得Uk-1的计算表达式如下:

对式(7)左乘(XDXT)-1可以得到下式:

联立式(10)和式(11)可得下式:

通过式(12)求解特征值对应特征向量即可求解W的第k个投影分量。

总结正交PCA-LPP流形学习算法的实现步骤如下:

(1)已知样本X,根据式(1)计算构造全局方差最大目标函数Jg(W);

(2)根据式(3)计算相似权重矩阵S,并根据式(2)构造局部流形保持目标函数Jl(W);

(3)根据式(4)构造整体投影目标函数J(W),并根据式(6)构造最大值目标函数;

(4)正交投影矩阵 W=[w1,w2,…wk]的各个投影分量通过迭代方式求解:

① w1为矩阵(XDXT)-1(Cu+Cl-XLXT)最大特征值对应的特征向量;

② wk为式(12)最大特征值对应的特征向量;

(5)根据映射Y=WTX,得到投影空间转换后的数据集。

2 多尺度正交PCA-LPP特征增强原理

多尺度正交PCA-LPP特征增强方法基于小波包实现原始故障信号的多尺度分解,小波包分解能够提供比小波分解更加精细的频带划分能力,利用各子频带小波包系数重构分量将单维故障信号组成多维重构信号。文献[12]认为工业过程数据是多尺度分布的,且存在潜在缓变和微小故障信息,多尺度正交PCA-LPP流形学习算法是一种基于信号多尺度分布的非线性投影处理,通过在投影过程中区分有用信号成分子空间与噪声干扰成分子空间,从而在低维有用信号子空间重构原始信号实现故障特征的分离增强。有用子空间的维度通过投影矩阵W各分量对应特征值的大小进行确定,矩阵W各分量对应的特征值向量为λ=[λ1,λ2,…,λk],有用信号子空间维数 d通过式(13)进行确定。

其中:η为投影分量特征值累积率,一般取0.95。根据确定出的投影空间维数d,可知有用信号子空间的投影矩阵为 W=[w1,w2,…wd],有用信号成分通过Y=WTX投影计算得到。

多尺度正交PCA-LPP特征增强方法流程如图1所示。首先对原始数据y进行n层小波包分解,在各个子频带内重构小波包系数得到2n个多尺度分量Cn0,…,Cni,…,Cnk,其中 k=2n-1,i=0,…,k。将 2n个多尺度分量重构成的多维信号,经多尺度正交PCA-LPP特征增强方法处理,得到)k个有用信号子空间的低维投影正交分量,…,…。参照文献[13]的处理方法,将)k个正交投影分量经多元多项式拟合重构得到一维信号,即为故障特征增强信号。由于个分量为正交投影分量,所有多项式拟合如式(14)所示。

其中:ωi为权值,权值满足ωi>0且∑ωi=1。

图1 多尺度正交PCA-LPP方法流程Fig.1 Flow chart of multiscale orthogonal PCA-LPP algorithm

多尺度正交PCA-LPP方法在数据投影中,兼顾了PCA与LPP的优点,具备PCA方法投影数据整体分布方差增大,以及LPP方法局部非线性流形结构保持的双重特点,同时正交化处理使投影后各分量之间无冗余信息。处理后信号的特征增强表现在两个方面,一是包络谱中故障谱线增强,二是多样本故障类型识别率提升。

3 实验信号分析

采用齿轮箱故障声发射实测数据对正交PCA-LPP方法的特征增强性能进行检验,实验齿轮箱为二级减速器,一级减速比为1∶2,故障轴承设置为中间传动轴单端轴承,型号6206,故障齿轮为中间传动轴大齿轮。齿轮箱原理结构及传感器安装如图2所示。

图2 齿轮箱结构及传感器布置Fig.2 Gearbox structure and sensor arrangement

3.1 故障特征增强检测分析

检测中设置轴承外圈故障和齿根裂纹故障,采集传感器为声华R15声发射传感器,全波形采集仪采样频率1 MHz,两种故障形式的输入轴转速均为1490 r/min,由轴承国标参数以及故障频率计算公式可知外圈故障频率fouter=44.46 Hz,齿轮故障频率fgear=12.42 Hz。两种故障的原始采样信号及其包络谱如图3和图4所示。

从图3和图4中可以看出,外圈及齿轮故障原始信号的包络谱中干扰成分较多,故障频率处谱线非常不明显,无法识别故障频率fouter和fgear。对原信号采用db4小波,分解层数为3层,取η=0.95,多尺度正交PCA-LPP处理后得到的信号及其包络谱如图5和图6所示。

图3 外圈故障原始信号及其包络谱Fig.3 Original signal and envelope spectrum of outer ring fault

图4 齿轮故障原始信号及其包络谱Fig.4 Original signal and envelope spectrum of gear tooth fault

图5 外圈故障处理信号及其包络谱Fig.5 Processed signal and envelope spectrum of outer ring fault

图6 齿轮故障处理信号及其包络谱Fig.6 Processed signal and envelope spectrum of gear tooth fault

从图5和图6中可以看到,经过多尺度正交PCALPP方法处理后的信号,由于投影空间的变换以及信号的多项式重构,故障增强后信号的幅值不再具有原始幅值的物理意义,但信号频率成分依然反映故障的特征信息[2-3,13]。图 5 中包络谱在 44.82 Hz(≈fouter=44.46 Hz)及其倍频处有明显谱线,可以清晰识别故障类型属于外圈故障,图6中包络谱在12.4 Hz(≈fgear=12.42 Hz)及其倍频处有明显谱线,可以清晰地识别出齿轮故障。

3.2 故障特征增强识别分析

故障类型识别中设置正常状态,轴承内圈故障,外圈故障,齿根裂纹四种故障类型。轴承内外圈裂纹以及齿根裂纹如图7所示,其中轴承内外圈故障类型为0.4mm宽,1mm深的线切割裂纹,齿根裂纹为0.2mm宽,1mm深的线切割裂纹。故障轴承以及故障齿轮位置与3.1中相同。

图7 轴承及齿轮故障Fig.7 Bearing and gear failure

实验中每种故障类型采集70个样本数据,共计280个样本,单个样本长度1 s。经过多尺度正交PCALPP方法(参数设置与3.1相同)处理后的信号幅值不具有明确的物理意义,故考虑提取信号的频域特征参数进行不同故障类型的识别。对特征增强后的信号y*再次进行db4小波包3层分解,重构各子频带小波包系数,得到8个子频带重构分量,计算子频带信号能量,得到能量特征向量 E=[E1,E2,…,E8],求取 8 个信号的能量熵作为特征向量[14],能量熵的计算如式(15)所示。

为研究多尺度正交PCA-LPP算法的性能,参照文中算法流程,比较文中算法、多尺度PCA方法、多尺度LPP方法及k近邻多尺度正交PCA-LPP算法处理后信号以及原始故障信号提取的8维能量熵特征向量的故障辨识情况。每种故障70个样本中,30个用于训练支持向量机分类器,其余40个样本用于测试分类器的故障辨识效果。分类辨识运算环境为3 GHz i5 CPU,4 G RAM,win7以及matlab R2009b。五种情况下提取的特征参量的故障识别率如表1所示。

表1 故障类型辨识率/%Tab.1 Fault identification rate/%

表1中故障整体识别率为各故障单项识别率的均值,表示四种故障类型正确识别的总数占160个测试样本的比例。其中k近邻多尺度正交PCA-LPP算法中设置邻域值k的范围为10~60,间隔为1,迭代寻找故障整体识别率最高的邻域值,最终得到k=42。从表1中可以看到多尺度正交PCA-LPP特征增强后的故障特征,其整体辨识率最高,可达93.75%,原始故障信号直接提取特征的整体辨识率最低,仅为43.75%。多尺度PCA与多尺度LPP方法处理后信号的提取特征的故障整体辨识率分别为78.13%和84.38%,k近邻多尺度正交PCA-LPP方法处理后信号的故障特征辨识率为89.38%。多尺度PCA与多尺度LPP方法与文中方法故障识别率的比较表明,文中方法由于能够兼顾PCA与LPP的全局和局部特性,因此处理后信号中的故障特征增强更加全面,所以识别率更高。k近邻方法与文中方法的比较结果表明,自适应邻域构造SG方法的引入能够根据样本的特点自适应选择近邻数,比之k近邻方法更好的保持了样本的局部流形信息,因而故障识别率进一步提高,并克服了k近邻方法迭代选择近邻数的问题。

4 结论

文中提出一种兼顾PCA与LPP特点的正交PCALPP非线性流形学习算法,并给出相应的理论计算模型,结合小波包分解,实现单维信号的故障特征重构投影,从而增强故障特征信息,从信号故障谱线增强和故障类型辨识率提升两方面进行了比较研究,主要有以下结论:

(1)多尺度正交PCA-LPP结合了PCA的全局分布方差增大和LPP的局部非线性特征保持能力,处理后的故障信号包络谱中故障谱线明显增强。

(2)对故障信号进行多尺度正交PCA-LPP特征增强处理后,提取小波包能量熵特征进行故障类别辨识的结果表明,增强后提取的故障特征向量分类更清晰,对应的故障类型识别率明显提高。

[1]李晗,萧德云.基于数据驱动的故障诊断方法综述[J].控制与决策,2011,26(1):1 -9.LI Han,XIAO De-yun.Survey on data driven fault diagnosis methods[J].Control and Decision,2011,26(1):1 -9.

[2]李宏坤,赵长生,周帅,等.基于小波包-坐标变换的滚动轴承故障特征增强方法[J].机械工程学报,2011,47(19):74-79.LI Hong-kun,ZHAO Chang-sheng,ZHOU Shuai,et al.Fault feature enhancement method for rolling bearing based on wavelet packet-coordinate transformation[J].Journal of Mechanical Engineering,2011,47(19):74 -79.

[3]尹刚,张英堂,李志宁,等.基于MSPCA的缸盖振动信号特征增强方法研究[J].振动与冲击,2013,32(6):143-147.YIN Gang,ZHANG Ying-tang,LI Zhi-ning,et al.Fault feature enhancement method for cylinder head vibration signal based on multiscal principal component analysis[J].Journal of Vibration and Shock,2013,32(6):143 -147.

[4]赵振华,郝晓弘.局部保持鉴别投影及其在人脸识别中的应用[J].电子与信息学报,2013,35(2):463-466.ZHAO Zhen-hua,HAO Xiao-hong.Linear locality preserving and discriminating projection for face recognition[J].Journal of Electronics& Information Technology,2013,35(2):463-466.

[5]He X F,Niyogi P.Locality preserving projections[A].Neural Information Processing Systems16[C].Vancouver.MIT Press,2004:153 -160.

[6]王健,冯健,韩志艳.基于流形学习的局部保持PCA算法

在故障检测中的应用[J].控制与决策,2013,28(5):684.WANG Jian,FENG Jian,HAN Zhi-yan.Locally preserving PCA method based on manifold learning and its application in fault detection[J].Control and Decision,2013,28(5):684.

[7]Zhang Z H,Zhu X Z,Zhao J M,etal.Image retrieval based on PCA-LPP[A].201110th International Symposium on Distributed Computing and Applications to Business,Engineering and Science[C].Wuxi,Jiangsu,China,2011:230-233.

[8]李锋,汤宝平,宋涛,等.归一Laplacian矩阵有监督最优局部保持映射故障辨识[J].机械工程学报,2013,49(13):100-106.LI Feng, TANG Bao-ping, SONG Tao, et al. Fault identification method based on normalized laplacian-based supervised optimal locality preserving projection[J].Journal of Mechanical Engineering,2013,49(13):100 -106.

[9]Yang B,Chen S C.Sample-dependent graph construction with application to dimensionality reduction [J].Neurocomputing,2010,74(5):301 -314.

[10]袁暋,程雷,朱然刚,等.一种新的基于MMC和LSE的监督流形学习算法[J].自动化学报,2013,39(12):2076-2079.YUAN Min,CHENG Lei,ZHU Ran-gang,et al.A new supervised manifold learning algorithm based onmmC and LSE[J].Acta Automatica Sinica,2013,39(12):2076-2079.

[11]宋涛,汤宝平,李锋.基于流形学习和K-最近邻分类器的旋转机械故障诊断方法[J].振动与冲击,2013,32(5):149-153.SONG Tao, TANG Bao-ping, LI Feng. Fault diagnosis method for rotating machinery based on manifold learning and K-nearest neighbor classifier[J].Journal of Vibration and Shock,2013,32(5):149 -153.

[12]Manish M,Henry,Joe Q S,et al.Multivariate process monitoring and fault diagnosis by multi-scale PCA[J].Computers and Chemical Engineering,2002,26(9):1281-1293.

[13]张赟,李本威.基于最大方差展开的非线性信号降噪方法及其在故障诊断中的应用[J].中国科学,2010,40(8):940-945.ZHANG Bin, LI Ben-wei. Noise reduction method for nonlinear signal based on maximum variance unfolding and its application to fault diagnosis[J].Sci China Tech Sci.,2010,40(8):940-945.

[14]李城梁,王仲生,姜洪开,等.自适应Hessian LLE在机械故障特征提取中的应用[J].振动工程学报,2013,26(5):758-763.LI Cheng-liang,WANG Zhong-sheng,JIANG Hong-kai,et al.Adaptive Hessian LLE in mechanical fault feature extraction [J]. Journalof Vibration Engineering,2013,26(5):758-763.

猜你喜欢

流形投影尺度
多重卷积流形上的梯度近Ricci孤立子
全息? 全息投影? 傻傻分不清楚
财产的五大尺度和五重应对
基于最大相关熵的簇稀疏仿射投影算法
局部对称伪黎曼流形中的伪脐类空子流形
找投影
找投影
对乘积开子流形的探讨
宇宙的尺度
9