APP下载

基于非负Tucker 3分解的稀疏分量分析在故障信号提取中的应用

2013-12-23王海军许飞云

关键词:张量齿轮箱高斯

王海军 许飞云

(东南大学机械工程学院,南京211189)

Tucker 3分解模型是Tucker[1]针对多维数据降解而提出的一种高效数学分解模型.随着计算机技术的发展,在交替最小二乘算法的基础上,Paatero等[2]建立了三维CANDECOMP/PARAFAC(CP)并行计算模型,CP模型对非负分解算法的发展起到了很大的推动作用.从实体数据的有效性出发,Lee等[3]提出并证实了非负矩阵分解方法对图像的局部特征具有良好的解释性.自此,非负矩阵分解方法在盲信号处理、图像特征提取、神经系统学和化学计量学等领域中得到了广泛的应用.目前,对三维目标特征的局部化处理和分类仍然是研究中的热点和难点.这样便引出了对算法的稀疏性控制优化等方面的研究.在特征稀疏性处理上比较典型的研究主要包括利用拉格朗日优化、增加并行因子补偿项和稀疏性控制项等方法来表达固有分量的特征[4-9].在较小规模数据的计算上,这些方法能达到预期的目的.但是,对于高维大规模数据的计算往往会带来收敛速度慢和局部过拟合问题,而这些问题会直接影响到计算的精度和二次特征的有效表达.因此,针对过拟合和特征稀疏性的问题,本文提出了非负Tucker 3分解(NTD)结合稀疏分量分析(SCA)的方法来提高分解的效率以及二次信号特征的稀疏性;同时,对Tucker 3的分解因子进行非负约束和一次性更新计算以提高计算的精度和效率.这样提取出的二次特征在稀疏性和精度方面也会得到有效的控制.因而,该方法的研究从理论上来说显得很有必要,在实践中也具有重要意义.

1 Tucker 3分解模型

作为一种成功的张量分解方法,Tucker提出的分解方法可以简单地概括为3种模型,即Tucker 1,Tucker 2和Tucker 3分解模型.其中,Tucker 3分解模型又是前2种方法研究的延续和发展,在非负张量分解(NTF)的特征局部化处理与应用中具有十分重要的意义[10-12].根据NTF的优越性,本文主要以Tucker 3分解模型作为研究对象.

s.t. ‖A(n)‖=1

(1)

图1 Tucker 3分解模型

对式(1)的最佳近似进行分解,可转化为求解以下最优化方程:

(2)

对式(2)中的A(n)分别逐个求偏导,便可得到模矩阵A(1),A(2),A(3)的计算式.对A(n)进行交替迭代计算,并增加对A(n)非负约束,可得到张量核G.非负约束对计算陷于局部过拟合起到了较大的抑制作用[13].但是,这种迭代计算方式会产生巨大的Jacobian矩阵,同时也带来了收敛慢和效率低的问题[12].因此,研究一种更高效合理的计算方法是本文的研究目的之一.

2 牛顿-高斯梯度下降的迭代方法

对分解因子A(1),A(2),A(3)以及G进行重新组合,得到一个新的矩阵M=[A(1)T,A(2)T,…,A(N)T,vec(G)].其中,vec(·)表示展开堆叠的张量G(关于张量的展开,可参见文献[10]),将各堆叠的矩阵重新排列成一行.根据牛顿-高斯梯度下降迭代法,得到矩阵M的更新方程为

M←M-H-1r

(3)

式中,H为海森矩阵;r为梯度矩阵,计算公式为

(4)

3 SCA的二次特征处理

3.1 信号的稀疏处理

高斯-笛卡尔密度核函数是由Khoromskij等[14]针对三维PARAFAC分解因子计算而提出,并应用于冗余化学原子库信号稀疏化的方法.高斯-笛卡尔密度核函数不仅能处理离散化信号,而且还具有滤波降噪的作用.因此,本文主要根据NTD各因子间叉积的特点,结合高斯-笛卡尔积,建立联合核函数为

Φ(Y)=c(Y-G×{A})exp(-μ(Y-G⊗{A})2)

(5)

假如Φ(Y)为冗余完备库,Y为其观测信号,则令Φ(Y)为一高斯原子,与Y信号长度相同,均进行归一化处理.两者间的最优化核函数求解可转化为解决以下映射内积的优化问题:

(6)

式中,〈Y,Φ(Y0)〉表示Y与Φ(Y0)的内积;Φ(Y0)为Y与Φ(Y)间的最佳原子库;α为充分考虑信号长度和Φ(Y0)损失等原因的常数.则信号最终分解为2部分:一部分为最佳高斯核函数;另一部分为分配后的残余信号.其数学表达式为

〈Y,Φ(Y)〉=〈Y,Φ(Y0)〉Φ(Y0)+rY

(7)

式中,〈Y,Φ(Y0)〉Φ(Y0)表示观测信号在Φ(Y0)上的最佳映射;rY为映射后的残余信号.实际上,高斯核函数与NTD后各因子参数直接相关.而根据交替迭代计算方式,核张量为G=Y×{A}T.因此,模矩阵的计算直接影响着高斯核函数的质量.这也充分说明了更新算法在迭代计算中很重要.

3.2 混合矩阵估计

混合矩阵是稀疏分量处理的重要组成部分,其精确度直接决定着信号分离的结果.假设稀疏化处理后的混合信号由Y1,Y2,…,YN子信号组成,将各分量进行分层处理,令yn=Yn(:,:,i)∈Yn,1≤n≤N.其中,y表示m×N的观测矩阵.SCA类似独立分量分析[15],主要解决以下线性信号分解问题:

Y=HS

(8)

式中,S为n×N稀疏源信号矩阵,N为信号样本;H=(hi,j)(i=1,2,…,m;j=1,2,…,n)为未知的混合矩阵.为了保证在信号特征依然稀疏的情况下能得到最佳混合矩阵,演化成解的最优化问题,即

min‖Y-HS‖

(9)

当信号损失足够小时,对方程(9)求最优解,得到

H=YS†

(10)

式中,†表示伪逆.估算出H矩阵后,用最小交替迭代二乘法对稀疏源信号矩阵进行逼近计算.整个信号特征提取的流程如图2所示.

图2 混合信号的SCA处理流程

4 齿轮箱信号分解验证

为了验证该算法的稀疏性和可靠性,采用东南大学故障诊断研究所的3种齿轮箱的故障数据.实验设备包括3套齿轮箱-电机系统,将位于中间的单级齿轮箱作为测试对象.齿轮箱的内部结构原理如图3所示.3个齿轮箱中的主动轮分别设置为正常、齿面点蚀和均匀磨损3种故障状态.齿轮箱的输入轴通过刚性联轴器与电机相连,转速可由Siemens MicroMaster420控制器进行调节.主动轮与从动轮间的传动比为31∶46.在电机转速约为4 000 r/min的情况下,通过分别安装在齿轮箱上垂直和水平方向上的压电传感器采集振动信号.如图3所示,传感器灵敏度为100 mV/g,误差范围为±3 dB,采样频率为3 838 Hz.分别对3种故障状态每种采集20组振动信号,每组长度为4 096点.齿轮的啮合频率和滚动轴承外圈通过频率分别为310和99.7 Hz.采样频率约为10 kHz.

取双谱2个正频率轴的频率点数为64,将分别采集到的信号加噪后组成255组包含3种故障

图3 齿轮箱结构图

状态的数据,即构成一个Ω×Ω×S的张量,其中Ω=64,S=255.取NTD后的张量核为32×32×64,设定NTF分解因子维数为323,迭代中的收敛误差为

(11)

将本文的迭代收敛误差与传统的NTF进行比较,如图4所示.

图4 迭代收敛误差比较

设定迭代停止误差为10-3,在训练张量维数相同的情况下,NTD达到目标精度所需的迭代步数约为150,收敛效率明显高于NTF.另一方面,在迭代误差计算过程中,NTD的收敛误差较平滑,从而说明了该算法具有良好的健壮性.因此,从收敛效率和健壮性两方面看,本文算法均优于NTF.

为了让特征信息更加容易识别,本实验需对故障信号进行时频变换.随机选取3种故障数据,进行快速FFT变换后得到的初始状态频谱图如图5所示.

图5 初始3种故障状态的频谱图

由图5可见,3种状态对应的振动频率分布在99.7 Hz倍频时的概率较大.对于正常状态和均匀磨损状态,初始信号的二次特征并不容易判断识别.在电机高速旋转情况下,点蚀状态振动明显,频谱特征相对容易判断.但是,如果在噪声干扰下,频谱特征分布不均匀,稀疏性差,信号的优势频率并不突出.类似地,正常状态和均匀磨损状态的信号特征稀疏性更需要改进.对此,本实验将采用上面提出的SCA与NTD相结合(SCA_NTD)的方法提取信号的二次故障特征,其频域特征如图6所示.

图6 SCA_NTD提取出的齿轮故障频谱图

与初始信号的二次特征相比,SCA_NTD提取出的特征频率能满足周期性的特点,也与齿轮减速箱啮合频率和轴承通过外圈频率相符合:点蚀状态的振幅值对应于基频99.7和310 Hz的多倍频;均匀状态对应基频为99.7 Hz的倍频,与齿轮啮合频率也相符.另外,特征信号的稀疏性比较好,容易观测,易于判断.在此,将特征值小于10-6近似作为特征信号的稀疏值.初始状态与SCA_NTD方法处理后的特征稀疏值个数的结果如表1所示.不难发现,处理后的特征稀疏值个数较多,从而说明了SCA_NTD处理后的盲信号具有良好的稀疏性.

表1 齿轮箱故障特征的稀疏值个数

为了证明SCA_NTD的可靠性,将其与经典的交替最小二乘法的NTD(ALS_NTD)和非负张量分解NTF算法进行比较.计算精度为Ac=(1-Et)×100%.实验结果如表2所示.

由表2中的精确度分布可见,相同计算方法的精度随着张量维数的增大而增高.总体上看,SCA_NTD计算得到的精度要比ALS_NTD和NTF高.随着张量核维数的调整,SCA_NTD的最高精度达到了97.16%,相比ALS_NTD与NTF的最高精度93.93%和88.81%,优势明显.从张量核维数组合情况可看出,当核张量维数约为张量维数的一半时,精度最高.因此,根据这一规律合理选择张量核维数,SCA_NTD的可靠性将会进一步得到保证.

表2 SCA_NTD与ALS_NTD在不同张量维数下的精确度 %

5 结语

针对NTD算法提取的二次特征信号不稀疏问题,结合SCA二次分离的方法得到了更加稀疏的特征信号.在处理SCA的混合矩阵问题时,采用了交替迭代计算稀疏源伪逆矩阵的方法.同时,为了避免NTD在迭代过程中陷于局部过拟合而导致误差增大和效率降低的问题,提出了一次更新所有分解因子的方法.实验结果表明,SCA_NTD达到了改善二次特征信号的稀疏性以及提高了计算精度和效率的目的.

)

[1] Tucker L R. Some mathematical notes on three-mode factor analysis[J].Psychometrika,1966,31(3): 279-311.

[2] Paatero P,Tapper U. Positive matrix factorization: a non-negative factor model with optimal utilization of error estimates of data values [J].Environmetrics,1994,5(2): 111-126.

[3] Lee D D,Seung H S. Learning the parts of objects by non-negative matrix factorization[J].Nature,1999,401(6755): 788-791.

[4] Hazan T,Polak S,Shashua A. Sparse image coding using a 3D non-negative tensor factorization[C]//10thIEEEInternationalConferenceonComputerVision. Beijing,2005: 50-57.

[5] Morup M,Hansen L K,Arnfred S M. Algorithms for sparse nonnegative Tucker decompositions [J].NeuralComputation,2008,20(8): 2112-2131.

[6] Cichocki A,Zdunek R,Phan A H,et al.AlternatingleastsquaresandrelatedalgorithmsforNMFandSCAproblemsinnonnegativematrixandtensorfactorizations[M]. Chichester,UK: John Wiley & Sons,Ltd,2009: 203-266.

[7] Peng S,Xu F,Jia M,et al. Sparseness-controlled non-negative tensor factorization and its application in machinery fault diagnosis[J].JournalofSoutheastUniversity:EnglishEdition,2009,25(3): 346-350.

[8] Karoui M S,Deville Y,Hosseini S,et al. Blind spatial unmixing of multispectral images: new methods combining sparse component analysis,clustering and non-negativity constraints[J].PatternRecognition,2012,45(12): 4263-4278.

[9] Asaei A,Davies M E,Bourlard H,et al. Computational methods for structured sparse component analysis of convolutive speech mixtures[C]//IEEEInternationalConferenceonAcoustics,SpeechandSignalProcessing. Kyoto,Japan,2012: 2425-2428.

[10] Kolda T G.Multilinearoperatorsforhigher-orderdecompositions[M]. California,USA: Sandia National Laboratories,2006.

[11] Cai X J,Chen Y N,Han D R. Nonnegative tensor factorizations using an alternating direction method[J].FrontiersofMathematicsinChina,2013,8(1): 3-18.

[12] Jiang L L,Yin H Q. Bregman iteration algorithm for sparse nonnegative matrix factorizations via alternating l (1)-norm minimization [J].MultidimensionalSystemsandSignalProcessing,2012,23(3): 315-328.

[13] Albright R,Cox J,Duling D,et al. Algorithms,initializations,and convergence for the nonnegative matrix factorization[R]. Raleigh,USA: Carolina State University,2006.

[14] Khoromskij B,Khoromskaia V,Chinnamsetty S,et al. Tensor decomposition in electronic structure calculations on 3D Cartesian grids[J].JournalofComputationalPhysics,2009,228(16): 5749-5762.

[15] 刘海林,姚楚君.欠定混叠稀疏分量分析的超平面聚类算法 [J].系统仿真学报,2009(7):1826-1828.

Liu Hailin,Yao Chujun. Hyperplane clustering algorithm of underdetermined mixing sparse component analysis[J].JournalofSystemSimulation,2009(7):1826-1828. (in Chinese)

猜你喜欢

张量齿轮箱高斯
风电齿轮箱轴承用钢100CrMnSi6-4的开发
偶数阶张量core逆的性质和应用
四元数张量方程A*NX=B 的通解
一类结构张量方程解集的非空紧性
数学王子高斯
天才数学家——高斯
提高齿轮箱式换档机构可靠性的改进设计
杭州前进齿轮箱集团股份有限公司
从自卑到自信 瑞恩·高斯林
M-张量的更多性质