APP下载

基于小波包能量谱与主成分分析的轴承故障特征增强诊断方法

2019-12-23郭伟超赵怀山李成李言汤奥斐

兵工学报 2019年11期
关键词:波包内圈轴承

郭伟超, 赵怀山, 李成, 李言, 汤奥斐

(1.西安理工大学 机械与精密仪器工程学院, 陕西 西安 710048; 2.安徽中清能动力技术有限公司, 安徽 马鞍山 243100)

0 引言

轴承主要用于支撑机械回转体,降低回转体运动过程中的摩擦,并保证运动精度,已广泛应用于现代机械装备和运载设备中[1-2]。由于轴承所承受的载荷、使用的环境通常都比较复杂,它也是机械设备中最易失效的零部件之一,其运行状态直接影响整个机械系统的安全性、可靠性和使用寿命,因此,对轴承故障进行诊断具有十分重要的意义[3-5]。

近年来,国内外学者针对轴承故障诊断方法和理论进行了大量研究。众多研究成果表明对轴承故障成功诊断的关键取决于对故障特征的有效提取和模式识别。如文献[6-7]利用双树复小波方法提取轴承的故障特征,这种方法可以有效地减小噪声信号的干扰;孙鲜明等[8]针对轴承故障信号具有较强的非平稳性,故障特征信息微弱难以早期发现的特点,提出了基于瞬时包络尺度谱熵的轴承早期故障特征提取方法;段晨东等[9]提出利用小波变换对振动信号进行时频分解,求取与各个频率分量对应的幅值峭度,用幅值峭度序列构造信号的时频峭度谱来表征故障特征。还有学者利用排列熵、振动频谱能量等指标量来提取故障特征[10-11]。上述方法通常在理论研究和试验研究中大多能取得较好的效果,在实际应用中往往效果欠佳。其原因主要归咎于在实际生产现场获得的轴承监测数据之间存在一定的相关性,又包含大量的环境噪声;数据之间的相关性会产生大量的冗余信息,形成高维数据,造成信息堵塞;环境噪声会隐藏故障信息,特别是会使早期微弱故障信息难以及时发现。这些因素都会阻碍轴承故障特征的提取、影响故障诊断。

为了减小冗余信息、有效提取故障信息,有学者提出了针对故障特征频率的故障诊断方法[12-13]。这是因为故障轴承在工作中,损伤位置点与正常表面接触时会产生一定的冲击力,采集到的振动信号会出现周期性故障特征频率。然而轴承的装配误差会使冲击不连续,导致故障频率在一个范围内波动。而小波包分解是在小波变换多分辨率基础上形成的一种更加精细的正交分解方法,可以对信号进行全频带内的正交分解,能够得到更精细、更全面的信息,具有更优的适应性,便于提取信号中的特征频率。在信号频率分解方面,小波包分解有着广泛应用[14-15]。因此,本文拟利用小波包分解方法,对监测到的数据信号进行全频带内的正交分解,从而实现故障频率范围内的故障特征提取。

针对监测数据具有一定的相关性,同时所测得信号数据中还包含环境因素、安装误差等引起的随机成分,进而阻碍故障特征的提取这一问题,本文采用主成分分析(PCA)方法对样本集进行降维,只提取数据中的主要信息,同时剔除隐藏在信号中的随机成分,增强有用特征信息。这是因为多元统计中的PCA方法能够窥探复杂数据背后的简单结构,既能消除隐藏在振动信号中的随机成分、突出有用信息,又能对复杂数据降维,提高分类效率,已被广泛应用于多个领域[16-18]。

本文基于小波包分解方法和PCA方法的优点,提出基于小波包能量谱与PCA的滚动轴承故障诊断方法。首先利用小波包分解对监测信号进行全频段分解,提取某一分解层次上不同时频空间的能量,构造出能量谱;然后利用PCA方法对监测信号的能量谱降维,并消除环境因素和安装误差引起的随机成分,增强故障特征向量;最后利用聚类算法对轴承故障类型进行识别分类。研究结果表明,本文方法能够有效地提取故障特征,识别滚动轴承的故障类型与故障程度。

1 小波包能量谱

1.1 小波包分解理论

小波包分解可以把信号按任意时频分辨率无泄露、不重叠地分解到不同频段。通过小波包变换后,信息完整无缺,所有频率均得到保留,给提取信号中的主要信息提供了强有力的条件。这种分解可以按照需要进行多次,最终获得所需要的频率。如图1所示为对一个信号进行3层正交小波包分解的原理图。将原始信号记为S,小波包分解经过滤波器H和G后可以获得第1层2个子频带S10与S11;对第1层的2个子分量分别进行分解,可以获得第2层的4个子频带S20、S21、S22和S23;以此类推,又可以获得第3层的子频带。

图1 小波包分解原理图Fig.1 Schematic diagram of wavelet packet decomposition

从图1可以看出,小波包分解将分解的频带进行多次分解,对小波分解中没有细分的高频部分进行再分解,并能根据待分解信号的特征,自适应选取相应的子频带,使之与信号的频谱相匹配。信号通过小波包分解后,信号的全部特征信息(包括低频部分和高频部分)均得以保留,给提取信号中的特征信息提供了强有力的支持。

由图1还可以看出,如果分解层数过多,将增加待处理数据的维数,不能无限制分解下去。实际应用时,需要根据实际情况选取一个合适的分解层次,对本文要处理的故障信号数据进行分析、测试,验证7层分解最为合适。

1.2 小波包能量谱的计算

Yen等[19]和刘涛等[20]研究了小波包分解在振动信号处理中的应用,提出了小波包节点能量的概念,并得出结论:节点能量与直接提取的小波包分解系数相比,具有更好的稳定性。小波包节点能量定义如下:

假设对振动信号x(t)进行j分解,则得到2j个子频带,第w个子频带的能量Enw表示为

Enw=∑|fw|2,w=0,1,2,…,2j-1,

(1)

式中:fw表示振动信号x(t)分解后的第w个分量。则振动信号x(t)在分解层次j的小波包能量谱Enj表示如下:

Enj=|En0,En1,En2,…,En2j-1|T.

(2)

2 PCA方法

为了更全面地监测设备的工作状态,通常采用多个传感器进行设备状态的测量,所测数据具有一定的相关性,同时所测得信号中也会隐藏环境因素、安装误差等引起的随机成分,从而阻碍设备故障特征的提取。为了更准确地提取出故障特征,本文采用PCA方法对样本集进行降维,提取数据中的主要信息以提高分类速度,剔除隐藏在信号中的随机成分,从而剔除对故障特征信息提取的干扰。

假设有m个n维观测值,x=[x1,x2,…,xn],将m个n维观测值组成矩阵X∈Rn×m,m表示传感器个数,n表示信号长度。可以利用PCA方法通过下列步骤,获取信号中的故障特征信息:

1) 中心化处理,得到观测值的均值E(x),

(3)

2)计算特征向量的协方差矩阵Cx,

(4)

3)计算协方差矩阵的特征值λa和特征向量ξa,a=1,2,…,m,

Cxξa=λaξa,

(5)

式中:特征向量ξa代表原始数据矩阵变异的最大方向。

4)根据累计贡献率ν确定主成分数量,它表示前k个方差在总方差中的比重,即

(6)

通常认为当前k个主成分的累计贡献率ν>95%时,就包含了原始数据的大部分特征信息。

5)得到k维特征矩阵U,

U=[u1,u2,…,uk],

(7)

式中:uk表示特征矩阵的第k个主成分;特征矩阵U包含原始数据大部分的有用信息,可以近似作为故障特征矩阵。

3 聚类算法

实际应用中,设备的故障类型多种多样,全部依靠人工进行识别几乎不可能。聚类算法以相似性为基础,可以将具有不同特征的数据分离开,将具有相同特征的数据归为一类。借助聚类算法很容易实现设备故障的自动诊断。为了验证结果的可靠性,本文使用两种聚类方法:层次聚类分析(HCA)算法和模糊c均值(FCM)聚类算法。其中HCA算法具有算法简单、对样本顺序无要求等优点,广泛应用在实际工程领域。但是HCA算法时间复杂度大,当样本数量庞大时严重影响计算效率。FCM算法利用模糊理论对数据进行分析,对处理大数据样本具有明显优势。但是由于FCM算法需要事先给出聚类数目,在故障种类未知情况下,很难给出准确聚类数。本文根据实际需要,对FCM算法进行了改进,根据数据样本自动计算最优聚类数目,从而提高了FCM方法在实际工程中的实用性。

3.1 HCA算法

HCA算法本质是通过计算不同类别数据点间的相似度,创建一棵有层次的嵌套聚类树。通过计算每一个类别的数据点与所有数据点之间的距离来确定它们之间的相似性,距离越小、相似度越高。将距离最近的2个数据点或类别进行组合,生成聚类树。数据点之间的距离一般采用欧几里德距离计算公式[17]:

(8)

式中:d(Xi,Xj)表示空间两点Xi和Xj间的距离;Xik、Xjk分别表示Xi点、Xj点的第k个坐标;M表示空间点的维数。

3.2 改进的FCM算法

FCM算法是一种基于目标函数优化的模糊聚类算法,c是聚类数目。该算法可以计算样本和类别之间的模糊关系,通过隶属度(0~1)表示,隶属度越接近于1表明越相似。根据隶属度大小可以将具有相同特征的样本归为一类。在使用FCM方法对数据进行聚类分析时,通常情况下要求根据先验条件预先设置聚类数目,然而实际情况下却很难获取数据的先验条件并确定数据需要分成几类。如果盲目地设置聚类数目,常常会适得其反,不能正确对数据进行聚类,获取令人满意的聚类结果。为了提高FCM算法的自适应性,本文根据实际情况,对FCM聚类进行改进。改进后的FCM算法可以自动给出合适的聚类数目。根据雷亚国[21]提出的方法,可以根据聚类评价指标确定聚类数目,常用的有划分系数PC、划分熵PE及MPC聚类评价指标,具体定义如下:

(9)

(10)

(11)

式中:N为数据集的样本数;sβτ为第β个样本对第τ类的隶属度。从上述3种聚类评价指标的定义可以看出,当PE值达到最小或PC与MPC值最大时,对应的c值为最优的聚类数。

根据上述方法对FCM算法进行改进,具体流程如图2所示。为了避免分类数目过多或过小,首先根据实际情况设置一个聚类范围,利用聚类算法对数据集进行聚类分析;然后对每一个类别下的聚类结果进行分析验证,通过聚类评价指标评价聚类结果,如果聚类结果最优则输出最优聚类数目及相应的聚类结果,否则增加聚类数目。重复上述分析过程,直到给出最优聚类数及聚类结果。

图2 改进的FCM算法流程图Fig.2 Flow chart of improved FCM algorithm

4 实验分析

为了验证本文所提方法的有效性,应用于滚动轴承的故障类别和故障直径的诊断。采用的轴承数据来源于美国凯斯西储大学电气工程实验室[22],实验台如图3所示。实验对象是SKF6205-2RS深沟球轴承,使用加速度传感器采集振动信号,加速度传感器分别安装在电动机壳体的驱动端和风扇端。

图3 滚动轴承故障模拟实验台Fig.3 Fault simulation experimental table for rolling bearing

实验中使用电火花加工技术在轴承内圈、外圈和滚动体上布置单点凹坑故障,实验对象的电机负载为735.5 W,主轴转速为1 772 r/min,故障直径为0.36 mm,深度为0.28 mm,在此工况下采集滚动轴承内圈、外圈、滚动体单点电蚀和正常状态下的振动信号,信号的采样频率为12 kHz,数据长度为2 048个数据。正常、滚动体故障、外圈故障和内圈故障4种状态下某一样本的振动加速度信号如图4所示。

图4 4种不同轴承故障类型振动信号时域图Fig.4 Vibration signals of bearings in four different types of faults

对上述4种轴承故障类型及无故障状态的数据,每组各选取10个样本并进行编号,如表1所示。其中:无故障数据编号是1~10;滚动体、内圈、外圈带有直径0.36 mm凹坑故障状态下的数据编号分别为11~20、21~30、31~40;为了更好地验证本文方法的有效性,增设一组带有直径0.36 mm凹坑的内圈故障为待识别数据,同样有10个样本,数据编号为41~50.

采用40阶Daubechies离散正交小波db40,对采集的4种不同状态下50组振动信号样本进行7层分解,每个样本信号都会对应生成128个不同频带的分量信号,从而有128×50共6 400组分量信号,相应地,把这些数据存储到一个大小为6 400×40的矩阵中。如此大的数据量本身就会对故障诊断的效率和准确性产生严重影响。这些多分量信号中绝大多数是轴承正常运行的低频信号和高频的噪声信号,这些信号对故障识别无用,反而会掩盖故障信息。因此,本文采用PCA方法对6 400×40矩阵中的数据进行处理,提取最能体现轴承状态变化的故障特征信息向量,并剔除无用信号信息。针对表1所示的50组样本数据,经过PCA方法处理后得到一个50×40故障特征向量矩阵,从而极大地减少了要处理的数据量,达到对信号矩阵降维并增强故障特征信息提取的目的。最后分别利用HCA方法和改进FCM方法对该故障特征向量进行分类。

表1 不同故障类型的样本

HCA方法的识别结果投影到三维空间,样本数据的前3个主成分量分布如图5所示。从图5(a)中可以看出,数据明显被分成了4组,不同状态下的数据相互分离,相同状态下的数据被分到同一类中。需要特别注意的是,内圈故障和待识别数据故障样本距离比较近,明显在同一种,如图5(a)中圆圈标注处。图5(a)中圆圈处的样本分布投影到第2、3主成分量平面并放大,如图5(b)所示,从中可以明显看出这组只包含“○”和“+”样本,其中“○”代表10个内圈故障数据样本,“+”代表10个样本为待识别状态下的数据,说明待识别状态与内圈故障同为一类,即待识别状态为内圈故障,符合实际情况,证明本文方法对多故障下轴承运行状态识别是有效、可信的。

图5 HCA算法的聚类结果Fig.5 Clustering results obtained by HCA algorithm

利用改进FCM算法的识别结果如图6所示。改进FCM算法的输出结果为各样本归属于各类的概率,用隶属度表示,由隶属度最大值决定样本属于哪一类。例如样本对第k类的隶属度最大,表明样本属于该类的概率越大。图6所示为用散点表示的各样本隶属度。

从图6中可以明显看出:无故障状态下的1~10号样本对应第1类的隶属度最大,属于第1类;编号11~20对应滚动体故障状态下的样本对第2类的隶属度最大,属于第2类;编号21~30对应内圈故障状态下的样本对第3类的隶属度最大,属于第3类;编号31~40对应外圈故障状态下的样本对第4类的隶属度最大,属于第4类;编号41~50对应未知状态下的样本对第3类的隶属度最大,与内圈故障状态下的样本同为第3类,说明未知状态是内圈故障,结果符合实际情况,改进FCM算法同样准确识别出了滚动轴承的故障类型。

图6 改进FCM算法的聚类结果Fig.6 Clustering results obtained by the improved FCM algorithm

为了进一步验证本文方法的有效性,利用滚动轴承内圈不同故障程度进行诊断。在实验转速为1 772 r/min时,分别选取内圈凹坑直径分别为0.18 mm、0.36 mm、0.53 mm共3组故障信号样本和一组无故障信号样本,同样增设一组内圈凹坑直径为0.18 mm的故障样本作为待识别数据,具体各类数据样本分组和编号如表2所示。同样采用40阶Daubechies离散正交小波db40,对采集的4种不同状态下的振动信号进行7层小波包分解,得到128个子频带;利用PCA方法对信号矩阵降维,提取故障特征信息;利用HCA方法和改进FCM算法进行故障程度的识别。

表2 内圈不同故障程度样本数据

利用HCA方法识别的结果如图7所示。从图7(a)图中可以明显看出,50个样本被分成4类,分别对应无故障、故障凹坑直径为0.18 mm、0.36 mm和0.53 mm的数据样本。同种状态下的数据被划分在同一类中,不同状态下的信号相互分离。由图7(b)局部放大图可以看出,故障凹坑直径为0.18 mm的分布中包含20个样本,其中包含编号为41~50的待识别数据样本,即待识别数据与内圈故障凹坑直径为0.18 mm的数据样本分为一类,表明待识别数据样本被准确识别。

利用改进FCM算法获得的识别结果如图8所示。由图8可以明显看出,数据样本被分为4类。编号为1~10、21~30、31~40的样本分别为一组,分别对应内圈故障程度为无故障、故障凹坑直径为0.36 mm和0.53 mm. 编号为1~10和41~50的样本共为一组,其中编号为41~50的样本为待识别数据样本,它们的故障凹坑直径都为0.18 mm. 改进FCM算法最终也准确识别出了各类不同程度的故障样本。

通过实验数据验证可知,两种聚类算法的聚类结果都得到了令人满意的结果,不但能正确分组显示各类轴承故障,还能准确识别不同程度的轴承故障,而且每种情况下对待识别的数据都能准确归类,没有出现错分情况。表明本文提出的基于小波包能量谱的轴承故障诊断模型是有效的,能够有效地诊断不同类型和程度的轴承故障。

5 结论

本文根据轴承所处工作环境及故障特点,利用小波包多分辨率可以实现更精细化的分解特性,以及PCA方法可以提取主要信息特征的性质,提出一种基于小波包能量谱和PCA的轴承故障特征增强诊断方法。得出主要结论如下:

1)小波包能量谱能够有效地对振动信号进行不同频带的分解,便于选取相应的子频道;信号特征信息经过小波包分解后均得以保留,为提取信号中的特征信息提供了强有力的支持。

2)利用PCA方法,不但可以对小波包能量谱进行降维处理,还能最大限度地剔除无用信号或噪声信号,实现更有效地提取故障信号特征。

3)改进FCM算法可以自动确定最优的聚类数目,提高了FCM算法的适用性。

4)实验数据验证表明,本文所提方法能够准确地将不同轴承故障类型进行分离,实现对不同故障类型和故障程度的识别。所提方法简单高效,容易推广到其他工程结构的健康监测中,具有一定的应用前景。

猜你喜欢

波包内圈轴承
异步立式感应电机轴承系统设计
双列圆锥滚子轴承内圈端面间隙偏差对其力学特性的影响*
无轴承电机的结构设计
内圈倾斜角对高速角接触球轴承动态特性的影响
基于支持向量机和小波包变换的EOG信号睡眠分期
泵用电机水润滑轴承选择与应用
基于动态阈值函数的改进小波包遥测信号去噪方法
基于EMD和小波包能量法的信号去噪
无限追踪
薄壁内圈的变形分析及措施