APP下载

基于自适应多尺度散布熵的滚动轴承故障诊断方法

2018-10-23李从志郑近德潘海洋刘庆运

噪声与振动控制 2018年5期
关键词:内圈外圈分类器

李从志,郑近德,潘海洋,刘庆运

(安徽工业大学 机械工程学院,安徽 马鞍山 243032)

滚动轴承是旋转机械中最常用、也是最容易发生故障的零部件[1]。滚动轴承发生故障时,其故障振动信号往往是非线性、非平稳的[2],传统的线性信号分析方法很难直接获得故障信息[3]。而许多非线性动力学方法,如分形,近似熵,样本熵,排列熵等,因能够反映振动信号的非线性特征而在机械故障诊断中得到了广泛应用。如文献[4]将形态学分形维数应用于滚动轴承特征提取;文献[5]将分形维数应用于轴承早期故障诊断;文献[6]通过计算经局域波分解后得到的基本模式分量的近似熵来量化故障特征;文献[7-8]将样本熵(Sample entropy,SampEn)运用于滚动轴承故障诊断,文献[9]将排列熵[10](Permutation entropy,PE)应用于振动信号突变检测等,都取得了不错的诊断效果。尽管如此,上述方法也有其自身的缺陷。如SampEn计算慢,实时性差,且相似性度量易发生突变;PE虽然概念简单计算速度快[11],但没有考虑振幅的平均值和振幅值之间的差异。最近,Mostafa Rostaghi和 Hamed Azami[12]提出了一种新的不规则指标——散布熵(dispersion entropy,DE),DE算法计算速度快且考虑了幅值间关系,在一定程度上解决了SampEn与PE的上述缺陷。

然而,由于滚动轴承振动信号的复杂性,单一尺度的熵值很难完全反映全部的故障信息。Huang等[13]提出的经验模态分解(Empirical Mode Decomposition,EMD)是一种自适应的信号分解方法,能够将一个复杂的多分量分解为若干个本征模态函数(Intrinsic mode function,IMF)和一个趋势项之和,即能够自适应地实现振动信号的多尺度化,基于此,本文考虑将EMD与DE结合,提出基于EMD与DE的自适应多尺度散布熵(Adaptive Multi-scale Dispersion Entropy,AMDE)方法。即首先采用EMD对原始数据进行自适应多尺度分解,得到若干IMF分量;其次,计算每一个IMF的DE值;得到的若干个DE值称为自适应多尺度散布熵值,并将其应用于滚动轴承滚动轴承的故障特征的提取。最后,建立基于支持向量机的多故障分类器对滚动轴承故障特征向量进行识别,实现对滚动轴承不同位置故障的智能诊断。最后,将提出的方法应用到滚动轴承试验数据分析,并与现有同类方法进行对比,结果表明,本文提出的方法能准确地识别滚动轴承的故障类型,而且具有一定的优越性。

1 散布熵算法

1.1 散布熵计算方法

DE是一种衡量时间序列复杂性或不规则程度的算法,对于给定的长度为N的时间序列x={xj,j=1,2,…,N},DE计算步骤如下:

(1)利用正态分布函数

将时间序列x映射到y={yj,j=1,2,…,N},yi∈(0,1)。其中μ和σ2分别表示期望和方差。

(2)再通过线性变换

将y映射到[1,2,…,c]的范围内(R为取整函数),c为类别个数。事实上,步骤(1)和步骤(2)是将时间序列x中的每个元素都映射到[1,2,…,c]内。

其中:m和d分别为嵌入维数和时延。

与样本熵和排列熵类似,DE也是一种表征时间序列不规则程度的方法。DE值大,不规则程度越高;DE越小,不规则程度越低。从DE的算法中可以看出,当所有的散布模式具有相等的概率时,DE取得最大值ln(cm),如噪声信号。相反,当只有一个的值不等于零,此时表示时间序列是一个完全规则或可预测的数据,此时DE值最小,如周期信号。

1.2 散布熵性能分析

接下来研究不同参数对DE计算的影响。对于时延d,在有关香农熵的算法中通常取1,2或3。事实上,d的值大于1时可能会造成一些频率信息的丢失,所以本文取d=1。对于嵌入维数m,如果嵌入维数m太小,则可能检测不到信号中的动态变化,而m值过大则可能导致不能观测到信号中的微小变化。所以本文研究了m=2和m=3两种情况。对于类别c,首先,c必须大于1,如果c=1,则散布模式只有一种,达不到散布的目的。由于c是DE算法中序列散布的种类数,当c取值过小时,两个幅值差距很大的数据就可能被分配为同一类;而当c过大时,幅值相差很小的数据就可能被分成不同类,此时DE算法会对噪声很敏感。综上,本文选取d=1,c=4,5,6,7与m=2,3进行分析。

对比不同参数组合下不同长度高斯白噪声(White Gaussian Noise,WGN)与1/f噪声DE值,作均值方差图,结果如图1所示。

从图中可以看出,对于不同的参数组合,两种噪声在不同数据长度下DE值的整体趋势相同,且DE值随着c的增大而增大。当m=2时,不同的c值对DE值的稳定性影响不大;当m=3时,DE值的稳定性随c的增大而略微增强。接下来分析不同参数下

(6)根据香农熵的定义,原始信号x的DE定义为DE的计算速度,统计图1中每个小图中数据计算所需时间,结果如图2所示。

图1 不同参数对DE值的影响

图2 不同参数计算时间

从图2可以看出,c和m的值越大所需计算时间越长,因此,c和m的值都不宜过大。文献[12]建议c的取值范围为[4,8],d取1;m根据需要选取,通常取2或3,且cm应小于所需计算的数据长度(cm为所有潜在散布模式个数,大于数据长度没有意义)。综合考虑计算效率与处理效果,本文参数选择为:c=6,m=3,d=1。

再研究数据长度对DE计算结果的影响,考虑不同数据长度WGN与1/f噪声的DE值,从图1中可以看出,WGN的DE值比1/f噪声的DE值要大,这与WGN比1/f噪声的不规则程度要更高相符。从图1中还可以看出,数据长度过短会造成DE的值不稳定,在数据长度超过2 000时,WGN和1/f噪声的DE值随着数据长度的增加而分别稳定在某一固定值附近。因此,一般地,在计算DE值时要求数据样本点数大于2 000。

事实上,DE算法也使用了SampEn中相似容限r的概念,将原始信号中不同幅值的数据归为相同或不同类,这使得与SampEn相比,DE在处理含噪声信号时鲁棒性更强。DE中的散布模式类似于PE中的排列模式,但两个模式的处理方式不同。例如,在PE中[1,5,5]和[1,3,5]的排列模式都是[1,2,3];但在DE中的散布模式分别为[1,3,3]和[1,2,3]。对于含噪声信号,如原始数据[1,6,6]加入噪声后变为[1,6,5.9]和[1,6,6.1],则其PE的排列模式分别为[1,3,2]和[1,2,3];而在DE中,这两个加噪数据的散布模式都为[1,3,3],这说明DE相对于PE在处理噪声干扰时更稳定。由于PE只考虑时间序列的有序结构,没有考虑序列的幅值,所以一些关键的信息可能会错过。例如,[1,9,2]和[1,9,8],在PE中的排列模式都是[1,3,2],但是在DE中的散布模式分别为[1,3,1]和[1,3,3]。以上对比DE的类别c都为3。综上,所以,与PE相比,DE的优势在于通过引入类的划分与排列,使得在处理噪声信号时更稳定;而与SampEn相比,DE计算步骤更少,计算速度更快。

为了对比SmpEn与DE的计算速度,分别计算SampEn与DE在不同数据长度下的WGN与1/f噪声信号的计算时间,结果如图3所示。

其中,长度Ni=100+50i(i=1,2,…,99);SampEn中参数选择为:m=3,r=0.2SD,[7],SD为原始数据标准差;DE参数选择为:m=3,c=6,d=1,由图1可以看出,在时间序列长度较短时(1 000点以内),二者计算时间相差不大;而随着时间序列长度的增大,DE的计算耗时增加较小,而SampEn计算耗时较大。特别是当数据长度为5 000时,SampEn计算耗时是DE耗时的100以上。上述分析结果说明,数据长度对SampEn的计算耗时有很大的影响,而对DE的耗时影响较小。

图3 SampEn与DE计算时间对比

2 基于自适应多尺度散布熵的滚动轴承故障诊断方法

2.1 方法步骤

由于振动信号的复杂性,单一尺度的DE值很难完全反映故障的全部信息,结合EMD的自适应分解特性,本文提出了基于自适应多尺度散布熵的滚动轴承故障诊断方法,具体步骤如下:

(1)设有k类滚动轴承数据,分别分成N1,N2,…,Nk组样本;对每个样本进行EMD分解,每次分解得到若干个IMF分量和一个残余分量;

(2)由于同种数据不同组样本经过EMD分解得到的IMF分量个数可能不同,设所有个样本中IMF分量数最少的个数为λ,则对所有样本取前λ个IMF分量,对每个样本的前λ个IMF分量求DE值;

(3)将(2)中求得的每个样本的DE值按顺序排列作为该样本的特征向量;

(4)基于支持向量机建立多故障分类器,将上述特征向量进行训练和测试,从而实现滚动轴承故障类别的诊断。

2.2 实验数据分析

为了验证方法的有效性,首先采用美国凯斯西储大学(Case Western Reserve University,CWRU)轴承数据中心的滚动轴承数据[14]。实验平台包括一个2马力(约1 492 kW)的电机,一个转矩传感器,一个功率计和电子控制设备。本文选用的数据信息如下:电机转速为1 730 r/min,采样频率为12 kHz,采样位置和故障位置都在驱动端,滚动体、内圈、外圈的故障直径都为0.177 8 mm,外圈滚道故障设置在6点钟位置。对于上述4种状态滚动轴承的试验数据,每种状态数据取29个样本,每个样本数据包含4 096个采样点,每种状态样本时域波形图如图4所示。

图4 滚动轴承四种状态振动信号波形

首先,采用EMD方法对所有116组样本进行分解,得到116组IMF分量;其次,计算每个IMF的DE值。分别求四种状态所有29组样本DE值的均值方差图,如图5(a)所示。从图5(a)中可以看出,四种轴承状态数据的AMDE曲线区分非常明显,在大部分自适应尺度上有大小关系:DE外圈>DE内圈>DE滚动体>DE正常。其中正常、滚动体和内圈的大小关系固定,外圈曲线在第1个IMF分量处DE值最小,到第2个分量上升,之后下降,从第3个分量开始高于其它3条曲线。

再次,基于SVM建立多故障分类器,识别故障的类型。从图5(a)可以看出,IMF分量数量最少的是正常数据,有9个,因此,对每种数据取前9个IMF分量的DE值按顺序排列作为该数据的特征向量。上文对每种数据取29组进行处理,随机选14组用于分类器的训练,剩下15组用于测试。建立训练和测试数据时,将正常、滚动体、内圈和外圈的类别分别设为1,2,3,4。采用基于SVM的多类别分类器[15]对前面提取的不同数据的特征向量进行分类识别。其中核函数选择多项式函数:(γ∗u′∗v+r)d,其中参数γ,r,d的值分别设为1/9,0,3,其余参数使用默认值。

预测结果与正确结果对比如图5(b)所示,测试结果准确率为100%。结果表明,本文提出的方法能准确地诊断出滚动轴承故障。

为了说明进行多尺度分析的必要性,不失一般性,直接计算滚动轴承的原始信号的每个样本的DE值,并利用分类器进行训练与分类。首先,将原始信号以4 096个点为一组分割,每种信号分为29组。其次,对每组数据求DE值,结果如图6(a)所示,从图6(a)中可以看出,正常信号与外圈故障信号DE值较小且分离明显,没有交叉重叠;滚动体信号与内圈故障信号DE值较大且有交叉的点。再次,随机选取每种数据的20个DE值作为训练数据,将正常信号与滚动体、内圈和外圈故障信号分别设为1,2,3,4输入到分类器进行训练。最后,将剩下的9个DE值作为测试信号测试训练好的分类器的准确性,结果如图6(b)所示,从图6(b)可以看出,预测结果的整体准确率为90%,正常信号与外圈故障信号的预测准确率达到了100%,但是滚动体与内圈故障信号的预测准确率只有80%。所以,对原始信号直接求DE值进行单一尺度的故障诊断方法准确率低,因此,上述分析结果表明了进行自适应多尺度分析的必要性和优越性。

为了说明DE方法的优越性,将其与现有方法进行对比。将本文方法中的DE替换成PE(PE参数设置:嵌入维数m=3,时延d=1)用于滚动轴承故障诊断。由于本文使用数据分组后长度为4 096,SampEn的计算时间是DE的100倍以上,因此没有使用基于SampEn的方法进行对比。为保证对比的严谨性,选用与上文验证本文方法相同的轴承数据,并对数据进行相同的划分与处理,只将方法中的DE替换为PE。不同分量PE值均值方差图如图7(a)所示。从图7(a)中可以看出,四种数据IMF分量PE值曲线的整体趋势基本相同,其中正常信号和3种故障信号的曲线分离明显,3种故障中滚动体的曲线相对比较稳定,而内圈和外圈的曲线稳定性较差,存在较大误差。分类器预测结果如图7(b)所示,从图7(b)中可以看出,整体正确率为76.67%,其中正常信号和滚动体信号的识别未出现错误,而内圈与外圈的识别准确率较低,仅为53.33%。这说明本文提出的基于DE的滚动轴承故障诊断方法比基于PE的滚动轴承故障诊断方法的故障识别率更高。

图5 本文方法结果

为了研究特征个数选择对诊断效率的影响,同时将DE与PE进行对比,分别计算这两种方法在将前1~9个IMF分量的熵值作为特征向量时识别准确率,结果如图8所示。

从图8中可以看出,使用DE在1~9个特征数量上识别准确率都为100%,而使用PE识别准确率在这些特征数量上最高只有81.67%,平均识别准确率只有80%左右。因此,基于EMD和DE的AMDE方法故障识别率比基于EMD的PE方法的识别率更高。

为验证本文方法在滚动轴承故障诊断中的普适性,对型号为6210的深沟球轴承试验数据进行分析。实验仪器为BVT-5型轴承振动测量仪,实验采用哈尔滨轴承集团公司生产的6210深沟球轴承。

由实验条件所限,在主轴转速1 800 r/min,采样频率为5 120 Hz,未施加负载的条件下,采集了正常、内圈故障和外圈故障数据。3种数据时域图如图9所示。

图6 基于DE的故障诊断方法结果

使用本文方法分析该实验数据。每种数据取29组,每组取4 096个采样点。各阶分量DE值均值方差图如图10(a)所示,从图中可看出,3条曲线分离明显,整体关系:DE内圈>DE外圈>DE正常。再取每组数据的前9个分量的DE值作为特征向量,随机取14组数据用于分类器训练,剩下15组数据用于测试。正常、内圈故障和外圈故障的类别分别设为1,2,3。结果如图10(b)所示,故障识别率为100%。结果证明了本文方法对滚动轴承的故障诊断的有效性。

图7 基于EMD与PE故障诊断方法的结果

图8 基于DE与PE不同特征数量识别率

3 结语

将散布熵(DE)的概念引入到滚动轴承故障特征的提取,得到了如下结论。

(1)得出了DE的参数选择的一般标准以及数据长度对结果的影响,通过仿真分析验证了DE相对于SampEn和PE在部分特性上的优越性。

图9 轴承振动信号时域波形

(2)结合经验模态分解,提出了基于自适应尺度散布熵的滚动轴承故障诊断方法(AMDE),并通过滚动轴承试验数据分析,将其与单尺度DE以及PE等方法进行了对比,结果表明了本文方法的优越性。

综上,本文提出的方法为滚动轴承故障提供了一个有效的诊断途径。

图10 深沟球轴承测试数据分类结果

猜你喜欢

内圈外圈分类器
全陶瓷轴承外圈裂纹位置识别方法
深沟球轴承外圈表面凹坑缺陷分析
特种复合轴承内圈推力滚道磨削用工装设计
角接触球轴承外圈锁口高度自动检测规改进
主轴轴承内圈锁紧用台阶套的装配
基于深度优先随机森林分类器的目标检测
3MZ1420A外圈沟磨床砂轮修整机构的改进设计
基于差异性测度的遥感自适应分类器选择
轮毂轴承内圈的成型磨削方法
内圈带缺陷中介轴承的动力学建模与振动响应分析