APP下载

复合多尺度反向散布熵在轴承故障诊断中的应用

2022-10-17郑近德潘海洋童靳于

振动与冲击 2022年19期
关键词:标准差分类器尺度

陈 焱, 郑近德, 潘海洋, 童靳于

(安徽工业大学 机械工程学院,安徽 马鞍山 243032)

滚动轴承作为旋转机械的关键部件之一,在工业应用中起着不可或缺的作用。及时发现滚动轴承早期故障并妥善处理,能够避免不必要的损失[1-2]。

由于机械系统的复杂性,滚动轴承振动信号往往表现出非平稳和非线性特性[3-4]。传统的线性方法将非线性、非平稳信号转化为平稳信号处理,具有一定的局限性。非线性动力学方法能够有效的提取潜在的故障特征信息,在机械故障诊断得到了广泛应用[5-6]。Yan等[7]将排列熵(permutation entropy, PE)引入机械设备故障诊断,研究了PE在旋转机械不同状态表征中的应用,结果表明PE可以作为监测滚动轴承工作状态的一种有效手段。但PE只考虑幅值顺序而忽略了幅值大小的信息,且未解决每个嵌入向量中等幅值问题。为克服这一缺陷,Bilal等[8]提出了加权排列熵(weighted permutation entropy, WPE),通过方差引入幅值信息。相比于PE,WPE可以检测出突变的幅值,同时在低信噪比背景下具有更好的噪声鲁棒性和稳定性。Rostaghi等[9]提出了散布熵(dispersion entropy, DE),将其应用于脑电图中信号复杂性的度量。与PE相比,DE计算速度快且对频率和幅值的变化更为敏感;Bandt[10]提出反向排列熵(reverse permutation entropy, RPE),定义为“到白噪声的距离”,作为测量睡眠深度的参数之一,例如人类脑电图的清醒状态被定义为“几乎无白噪声”。与PE相比,RPE呈相反趋势,在计算误差、故障诊断效果等方面占据优势。为了进一步提高PE性能,Li等[11]提出反向散布熵(reverse dispersion entropy, RDE),同时引入DE的幅值信息和RPE的距离信息[12]。RDE极大地提高了稳定性和分类识别率,是一种有效的复杂性测度方法。

受多尺度熵启发,论文在RDE的基础上,通过引入尺度因子及针对传统多尺度过程中粗粒化方式的不足[13],提出了复合多尺度反向散布熵(composite multi-scale reverse dispersion entropy,CMRDE)。CMRDE可以得到时间序列在多个尺度下的复杂性变化信息,能够更全面地提取故障特征。复合多尺度的方法克服了传统粗粒化方式的不足,在计算准确度、特征提取效果等方面更具有优势。

将CMRDE应用于滚动轴承振动信号的多尺度复杂性分析,提出了一种基于CMRDE、集合经验模态分解(ensemble empirical mode decomposition,EEMD)和布谷鸟搜索算法优化支持向量机(cuckoo search support vector machine,CS_SVM)的滚动轴承故障诊断方法。首先,利用EEMD对原始振动信号进行分解,得到若干本征模态函数;其次,提取峭度最大的前三个分量的多个尺度CMRDE作为故障特征向量;再次,将故障特征向量分为训练和测试样本,将训练样本输入到基于CS_SVM的故障分类器,对其进行训练;最后,采用测试样本对故障分类器进行测试,依据分类器输出结果判断滚动轴承的状态。通过试验数据分析,将提出的故障诊断方法分别与基于多尺度反向散布熵(multi-scale reverse dispersion entropy,MRDE)、复合多尺度散布熵(composite multi-scale dispersion entropy,CMDE)和多尺度散布熵(multi-scale dispersion entropy,MDE)的故障诊断方法进行了对比,结果表明论文所提方法能准确识别出滚动轴承不同故障类型,且诊断效果优于其他方法。

1 反向散布熵

1.1 反向散布熵算法

RDE作为一种新的非线性动态分析方法,以PE为理论基础,结合了DE和RPE的优势,在稳定性和区分性上表现良好。

对长度为T的时间序列X={x1,x2,…,xT},RDE计算步骤如下:

(1) 通过正态分布函数

(1)

将时间序列X={x(i),i=1,2,…,T}映射到Y={y(i),i=1,2,…,T}范围内,y(i)范围在0~1之间,其中μ为期望、σ2为方差。

(2) 通过线性变换

(2)

将新序列Y={y(i),i=1,2,…,T}映射到Z={z(i),i=1,2,…,T}范围内,其中int为取整函数,c为类别个数、z(i)为1~c的正整数。

(3) 相空间重构

将Z重构成L个时延为d、嵌入维数为m的嵌入向量,由所有嵌入向量组成的矩阵为

(3)

式中,嵌入向量L个数为T-(m-1)d。

(4) 计算散布模式

每个嵌入向量都可以映射到一个散布模式π中。所有可能的散布模式数量共有cm种,因为每个嵌入向量共有m个分量,每个分量都可以是1~c之间的某个整数。

(5) 计算每种散布模式的概率

第i个散布模式的相对概率可以表示为

(4)

式中:p(πi)为第i个散布模式的个数与嵌入向量个数的比值;Number(πi)指嵌入向量映射到第i个散布模式中的个数。

(6) 计算RDE

RDE被定义为“到白噪声的距离”,表示为

(5)

(6)

依据Li等,RDE参数选择如表1所示。

表1 RDE参数选择Tab.1 The selected parameters of RDE

1.2 仿真信号分析

为了验证RDE检测突变信号的能力,采用式(7)所示的仿真信号进行验证

(7)

仿真信号y(t)由高斯白噪声s和脉冲信号x组成,采样频率为1 kHz,时域波形如图1所示。对1 000长度的仿真信号,每次取100个数据点作为一个样本,并以10为步长进行重叠取样,最终得到91个数据点数为100的样本,其取样过程如图2所示。依据推荐参数,计算91个样本熵值时,PE、RDE和DE的嵌入维数、时延分别设置为2、1,RDE和DE的类别数设置为4,SE的阈值选择0.20SD(SD为原始数据的标准差)。仿真信号熵值计算结果如图3所示。由图3可知,在包含脉冲信号阶段,DE的值明显减小,RDE的值明显增大,两者呈相反趋势,而SE和PE对脉冲信号并不敏感。为进一步比较,四种熵在是否包含脉冲信号时的均值及变化率(Y为包含脉冲信号均值;N为未包含脉冲信号均值;T为变化率,即Y和N的比值),如表2所示。

图1 仿真信号的时域波形Fig.1 Time domain waveform of synthetic signal

图2 重叠取样过程Fig.2 Process of overlapping sampling

图3 仿真信号的四种熵值Fig.3 The four entropies of the synthetic signal

表2 五种熵的均值及其变化率Tab.2 The means of the four entropies and their variation ratios

由表2可知,PE的变化率为1.001%,其他三种熵的变化率都明显大于1,表明它们均可以检测到信号的突变。但是,由图2可知,SE波动较大,无法体现和诠释信号的突变特征。RDE相比DE,RDE的波动更小,且变化率达到了37.518%,远高于DE。综上,分析结果可以说明RDE检测突变信号的能力优于其他三种方法。

为了验证RDE分辨不同噪声的能力,采用白噪声频谱处理得到的三种有色噪声。蓝噪声在有限频率范围内,其功率密度随频率的增加每倍频增长3 dB(密度与频率成正比);粉红噪声在给定频率范围内,随着频率的增加,其功率密度每倍频下降3 dB(密度与频率成反比);紫噪声在有限频率范围内,其功率密度随频率的增加每倍频增长6 dB(密度正比于频率的平方值)[14]。三种噪声的时域波形如图4所示。

(a) 蓝噪声

(b) 粉红噪声

(c) 紫噪声图4 三种噪声信号的时域波形Fig.4 The time domain waveform of three kinds of noise signals

根据时域图无法直接区分蓝噪声和紫噪声,取相同长度的三种噪声信号作为研究对象,分别计算三者的PE、SE、DE和RDE值,结果如图5所示。由图5可知:PE和SE区分能力最差,对三种噪声信号的处理结果具有明显的相似性;DE仅可以区分出蓝噪声,但对粉红噪声和紫噪声的处理结果在一定程度上存在交叉;RDE则清晰地区分出三种噪声信号。为了更直观地看出结果,计算了不同噪声信号下不同熵值的均值和标准差,结果如表3所示。根据表格可以看出,三种噪声的RDE均值相差较大,验证了图5中RDE可以区分出三种信号的结论。同时,相同情况下,RDE的标准差小于其他三种熵的标准差,表明RDE具有更好的稳定性。综上可知,RDE在分辨不同噪声性能上优于其他三种方法。

(a) PE

(b) SE

(c) DE

(d) RDE图5 三种噪声信号的不同熵值对比Fig.5 PE,SE,DE and RDE of three kinds of noise signals

表3 三种噪声信号下不同熵值的均值和标准差Tab.3 The mean and standard deviation distributions of different entropies for three kinds of noise signals

2 复合多尺度反向散布熵

2.1 复合多尺度反向散布熵算法

RDE在分析单一尺度下时间序列的随机性和动力学突变行为上具有很大优势,为了度量不同尺度下时间序列的复杂性,有学者提出了多尺度分析[15-16]。但是,基于粗粒化过程定义的多尺度计算依赖于时间序列长度,且没有考虑计算后的新粗粒度序列之间的关系从而导致信息的缺失[17]。针对上述问题,结合复合多尺度方法,提出了CMRDE,计算步骤如下:

(1) 粗粒化处理

(8)

式中:1≤k≤τ。

(2) 计算CMRDE

各个尺度因子τ下的CMRDE定义为

(9)

由CMRDE算法可知,在尺度因子为τ时,将原始序列按初始点分别为[1,τ]连续的分割成长度为τ的粗粒化序列,然后对每一小段序列求平均值,再按顺序排列得到τ个新的粗粒化序列,计算新序列的RDE值后对所有熵值求平均。这样不仅减小了熵值随尺度因子增大而产生的波动,而且相对于传统的粗粒化多尺度过程稳定性更好[18]。

2.2 RDE和CMRDE对比试验

CMRDE和RDE的差别主要在于粗粒化过程,当CMRDE的尺度为1时,等同于RDE。为了说明CMRDE的有效性,通过分析式(10)所示三个仿真信号,将CMRDE和RDE进行对比

(10)

三个仿真信号的采样频率为1 kHz,采样点为5 000,CMRDE的参数分别为:c=4;m=2;d=1;τ∈[1~10],分别计算三种仿真信号在1~10尺度因子下的CMRDE,结果如图6所示。并列举了差异明显的五种尺度下的CMRDE,结果如表4所示。

图6 三种仿真信号的CMRDE分布Fig.6 CMRDE distribution of three kinds of simulated signals

表4 三种仿真信号在五种不同尺度下的CMRDETab.4 Three kinds of simulated signals at five different scales of CMRDE

从图6和表4可知,在尺度1时,三种仿真信号的CMRDE非常接近,此时CMRDE即为RDE,说明单一尺度的RDE不能区分三种信号;在尺度4到尺度10,三种信号的CMRDE值存有明显差异,在尺度5和尺度8,这种差异更为明显。因此,CMRDE可以反映不同尺度下信号复杂度的差异,且比RDE具有更好的区分性。

2.3 MRDE和CMRDE对比分析

粉红噪声作为一种常见的噪声,从功率角度来看,其能量从低频向高频不断衰减。CMRDE与MRDE主要差别在于多尺度过程,为了说明复合多尺度的优势,分别采用CMRDE和MRDE进行分析。以数据点数为4 095的粉红噪声为研究对象,其波形如图7所示。两种方法参数选择保持一致,时延为1,嵌入维数为2,类别数为4,其对比结果如图8所示。

图7 粉红噪声波形Fig.7 The waveform of pink noise

图8 粉红噪声在不同尺度下的CMRDE和MRDE对比Fig.8 Comparison of CMRDE and MRDE of pink noise at different scales

由图8可知,在相同参数下,随着尺度因子的增大,MRDE的波动和偏差逐渐增大,而CMRDE的变化趋势则较为平缓,波动很小。因此,对比结果体现了CMRDE的优越性。

3 基于CMRDE的滚动轴承故障诊断方法

3.1 故障诊断方法

旋转机械故障诊断的主要步骤包括故障特征提取和模式识别[19]。

CMRDE能够有效提取滚动轴承振动信号故障特征。为了抑制振动信号中的噪声和无关分量的干扰,论文采用EEMD对原始信号进行分解,达到抑制的目的。EEMD作为经验模态分解(empirical model decomposition,EMD)的一种改进算法,在信号中添加了高斯白噪声进行辅助分析[20],可以有效消减EMD中的模态混叠现象[21-22]。

继提取故障特征后,需对故障模式进行识别。支持向量机(support vector machine,SVM)作为故障识别的方法之一,已被广泛应用于机械故障诊断领域。但是,核函数以及核函数参数(包括径向基核函数参数g和惩罚因子C)的选取会影响SVM对故障分类的准确率[23]。因此,本文引入布谷鸟搜索算法优化的支持向量机[24],自适应地选取核参数。CS算法通过模拟某些种属布谷鸟的寄生育雏来有效地求解最优化问题,同时应用了相关的Levy飞行搜索机制,其分类准确率比其他传统方法更高,CS_SVM的具体步骤如图9所示。

图9 布谷鸟优化支持向量机流程图Fig.9 Flowcharts of CS_SVM

基于上述分析,本文提出了一种基于CMRDE、EEMD和CS_SVM的滚动轴承故障诊断方法。具体步骤如下:①设有m种状态的滚动轴承数据,每种状态数据等分为n个样本,对每个样本进行EEMD分解,选取合适数量的分量进行CMRDE多尺度分析;②将所有CMRDE值重新构造得到一组i×j的数据作为特征向量,从i个数据中选取部分作为分类器的训练样本,剩余部分作为测试样本;③将所有训练样本的故障特征向量输入到基于CS_SVM建立的多故障分类器进行训练;④将测试样本的故障特征向量输入到已训练的多故障分类器识别,依据分类器输出结果实现滚动轴承的故障诊断[25]。

3.2 试验数据分析

为验证所提方法的有效性,将其应用于轴承故障试验数据分析,试验数据来自安徽工业大学自制滚动轴承模拟故障试验台,如图10所示。试验轴承型号为6206-2RS1 SKF,滚子个数为9,内径30 mm,外径62 mm,使用线切割技术对轴承加工模拟故障,分别选取滚动轴承滚动体切割深度为0.2 mm和0.4 mm、内圈切割深度为0.3 mm和0.4 mm、外圈切割深度为0.2 mm和0.3 mm的故障进行试验,正常信号和不同故障程度的信号共7种,试验过程载荷均设置为5 kN,实际转速为1 500 r/min,采样频率为10 240 Hz,采样时间为20 s,每种数据取100个样本,样本长度为2 048,七种状态的轴振动信号时域波形如图11所示。其中1和2为不同程度的故障,如滚动体1为故障直径0.2 mm,滚动体2为故障直径0.4 mm,依次类推。

图10 滚动轴承模拟故障试验台Fig.10 Simulated fault test bench for rolling bearing

图11 滚动轴承的振动信号时域波形Fig.11 Time domain waveform of vibration signals of rolling bearings

上述七种轴承状态,每种状态取长度为2 048的100个样本。首先,每种状态样本经EEMD分解,得到若干个IMF(intrinsic mode function)分量;其次,对分解得到的前三个峭度较大的分量,分别提取10个尺度的CMRDE作为故障特征向量。从每种状态的样本中随机选择50组数据作为训练样本,剩余50组数据作为测试样本,共得到350个训练样本和350个测试样本。将所有训练样本的故障特征向量输入到基于CS_SVM建立的故障分类器中进行训练,其中,为了方便,标记“内圈轻度、内圈重度、外圈轻度、外圈重度、滚动体轻度、滚动体重度、正常”故障的对应类别分别为1,2,3,4,5,6,7;最后,将所有测试样本输入到已训练的多故障分类器进行识别。

采用本文提出的方法对上述七种故障类型的数据进行分析,并将之与MDE、CMDE和MRDE这几种多尺度方法进行对比,每种类型数据不同方法的均值标准差如图12所示。从图12可知,DE和RDE两者呈相反趋势。在尺度因子等于1时,七类故障轴承振动信号的RDE值明显不同,由此可见,RDE适合滚动轴承的故障检测。但是仔细观察发现,当考虑单一尺度的RDE时,七种状态轴承信号的熵值由大到小的顺序为:内圈1、滚动体2、正常、滚动体1、内圈2、外圈2、外圈1,而考虑多个尺度时,这种关系不再成立。这说明单一尺度的RDE值并不能完整地反映故障的全部信息,其它多个尺度也包含重要的故障特征信息。其次,分别对比图12(a)~图12(b)与图12(c)~图12(d)发现,在大多数尺度下,信号CMDE和CMRDE值的标准差均分别小于MDE和MRDE值的标准差,这说明轴承振动信号的CMDE和CMRDE值的标准差比MDE和MRDE的标准差更小,稳定性和可靠性更好,进一步体现出复合的优势。综上,CMRDE能够有效地反映滚动轴承振动信号的故障特征。

(a) MDE

(b) CMDE

(c) MRDE

(d) CMRDE图12 滚动轴承振动信号的DE和RDE均值标准差图Fig.12 The mean standard deviation diagram of DEs and RDEs for rolling bearing vibration signals

采用训练好的分类器对测试样本进行测试,测试结果如图13(a)所示。从图13(a)可知,350个测试样本全部正确分类,故障识别率达到100%,CS优化SVM的最优参数C和g分别为5.950 81和0.529 453。为了对比,将上述的CMRDE换成MRDE、MDE和CMDE,重复同样的试验内容,四种方法参数选择相同(类别数c=4,嵌入维数m=2,时延d=1,尺度因子τ=10),测试集的实际分类和预测分类图分别如图13(a)~图13(d)所示。更详细的采用不同方法进行诊断的故障识别率,以及错分的样本信息和CS_SVM最优参数C和g,如表5所示。

(a) CMRDE

(b) CMDE

(c) MRDE

(d) MDE图13 基于不同方法的CS_SVM测试样本输出结果Fig.13 Outputs of testing samples based on the different fault diagnosis methods

表5 不同方法故障识别率对比Tab.5 Identifying rate comparison of different methods

从图13和表5可知,基于CMDE的CS_SVM分类器输出结果中有4个样本被错分,故障识别率为98.857 1%;基于MRDE和MDE的CS_SVM分类器输出结果中分别有6个和8个样本被错分,故障识别率分别为98.285 7%和97.714 3%,均低于论文方法的识别率,说明了CMRDE相较于其他方法的优越性。

4 结 论

在RDE的基础上,发展了CMRDE。通过仿真与试验信号分析,得到如下结论。

(1) 将CMRDE和RDE进行了对比,结果表明CMRDE比RDE具有更好的区分性;将CMRDE和MRDE进行对比,结果表明CMRDE得到稳定值的一致性更好。

(2) 提出了一种基于CMRDE、EEMD和CS_SVM的滚动轴承故障诊断方法,试验数据分析结果表明:CMRDE能够有效区分滚动轴承的故障类型,且在区分效果和故障识别率等方面优于MRDE、CMDE和MDE方法。

猜你喜欢

标准差分类器尺度
环境史衰败论叙事的正误及其评判尺度
少样本条件下基于K-最近邻及多分类器协同的样本扩增分类
学贯中西(6):阐述ML分类器的工作流程
基于朴素Bayes组合的简易集成分类器①
过程能力指数法在改进中小学教学质量中的应用
基于AdaBoost算法的在线连续极限学习机集成算法
语音信号幅值分布的统计分析
以长时间尺度看世界
9
方差中亟待澄清的两个错误观点