APP下载

基于无限特征选择层次链接无限隐Markov模型的轴承故障诊断方法研究

2022-10-14李舒扬李志农周世健毛清华张旭辉

兵器装备工程学报 2022年9期
关键词:特征选择尺度轴承

李舒扬,李志农,周世健,毛清华,张旭辉

(1.南昌航空大学 无损检测技术教育部重点实验室, 南昌 330063; 2.西安科技大学 陕西省矿山机电装备智能监测重点实验室, 西安 710054)

1 引言

滚动轴承的故障诊断通常分为特征提取和模式识别,在特征提取的过程中特征选择显得尤为重要。在经过特征选择后,提取的故障特征包含更有效的信息,输入到建立的模型中,训练才能准确地识别每一种故障。

现阶段在对信号进行特征提取前会有特征选择的过程。鉴于此,近年来特征选择的研究方法主要有:雷惠敏等采用了一种基于ReliefF过滤式和Wrapper封装式的特征选择方法,使用粒子群优化算法为Wrapper的搜索算法,再将ReliefF预选之后的特征子集进行评估,从而选择出子集中最优的特征子集输入到随机森林算法里评估。张彦杰等为了提高感知层设备的身份识别效率,解决设备中指纹识别问题,提出了基于专家信息加权机制的特征选择策略,并以该策略来确定合适的特征子集。Khan等提出了基于混合特征选择算法和多规则惩罚正则化回归技术的血压无袖带测量,结合了特征提取和混合特征选择,减少了后续BP测量过程中特征数量的选择。Li等研究了基于特征选择的排序学习后,发现因为最大化分类性能和最小化特征选择,导致特征选择具有更大的挑战性,采用了包含克隆选择算子和变异算子的精英选择策略。Hu等考虑到基于图的多标签特征选择采用固定的图拉普拉斯矩阵,使得模型性能表现不佳,改进得到了动态子空间二部图正则化多标签特征选择方法。Deng等利用遗传算法进行特征选择,对所选特征的序列进行优化。

隐Markov模型(hidden markov model,HMM)是由Baum于20世纪70年代率先提出并建立起来的。HMM作为一种时间序列的统计模型,在轴承故障诊断领域应用广泛。李道军等针对滚动轴承的信号具有非线性和非平稳的情况,将HMM与布谷鸟搜索(CS)、优化模态分解(VMD)结合,利用CS优化VMD模态分解个数与二次惩罚因子,再寻优得到参数组合。高山等提出了基于全矢谱和EEMD的HMM轴承故障诊断方法,通过对EEMD分解后相关性较高分量全矢融合,再进行HMM训练识别。赫芳等研究了滚动轴承发生故障时呈现循环平稳特征,引入谱相关密度组合切片能量熵,提出了基于连续隐马尔可夫的轴承故障诊断方法。路艳群等将HMM应用到公交车辆轴承的故障诊断上,试验结果证明了该方法的有效性和可行性。李奕江等将HMM优秀的时间序列分类能力和VMD良好的信号处理方法相结合,提出了基于VMD-HMM的滚动轴承磨损状态识别。李志农等将HMM引入到国内轴承故障诊断领域并探讨了其优劣性。然而,在基于HMM的故障诊断中,无法准确定义隐状态数目,与其在EM算法中的M步骤估计存在问题,导致HMM在一些领域应用受到了较大的限制。2002年,Beal提出的无限隐Markov模型(infinite hidden markov model,iHMM)通过引入Dirichlet过程,再将Dirichlet过程叠加为2级的分层模型,使得iHMM在模型训练时不再拘泥于有限个隐状态的数量,并且隐状态数在迭代过程中也能自适应地收敛到固定值。

随着问题的深入研究,iHMM故障诊断方法也暴露了一些不足,例如,该模型对多故障旋转部件诊断时需对各个故障进行单独建模,此处割裂了各个故障产生时之间联系。与此同时,参数自转移的问题也会对后续的诊断过程造成很大的影响。

为了解决上述存在的问题,Sohn在2015年首先提出了层次链接无限隐Markov模型(hierarchically linked infinite Hidden Markov Model,hiHMM)的概念。在模型本身的构造上,联立多个iHMM,共同推断出模型的状态转移矩阵和发射矩阵,保留了原数据集的相关信息。

文献[16-17]表明轴承的故障信号从时域上具有脉冲性与循环平稳性。而熵作为一种能较好反映时间序列复杂度的指标,近年来被逐渐应用在轴承故障诊断中。排列熵是一种时间序列的自然复杂性度量,曾在行星齿轮箱的故障诊断中被应用。

基于上述理论,本文将无限特征算法与层次链接无限隐Markov模型相结合,并应用在滚动轴承故障诊断领域,提出了基于无限特征选择的层次链接无限隐Markov模型的轴承故障诊断方法。

2 无限特征选择的层次链接无限隐Markov故障诊断方法

2.1 hiHMM算法

层次链接无限隐Markov模型(hiHMM)是基于Dirichlet过程(dirichlet process,DP)来建立,其数学表达式可以表示为:

~()

(1)

(2)

(3)

(4)

(5)

式(1)~(5)中:表示基测度;表示由控制产生的基分布;表示第1层基分布;表示第2层基分布;表示一个统计分布;表示统计分布产生的变量;是以为函数而产生的变量;表示在某个体系下多个不同的类似数据集的数量,∈(1,2,3,…,)。并在相邻数据之间引入了明确的自转移概率,即:

(6)

基于上述该模型的描述,hiHMM的模型示意图如图1。

图1 hiHMM数学模型示意图Fig.1 Schematic diagram of hiHMM mathematical model

2.2 无限特征选择

本文使用多尺度排列熵作为基础的特征提取量,计算过程如下:

(7)

使用粒子群算法对多尺度排列熵中的具体参数尺度因子、嵌入维数、序列长度和延迟时间进行优化选择,最后得到优化后的多尺度排列熵。令不同尺度下的排列熵形成序列()={,,,…,()},定义偏度值,多尺度排列熵的偏度值计算公式为:

()=[()-()][()]

(8)

式(8)中:()对()求取均值;()对()求取标准差值。

优化的目标函数定义为:

()=

(9)

优化并计算多尺度排列熵的具体流程如图2所示。

图2 多尺度排列熵提取及优化流程框图Fig.2 Multi-scale permutation entropy extraction and optimization steps

将其参数经过粒子群算法优化后,提取出的特征量具有冗余性和高维性,无限特征算法可以较好地评估选定的特征,因此采用此方法对提取后的特征量进行选择。

无限特征(Inf-FS)由Roffo等于2020年提出,它的本质为基于图框架的特征快速过滤方法。无限特征将特征子集视为图上的路径,来对特征进行排序与选择。图框架由以下3步组成。

第1步:建立无向全连通加权图。节点向量与特征量一一对应,每条节点向量到另一个节点向量的连通路径都视为一个权重值。

第2步:使用与图像关联的加权邻接矩阵来评估第1步中每个特征的值。此处借鉴了马尔可夫链的概念与矩阵幂级数的思想。

第3步:最后对排名的特征量进行聚类,并自动选择排名的阈值。经过3步处理后得到一个包含较高价值的特征集和一个需要丢弃的特征集。

其具体数学表达式如下:

(10)

(11)

(12)

计算出给定路径下的单个特征量的得分为:

(13)

为解决无穷多个会导致和值发散的问题,定义一个正则化因子,表示路径的权重。将式(13)重新定义为:

(14)

利用矩阵几何幂级数的收敛性可以计算出:

=(-r)-

(15)

最终,最具有辨别力和相关性的特征排名第一,其余特征量会根据它们的辨别力和相关性分别依次往下罗列。

基于上述理论,首先利用优化后的多尺度排列熵来获得滚动轴承信号的特征量,并使用无限特征对获得的特征量进行筛选排列,选择出最具有代表性的特征量输入层次链接无限隐Markov模型中训练。诊断流程如图3所示。

图3 优化多尺度排列熵提取无限特征选择后的hiHMM诊断流程框图Fig.3 hiHMM diagnosis flowchart after optimized multi-scale permutation entropy extraction infinite feature selection

3 实验

3.1 实验数据

本实验数据采用美国凯斯西储大学轴承数据中心的滚动轴承故障数据。该实验平台由一个2马力的电动机、一个转矩传感器、一个功率计和一个电子控制装置所组成。在驱动端使用的是型号为6205-2RS JEM SKF的深沟球轴承,在风扇端使用的是型号为6203-2RS JEM SKF的深沟球轴承,其采样频率为12 kHz。

选取的数据为:2组正常情况下的数据,故障直径为0.007英寸下内圈、外圈和滚珠故障数据各2组,共计8组数据。其中,将4组数据作为训练集数据,4组数据作为测试集数据。

凯斯西储大学轴承实验台如图4所示。

图4 凯斯西储大学轴承实验台装置图Fig.4 Bearing test bench

输入的数据是进行了傅里叶变换预处理后的轴承数据。

3.2 特征提取与模型训练

多尺度排列熵对振动信号的处理效果与其参数选取密切相关。使用粒子群算法对多尺度排列熵的4个参数(尺度因子、嵌入维数、序列长度和延迟时间)进行优化。

在每种故障数据集中,随机选择出25组测试集数据和20组训练集数据,输入粒子群算法,得到优化后的尺度排列熵参数,并对20组训练集数据与25组测试集数据进行多尺度排列熵的提取。4种滚动轴承故障特征提取效果如图5—图8所示。并附加测试集25个特征图例与训练集20个特征图例,适用于各个滚动轴承故障训练集与测试集。

图5 滚珠故障优化多尺度排列熵图Fig.5 Ball failure optimization multi-scale permutation entropy diagram

图6 内圈故障优化多尺度排列熵图Fig.6 Multi-scale permutation entropy map for inner ring fault optimization

图7 外圈故障优化多尺度排列熵图Fig.7 Outer ring fault optimization multi-scale permutation entropy diagram

图8 正常状态优化多尺度排列熵图Fig.8 Optimal multi-scale permutation entropy map in normal state

得到了多尺度排列熵特征提取后的4种滚动轴承数据后,对共计20组训练数据进行特征量的筛选。筛选掉包含冗余的故障信息,获得具有较大价值的特征量并进行训练,可以使后续的识别器hiHMM对每一种滚动轴承故障的识别效果更准确。

此处使用无限特征算法,对20组训练数据集重新排序,20组训练集经无限特征算法选择后的权重值显示如图9—图12所示,考虑到模型训练过程的复杂程度和hiHMM的识别性能,本实验将排名为前5的特征量作为新的训练数据集,每种故障的具体排序结果如表1所示。

图9 滚珠故障无限特征权重值与排序曲线Fig.9 Infinite feature weight value and sorting of ball failure

图10 内圈故障无限特征权重值与排序曲线Fig.10 Unlimited feature weight value and ranking of inner ring faults

图11 外圈故障无限特征权重值与排序曲线Fig.11 Outer ring fault infinite feature weight value and ranking

图12 正常状态无限特征权重值与排序曲线Fig.12 Normal state unlimited feature weight value and ranking

表1 无限特征选取特征量Tab1 Infinite feature selection feature quantity

将4种轴承故障的训练集输入到统一的一个hiHMM中进行训练,经2 000次迭代后分别得到4个hiHMM总模型,4个总模型包含hiHMM_boll、hiHMM_inner、hiHMM_outer和hiHMM_normal共计4种不同状态。其中,每种故障都包含5个hiHMM的小训练模型。在每种故障的5个小型hiHMM里选取其中1个进行展示。

图13为隐状态的数量收敛轨迹图。在任意给定初始隐状态数的情况下,经过迭代得到收敛曲线,当收敛曲线中明显看到一个相对稳定值时,将其选为隐状态的先验参数,从图13中可以看出,即使值有时候会发生跳变,但是大多数情况下是稳定在9~10。

图13 滚珠故障hiHMM隐状态收敛轨迹图Fig.13 Convergence diagram of hidden state of ball failure

图14表示hiHMM的输出参量,具体的输出参数为状态转移矩阵、发射矩阵、初始概率向量。状态转移矩阵:表示隐状态由一个状态转移到另一个状态的概率值,经迭代后收敛时确定一个数值,状态转移矩阵的行列数都为该数值;发射矩阵:表示由当前机械运行时刻对应的隐状态转移到观测状态的概率,行数为隐状态数,列数为观测状态数;初始概率向量:表示每种隐状态最初分配的每种隐状态的概率,概率总和为1,即100%。

图14 滚珠故障模型训练输出参量示意图Fig.14 Training output of ball failure model

4 实验结果与分析

4.1 实验结果

将25组进行同样特征提取后的故障数据测试集输入到hiHMM识别器中识别,每种故障5×25共计125个点。识别结果如图15—图18所示。表2中用具体数字及识别率展现了实验结果。

图15 滚珠故障hiHMM识别图(其中1组)Fig.15 Ball fault identification diagram(one of them)

图16 内圈故障hiHMM识别图(其中1组)Fig.16 Inner ring fault identification diagram(one of them)

图17 外圈故障hiHMM识别图(其中1组)Fig.17 Outer ring fault identification diagram(one of them)

图18 正常状态hiHMM识别图(其中1组)Fig.18 Normal state recognition diagram(one of them)

表2 无限特征选择后多尺度排列熵hiHMM滚动轴承识别率实验结果Table 2 Multi-scale permutation entropy after infinite feature selection hiHMM rolling bearing identification table

4.2 实验结果分析

由表2与图15—图18可知,本文所提出方法在对4种滚动轴承故障诊断上的识别正确率是较高的。在对滚珠故障进行识别时,125个滚珠故障样本中,只有1个样本被错误地分类到外圈故障;在对内圈故障进行识别时,125个内圈样本中,其中1个被识别为滚珠故障,3个被识别为外圈故障;而外圈故障和正常状态的识别准确率非常好的。

4.3 实验对比分析

为了对比hiHMM对滚动轴承识别的有效性,将本文所提出的识别方法与无限特征排序后的iHMM轴承识别、随机特征量选取后的hiHMM故障识别进行了对比。

前期特征提取的方式与之前的方法一样,对比实验1是使用无限特征排序后的iHMM对滚动轴承进行识别,识别结果如表3所示。对比实验2是使用随机特征选取后的hiHMM对滚动轴承识别,识别结果如表4所示。

对表3、表4进行分析,iHMM在对3种故障的识别效果都是不错的,但是对正常状态下的滚动轴承故障识别收效甚微。相比之下,未采用无限特征算法筛选过滤掉冗余特征量,而是使用随机特征选择后hiHMM对外圈故障与正常状态的识别率,都比不上无限特征选择后hiHMM的识别效果。

表3 无限特征选择后多尺度排列熵iHMM滚动轴承识别率实验结果Table 3 Multi-scale permutation entropy after infinite feature selection iHMM rolling bearing identification table

表4 随机特征选择后多尺度排列熵hiHMM滚动轴承识别Table 4 Multi-scale permutation entropy after random feature selection hiHMM rolling bearing identification table

将三者的总体实验识别正确率放在一起比较,前者99%的值也大于后两者94.8%和98.6%,表明本文提出的方法具有较好的故障诊断能力。

5 结论

1) 搭建了层次链接无限隐Markov故障诊断模型,将其运用到滚动轴承故障诊断领域。

2) 在特征量选择上引入了无限特征算法,对提取完的特征进行筛选,选取出包含故障信息量大的数据作为训练模型的输入。

3) 对比了使用无限特征选择下训练得到的无限隐Markov故障诊断模型与使用随机特征量选取输入训练的层次链接无限隐Markov故障诊断模型,证明了本文提出的基于无限特征选取下hiHMM轴承故障诊断方法在旋转机械故障诊断方面的有效性,在工程应用中有较大的使用价值。

猜你喜欢

特征选择尺度轴承
接触式密封在大功率半直驱永磁风力发电机应用探讨123
斯凯孚展示用于电动汽车的先进轴承产品
一种轴承拆卸装置的实用设计
尺度
基于智能优化算法选择特征的网络入侵检测
故障诊断中的数据建模与特征选择
reliefF算法在数据发布隐私保护中的应用研究
一种多特征融合的中文微博评价对象提取方法
以长时间尺度看世界
9