APP下载

基于粒子群优化以及深度胶囊网络的轴承故障诊断∗

2021-03-22张振良刘君强

计算机与数字工程 2021年2期
关键词:轴承卷积胶囊

张振良 刘君强 张 曦 黄 亮

(南京航空航天大学民航学院 南京 210000)

1 引言

在维修业中,发动机设备故障中有30%左右的故障源于轴承失效,而且轴承故障寿命有着高离散性的特点,极难制定合适的定时维修方式。因此,对轴承的故障诊断有着重要意义。轴承的振动信号中包含着大量信息,体现为多种振动分量的混合,这些分量一般以混合叠加以及乘性调制的方式体现在振动信号中,而且包含背景噪声的影响。现有的轴承故障诊断方式可归纳为基于数据的诊断方式和基于模型的诊断方式。

基于模型的诊断方式多采用经验模态分解[1](EMD)、独立成分分析(ICA)等方法直接对振动数据进行分解,设置模型对分解结果进行分类预测。如郭艳平、龙涛元[2]根据轴承振动信号的特殊性质,建立了轴承在各种故障时的信号模型,然后采用EMD 算法对原始振动信号做分解,并以峭度为依据进行信号重构,最后计算重构信号与不同信号模型之间的相关系数,根据系数大小可准确判断故障类型。

基于数据的诊断方式主要从数据中提取特征来训练神经网络,依靠神经网络的预测结果诊断故障。如张伟、彭高亮提出了具有两个卷积层的卷积神经网络,对振动信号进行卷积提取特征,最后进行诊断。刘晓东、刘朦月[3]等提出了一种基于集合经验模态分解以及利用排列熵进行特征提取的方法,然后利用多分类向量机对故障进行预测,并组成特征向量,最后以概率输出的形式实现对轴承的故障诊断。

但是它们都有着各自的问题,小波分析以及ICA 都存在自适应能力差的问题,当振动信号十分复杂时,人为设置的参数的误差很难把握,EMD 有着模态混淆的问题,且需要满足两条基本假设,预测精度也十分不稳定。在机器学习预测方面,对于轴承的故障预测多采用支持向量机算法(或其改进算法)、卷积神经网络等,学习能力有限。

基于此,本文采用粒子群优化以及时域分析提取振动数据特征,将胶囊网络应用于轴承故障诊断,优化高低层胶囊网络的路由算法,从而提高胶囊间传输性能以及预测精度。

2 振动信号盲源分离以及特征提取

2.1 自相关去噪

当利用盲源分离技术直接对现已知的许多振动数据信号直接进行分离时,在已知噪声的方差且方差很小的时候表现出优秀的性能,一旦失去噪声的先验信息,其分类效果会急剧变差甚至得出完全相反的结论,在民航轴承故障检测中,振动信息收到各种噪声影响,且很难估计噪声的先验信息。所以对振动信号的去噪是必要的。

图1 噪声信号的自相关波形

基于此,自相关降噪法在轴承振动信号的降噪中并不依靠先验信息的同时保留有用信息,可以用于观测信号的降噪。根据自相关函数式(1)的性质,周期性信号的自相关函数与原信号同周期,如图1 所示,当时延τ 为零时,自相关值最大;随着τ的增大,R 很快衰减并趋于零[4]。在轴承数据实际观测信号中,R 并没有随着τ 的增大递减至零。所以可将自相关函数应用于轴承振动信号的降噪中,同时可以最大保留有用信号,有效降低信号中的非周期高斯白噪声。

其中,T 为周期,τ 为时延。从图2 可以看出在τ =0附近时,自相关值较大,这可能是受噪声的影响,因此在实际处理时去掉τ =0 附近的部分自相关数据。当τ 很大时,自相关值也比较大,将这一部分数据也去掉,这样就实现了数据的二次降噪。

图2 转子振动信号自相关波形

2.2 基于粒子群优化的稀疏盲源分离

2.2.1 稀疏盲源分离

盲源分离是为了从观测信号中找出源信号,也就是找到分离矩阵W 通过y=Wx 对源信号进行估计。通过经典的矩阵—矢量映射机制,稀疏盲分离也就是指观测信号数量少于源信号数量[5],本文中只使用两个加速度计来观测四个轴承的振动数据。

粒子群优化算法是一种优化工具,它具有基于全局的寻优能力[6]。先设定在一个含有N 个粒子的多维空间中,Yi(i=1,2,…,N)是一个候选解,表示第i个粒子的位置矢量。根据适应值的大小来衡量粒子Yi的优劣。D 维矢量vi(i=1,2,…,N)表示第i 个粒子的“飞行”速度。记第i 个粒子的最优位置为Pi(i=1,2,…,N);整个粒子群搜索到的最优位置为P。则粒子群优化算法采用式(2),(3)对粒子进行操作,其中w 为权因子;c1和c2为值大于0 的学习因子;r1和r2为随机数,取值大于0小于1。

基于PSO算法的稀疏盲信号分离步骤如下:

1)记由加速度计得到的轴承振动信号平x(t)(t=1,2,…,T)作稀疏变换P 转化为稀疏信号P(x(t)),t=1,2,…T;

2)采用2.2.2中描述的聚类方法,对稀疏信号P(X(t)),t=1,2,…T,进行聚类;

3)对聚类后的每一类确定方向矢量a1,a2,…,an,从而确定混合矩阵A=(a1,a2,…,an);

4)使用PSO算法求解式(4)的优化问题[6]:

5)对P(x(t)),t=1,2,…,T 进行逆变换得到P-1,从而分离出源信号。

2.2.2 数据聚类的粒子群优化算法

G={z1,z2,…,zn}为数据空间,聚类的目标是将所处的空间分为K 个聚类区Ci(i=1,2,…,K),即使下式成立:

mi(i=1,2,…,K)为聚类中心,设Y=(m1,m2,…,mk)表示粒子,则将PSO 应用于进行聚类和mi的步骤如下:

1)初始化Y=(m1,m2,…,mk)及其速度矢量v;

2)若对Y=(m1,m2,…,mk),下式成立:

则把zp归到Cj类,用式(8)作为适应度函数对“粒子”进行评价。

3)求出第i个粒子迄今为止搜索到的最优位置为pi(i=1,2,…,M)和整个粒子群迄今为止搜索到的最优位置为pg;

4)用固定点算法对粒子进行迭代;

5)重复第二到第四步,直到满足条件为止。

2.3 分离效果评价指标

为了评价算法对振动信号分离情况的优劣,需要统一的指标来进行判别。

2.3.1 PI评价

PI(Performance Index)指标是性能指数,利用全局矩阵和广义排列矩阵的差别来评价分离性能[7],定义如下,

其中gji为G 的第(i,j)个元素,G 为全局矩阵,也就是分离矩阵与混合矩阵乘积。PI 值越小表示分离效果越好。

2.3.2 相似系数

定义ρij为相似系数,最小为0,表示sj和si相互统计独立,最大为1,表示sj和si完全相似[7]。

其中si为源信号的第i 个矢量的,sj为经过盲源分离后与si相对应的分离信号。cov表示方差。

2.3.3 二次残差

该指标计算信号与源信号的二次残差(VQM),其值越小表示分离效果越好[2],计算如下:

3 基于优化动态路由算法的深度胶囊网络故障预测

3.1 深度胶囊网络的故障预测方式

胶囊网络由胶囊组成,所谓的胶囊由一组神经元组成,神经元由激活向量反映了某种特定实体的特征,输出是一个向量[7]。其中,胶囊内的神经元活动表示轴承某种故障的的各种属性,包括各种参数如:故障类型、位置等。神经元的向量模长表示故障存在的概率,向量方向代表故障参数。胶囊网络采用Squashing 的非线性函数(式(12))[8]作为激活函数。低层的胶囊通过变换矩阵做出预测,预测结果向更高级的胶囊提供故障的参数信息,当多个预测一致时,激活更高级的胶囊;当低层胶囊的预测向量和高层胶囊的激活向量有较大的标量积时,低层级胶囊就倾向于向高层胶囊输出。

图3 神经元示意图

构建基于胶囊网络的故障分类模块,包括:输入层;卷积层;L 组胶囊层[9]。其中,输入层获得振动信号分离过后的特征。卷积层采用512 个步幅为1的7*7卷积核,对输入的数据进行卷积,第三层是胶囊层并包含卷积运算,开始构建相应的的张量结构作为后续胶囊层的输入,经过多层胶囊预测得到L 层胶囊的的预测向量,此向量在每个方向上的长度表示在十种故障类型上分别的概率,长度最长也就是概率最大的方向上代表的故障便是诊断结果,同时也可由概率大小得到网络对此结果的信任程度。

图4 故障诊断模块

3.2 深度胶囊网络输出向量的构造以及计算

在胶囊网络的学习以及预测中,高低层之间的路由算法决定着高低层间传输的效率的以及整个网络的学习能力,过于复杂的计算方式会导致计算时间过长且难以训练,而对于具体的轴承故障预测,胶囊网络的具体参数以及高低层传输方式都需要结合轴承数据来优化[10]。为进一步阐明具体的诊断方式,接下来结合轴承实际检测数据进行阐述,得到的研究方法也将具有可移植性。

故障分类模块中,输入层取盲分离后轴承的576 个时刻的数据,组成24*24 的矩阵作为胶囊网络的输入数据;卷积层采用512 个步幅为1 的7*7卷积核,对输入的数据进行卷积,该层得到数据矩阵为18*18,输出神经元向量为18*18*512=165888。

在L层胶囊层中,初始胶囊层1包含卷积运算,有64个通道,每个通道包含12维的卷积胶囊(卷积核为7*7),根据卷积定义,通道内每个卷积单元对第二层18*18 的数据进行卷积得到6*6 的数据矩阵,胶囊数量为6*6*64=2304。

如图5 所示,胶囊层2 在胶囊层1 的输出12 维向量的基础上进行传播,假设胶囊层2 工业800 胶囊,每个包含28 个神经元向量。其输出向量模长表示故障存在的概率,方向表示故障参数[11]。

高低层的胶囊连接方式便是由低层的输出向量通过动态路由机制发送到某个合适的高层胶囊,使得最大概率表征故障的存在性,即输出向量被路由到某个高层胶囊使其输出向量的模长最大化,同时保持方向不变,也就是输出向量的参数信息保留到高层胶囊。

图5 胶囊层传播方式

在高低层的连接中,ui∈R12*1(i=1,2,…,2304) 为2304 个低层胶囊输出向量,vj∈R28*1(j=1,2,…,800)表示800 个高层胶囊输出向量,sj∈R28*1(j=1,2,…,800) 表示800 个高层胶囊的输入向量,变换矩阵Wij与ui相乘得到预测向量乘以耦合系数cij作为sj的输入向量。变换矩阵Wij的参数总量为28*12*2304*800=619315200,耦合系数的参数量为2304*800=1843200,决定高低层胶囊间参数量的因素为高低层胶囊的数量以及胶囊输出向量的长度。

1)构造高层胶囊输出向量。由于采用输出向量vj的模长‖ vj‖来表示故障存在的概率,需要其满足大于0 且小于1,因此采用下式的非线性函数来构造vj。其中Tj为缩放因子。这样可以使输入向量都压缩到1以下。

2)高层输出向量的计算。sj是分配给第j个的高层胶囊的预测向量和耦合系数的加权和,其中计算如下。

变换矩阵Wij编码了低层胶囊特征和高层特征的关系[12],包括将12 维低层向量ui进行线性变换到28 维的向量,而变换矩阵的求解通过BP 算法、随机梯度法等都可以轻松得到,这里不再赘述。把分配给第j 个高层胶囊的所有2304 个预测向量通过耦合系数进行加权求和,得到第j 个高层胶囊的输出向量为

3)耦合系数的计算。耦合函数代表着第i个低层胶囊输出向量被分配给第j个高层网络的概率分布,计算方式如下,其中,bij表示低层胶囊i被耦合到高层胶囊j 的对数先验概率,由高低层网络的类型和位置决定。

3.3 多层胶囊之间的动态路由算法

我们通过测量高层胶囊的输出向量与低层胶囊的预测向量之间的一致性来迭代改进初始耦合系数。一致性对应于输出向量和预测向量的内积运算的结果,根据矩阵理论,两者方向相同时内积最大,改进耦合系数之前由内积来更新bij[13]。经多次迭代,预测向量被较大概率的分配到与输出向量一致性大的高层网络。

从数学优化的角度给出改进的路由算法,将其简化为求解一下数学优化问题:

约束为

其中,S={ sj},(j=1,2,…,800),表示高层胶囊输出向量组成的参数空间,C={cij},(i=1,2,…,2304,j=1,2,…,800)表示耦合系数组成的参数空间,‖ Wij‖F表示变换矩阵的Frobenius 函数。目标函数中第一项与向量oj|i,sj的一致性相关,第二项包含了耦合系数的先验概率信息,熵正则化因子α 用于调整第二项的权重,达到与第一项合理的折中[14]。

基于以上分析,得出全部胶囊层之间的动态路由算法步骤:

1)用f 表示胶囊层数,初始化层数为1,即第一层为低层胶囊。

2)输入总层数L、每层胶囊的数理、路由算法迭代步数R以及输出向量维数。

3)判断f<L,若是,接第四步。若不是,算法结束,得到L层输出向量。

4)选取第f 层为低层胶囊,读取低层胶囊总数I,用i 表示单个胶囊;选取第f+1 层为高层胶囊,读取高层胶囊总数J,用j表示单个胶囊并构建优化问题,设置初始迭代步数r=0;初始化bij=0。

5)判断r<R,若不是,输出,令f=f+1,转到第三步。若是,接第六步。

6)计算耦合系数、高层胶囊输出向量、更新缩放因子,令r=r+1,接第五步。

采用类似的分析方法,得到其余胶囊层的动态路由算法,从而将低层胶囊所包含的民航轴承振动信息传递给高层胶囊,在最高阶层的L 胶囊层得到预测向量,从而对故障进行预测。

3.4 故障诊断的输出

在轴承故障诊断中,故障大致分为三类,内圈、外圈以及滚珠故障,但在民航中,轴承混合故障以及故障的严重程度也应该是制定维修方案的依据,其中将内(外)圈损坏或裂纹部分占比整个内(外)圈的5%以下的表示为轻度内(外)圈损坏,滚珠损坏数量为一个的表示为轻度滚珠故障。当有两种以上故障同时存在时,表示为混合故障,混合故障都有着严重的安全威胁,所以不再具体细分轻重[14]。具体见表1。

表1 故障类别

4 实例分析

4.1 实例数据信息

实验数据采集自美国凯斯西储大学轴承数据库[15]。数据采集设备在一个轴上具有四个轴承位置。交流电机通过摩擦带连接到轴上,使转速保持在2000r/min。轴上施加6000 磅的径向载荷,弹簧机构对轴承施加径向载荷。所有轴承都有力润滑。如图6所示,在轴上安装了Rexnord za-2115双列轴承,在轴承外壳上安装了高灵敏度石英ICP 加速度计。传感器位置也如图6 所示。所有故障都发生在轴承超过设计寿命之后,超过1亿转。

4.2 振动信号处理

我们将十种故障形态的轴承各二十组分别放入实验设备中,由加速度计收集振动数据。其中图7(a)滚珠外圈同时故障轴承的振动信号,图7(b)为选取轻度内圈损坏轴承的振动信号,分别将振动信号经过自相关降噪后如图8。将图7(a)经粒子群优化算法分离出两个源振动数据,如图9所示。

4.3 时域分析以及卷积

胶囊网络难以读懂振动信号,所以我们将处理后的振动信号进行时域分析变成时域图像,再进行卷积来获得其特征输入到网络中训练。将图7(a)稀疏盲分离后的振动信号图9(a)以及图9(b)进行S变换进行时域分析,得到时域图(图10),选取576个特征组成24*24 的矩阵输入到第一层进行卷积,卷积过程如图11,将时域图特征经过五层卷积层后经由全连接层传输到胶囊网络。

图6 实验设备示意图

图7 振动观测数据

图8 振动数据自相关降噪

图9 稀疏盲分离

图10 轴承振动时域分析

图11 时域图卷积过程

4.4 胶囊网络训练

经由上述步骤,收集所有故障轴承的振动信号并输入到胶囊网络中训练,得到成熟的胶囊网络用以预测轴承故障。

在训练过程中,选择部分轴承的振动数据作为测试样本,去噪卷积之后输入到网络中进行预测,并计算预测正确率的变化情况,与卷积神经网络作比较,具体如图12,可见胶囊网络在具有少量训练数据时具有巨大优势。

图12 预测精度变化

5 实验结果

5.1 实验结果

经粒子群优化算法分离后的数据与源数据进行对比,计算分离效果评价体系的指标。结果如表2,与ICA 等算法相比,PSO 在盲分离时更精确地还原了源振动信号,为接下来的时域分析以及胶囊网络学习提供了可靠的数据。

表2 信号分解指标

需要进行识别的轴承类型共有10 类,样本来源于S 变换后的时频图像样本,输入图像尺寸为32×32。每一类样本共有1000 个,随机选择其中的50%用作训练样本集,余下的作为测试样本集。随机选择样本20 次,

将测试轴承放入实验设备并收集振动信号,如4.1 节以及4.2 节所示,将振动信号去噪、盲分离、S变换、卷积后的特征输入到训练后的胶囊网络中,得到高维向量也就是预测结果,并计算预测正确率。按照同样的方法提取特征使用EMD 以及卷积神经网络进行预测[16],并计算预测正确率如图13所示。

图13 预测精度比较

从图13 可以看出,三类故障检测方法中,Cap⁃sNet 的结果是最好的,20 次随机选择样本的过程中,只有一次的预测正确率稍低,为99.14%,其他的均是在99.9%以上。EMD的识别结果最差,虽然每次的预测正确率均维持在94%以上,但是结果不稳定,而且总体的识别率也低于另外两种方法下的识别率。

6 结语

本文研究了胶囊网络以及PSO 算法在轴承的诊断中的性能,并通过试验证明,此方法可以保障预测的稳定性和精确性。可以得出结论:粒子群优化算法可以通过搜索算子在稀疏盲分离时保留更多有效信息,通过时域分析进行卷积可以有效提取振动特征,胶囊间动态路由算法阐明了高低层胶囊的信息交互,将信息传递转化为数学优化问题,极大地减轻了计算量。

目前该算法仍存在不成熟的地方,如耗时长,胶囊间路由算法仍可继续优化。但相信胶囊网络能够为故障诊断提供新的思路。

猜你喜欢

轴承卷积胶囊
基于全卷积神经网络的猪背膘厚快速准确测定
基于图像处理与卷积神经网络的零件识别
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
接触式密封在大功率半直驱永磁风力发电机应用探讨123
斯凯孚展示用于电动汽车的先进轴承产品
胶囊要用凉开水服
一种轴承拆卸装置的实用设计
轴承,转动的传奇
我有一颗神奇胶囊