APP下载

DBN参数对双转子不对中故障特征提取的影响及综合评估优选研究

2021-06-30杨大炼张帆宇李仁杰张宏献

振动与冲击 2021年12期
关键词:动量特征提取重构

杨大炼, 张帆宇, 李仁杰, 张宏献,2, 陶 洁

(1.湖南科技大学 机械设备健康维护湖南省重点实验室,湖南 湘潭 411201;2. 柳州工学院,广西 柳州 545006; 3. 湖南科技大学 计算机科学与工程学院,湖南 湘潭 411201)

双转子系统是现代航空发动机、永磁双转子电机、双转子风力发电机等重大装备的关键核心部件[1],转子不对中是其主要的故障形式,不仅导致整机振动过大,甚至引起整个装备损坏停机,造成安全事故[2]。对双转子不对中故障进行准确识别及其重要,但由于双转子结构复杂,不对中形式耦合多样,故障信号呈现高维非线性特性,传统的故障诊断方法难以准确识别。

Hinton等[3]提出了深度置信网络(deep belief network,DBN),很好地解决了特征提取与学习及深层网络训练易陷入局部极小值的问题,具有极强的非线性信息表达能力和判别能力,已在图像识别、声音识别、自然语言处理等领域取得了突破性的进展[4-6]。DBN是一种具有多隐层的概率生成模型,与传统“浅层学习”模型的本质区别在于:通过多隐含层的神经网络,无监督地从输入数据中学习出更多隐含的特征,避免人工特征选取的困难,不但可以很好的过滤噪声,提取出不对中振动数据的细微故障特征,还能降低数据的维度[7]。

由于具有良好的特征表征能力,DBN受到诸多学者的关注,并被应用到机械故障诊断中。如赵光权[8]、李巍华[9]、杨宇[10]、Shao[11]将DBN应用到轴承的故障诊断,获得较好的识别率;李本威等[12]验证了DBN用于涡扇发动机故障诊断的精度明显优于其它方法;雷亚国等[13]利用多级齿轮传动系统的频域信号训练DBN,得出较好的识别效果;郑小霞等[14]采用DBN对风机易损部件故障进行预警,提高了风机易损部件故障预警的准确性;Tamilselva等[15]运用DBN理论对航空发动机结构健康状态和电力变压器健康状态这两个诊断应用实例进行识别,验证了基于DBN健康状态分类技术的有效性。Tran等[16]利用DBN对往复式压缩机阀门健康状态进行识别,获得较好的识别率;Yan等[17]采用DBN进行转子不平衡的故障诊断,相比其他传统方法显著提高了故障识别的效果。

综上所述,DBN在机械运行状态监测和故障识别中的应用还处于起步阶段,但DBN的特征提取性能受网络结构参数(迭代次数、隐含层数、学习率及动量等)的影响很大,由于DBN结构参数与特征提取性能之间的影响规律没有弄清楚,导致现有研究与应用过程中,DBN结构参数主要采用试错法,通过不断的调整来选取,效率低且缺乏理论依据,阻碍了DBN在机械故障诊断领域中的发展应用。针对上述问题,论文拟以双转子系统为对象,通过探明DBN主要结构参数对不同形式的不对中故障振动信号特征提取性能的影响关系,为DBN在双转子系统不对中故障识别中的应用提供结构参数选取依据。

1 DBN简介

DBN模型是由多个限制玻尔兹曼机(restricted boltzmann machine, RBM)[18]组成的多层感知器神经网络,一个用于故障识别的具有5层结构的DBN模型如图1所示。从图1中可以看出,该模型由3个RBM和1个分类器构成,RBM1由第一层和第二层构成,RBM2由第二层和第三层构成,RBM3由第三层和第四层构成。第一层接收输入数据,依次通过三个堆叠RBM对数据进行特征提取。将第三个RBM的输出层结果输入到一个有监督的分类器中,即可对数据进行分类,分类器的输出作为深度置信网络结构的第五层。输入数据的维度决定输入层的节点数,输入数据的分类量决定输出层的节点数。

图1 DBN模型的基本结构

RBM的本质是一种基于能量函数的建模方法,统计物理学中定义能量的模型都可由概率分布转变,因此RBM可通过输入数据集学习概率分布来表示数据的本质特征[19]。每个RBM都具有一个可视层和一个隐含层,可视层与隐含层由若干个神经单元组成,且每个神经元只有激活和未激活两种状态,其状态用{1,0}来表示,层内无连接,只有可视层单元和隐含层单元之间有连接。通过对多个RBM进行堆叠学习,虽然可以表示出复杂数据更深层次的本质,但做不到对不同数据进行分类,因此需要在RBM的最高层添加一个有监督的分类器才能构成一个完整的DBN识别模型。

DBN的训练过程分为两步,第一步为贪婪逐层无监督预训练,低层RBM的输出结果作为高一层RBM的输入,依次逐层传递从而在高层形成比低层更抽象和具有表征能力的特征表示,第二步在增加分类器的基础上,通过有监督的调优,优化DBN的识别能力。

2 DBN的特征提取能力评估指标

DBN的特征提取能力主要取决于RBM的学习能力,故可根据RBM学习的好坏来判定DBN特征提取性能优劣,而重构层和可视层之间的误差大小可以用于评估RBM特征提取能力的好坏,因此论文从输入数据到重构数据的学习过程来研究RBM的振动信号特征提取能力。RBM的学习过程可以看作自编码器中的解码过程,其过程如图2所示。

图2 重构过程示意图

从图2可以得出,从输入数据到重构数据,输入数据会被编码和解码,这个过程会导致输入数据和重构数据之间一定存在误差。

(1)

RBM特征提取能力的好坏由输入数据与重构数据误差大与小决定,即由均方根误差RMSE的大与小决定。为了进一步分析RBM的特征提取能力,采用均方根误差对初始数据和重构数据的具体误差值进行评估。均方根误差RMSE是很好的误差评估指标,其定义表达式为

(2)

3 试 验

3.1 双转子不对中振动测试试验

为了探明DBN结构参数对不对中振动数据特征提取能力,论文开展双转子不对中振动测试试验。试验在苏州东菱振动测试仪器有限公司生产的多功能转子轴承系统动力学性能试验平台上进行,如图3所示,该试验台转子-支撑结构简图如图4所示。其中转子采用五点支承,内转子(低压)采用1-1-1支承方案并将支承座(对应的轴承用相同编号)编号为1#、2#、3#,外转子(高压)采用1-0-1支承并将支承座(对应的轴承用相同编号)编号为4#、5#。内转子和外转子采用转速可调的伺服电机进行独立驱动。

图3 双转子试验台

图4 双转子试验台转子-支撑结构简图

为减少故障信号传递衰减,尽量获取信号的真实信息,将加速度传感器直接安装在支承座上。本试验一共选取了1个测点,记为:S1。内转子转速设为1 500 r/min,外转子转速设为2 400 r/min,且内转子与外转子转动方向相反;信号采集系统为丹麦Brüel & Kjær振动测试系统,采样频率为8 192 Hz,采样时间为60 s,每种工况采样点数为491 520。

通过在双转子振动试验台不同支承座底部处添加不同厚度的调整垫片来调整转子系统的不对中状态,其中定义添加调整垫片为0.2 mm时为轻度不对中,添加调整垫片为0.5 mm时为严重不对中。试验共模拟了7种不对中状态,分别标号为T1~T7,主要不对中状态描述如表1所示。

表1 试验工况描述

3.2 RBM的振动信号特征提取试验

特征提取试验所用数据集为双转子不对中状态测试数据。每个样本由1 024个原始振动数据组成,每个类别100个样本,随机取每类数据的80%作为训练集样本,其它作为测试样本,数据集信息如表2所示。

表2 数据集信息

RBM的网络结构参数(迭代次数、隐含层节点数、学习率、动量)是影响RBM特征提取能力的主要因素,为了研究RBM的振动信号特征提取能力,本试验共分为3组并分别命名为G1,G2,G3,所有试验环境为:计算机CPU为Inter酷睿i5 4210U,内存为4 GB。为了消除随机误差,各试验重复进行100次,结果取重复试验的平均值。具体设置如下:

G1:研究不同迭代次数下RBM的振动信号特征提取能力。试验过程如下:隐含层节点数设为800、学习率设为0.01、将初始动量设为0.1,迭代10次后设为0.2;迭代次数分别设定为10、20、50、100、200、500。

G2:研究不同隐含层节点数目下RBM的振动信号特征提取能力。试验过程如下:设定隐含层节点数分别为100、200、500、1 000、1 500、2 000,迭代次数设置为G1的最优值,其他参数与G1相同。

G3:研究不同学习率及动量项下RBM的振动信号特征提取能力。试验过程如下:设学习率及迭代十次后动量项设置的值分别0.01及0.1记为[0.01 0.1],将RBM的学习率及迭代十次后的动量项分别设为[0.01 0.1]、[0.01 0.4]、[0.01 0.7]、[0.1 0.1]、[0.1 0.4]、[0.1 0.7],隐含层节点数取G2的最优值,其他参数设置与G2相同。

4 结果分析

4.1 不同迭代次数下信号特征提取性能分析

由试验G1得到不同迭代次数下输入曲线和重构曲线如图5所示。为了更好的观察输入曲线和重构曲线的误差,图中只给出了1-160维的数据,以便观察局部细节。

图5直观的呈现了不同迭代次数下输入曲线和重构曲线之间的误差。可以看到输入曲线和重构曲线之间的误差随着迭代次数的增加逐渐减小,在迭代次数为50次以下时,两条曲线的差别非常明显,如图5(a),5(b)、5(c)所示。随着迭代次数的增加,重构数据与输入数据的吻合程度越高,当达到200次以上时,几乎看不出两条曲线的差别,如图5(e)、5(f)。因此对于双转子不对中状态测试数据,可以认为,经过迭代训练达到200次后,输入数据可较好映射至了RBM的隐含层,即RBM隐含层可很好的对双转子不对中状态测试数据进行特征表示。

图5 不同迭代次数下RBM输入曲线和重构曲线

不同迭代次数下输入数据和重构数据之间的RMSE和训练时间如表3所示。从表3可以看出,RMSE和训练时间都随着迭代次数的增加而增加,迭代次数在10~50时,RMSE的幅度变化很快;当迭代次数增加至100次以上时,RMSE的幅值变化会越来越小。因此综合训练效率与误差变化大小,迭代次数选为200次是较为合适的。

表3 不同迭代次数定量指标比较结果

4.2 不同隐含层节点数下信号特征提取性能分析

不同隐含层节点数下输入曲线和重构曲线如图6所示。图中只给出了1~160维的数据,以便观察局部细节。从图6(d)~6(f)可以观察得到,当隐含层节点数大于1 000时,输入曲线和重构曲线之间几乎没有误差。而隐含层节点数小于200时,输入曲线和重构曲线的误差最大,如图6(a)所示。说明隐含层节点数远小于输入节点数将导致隐含层不足以从数据中提取全部特征。

图6 不同隐含层节点数下RBM输入曲线和重构曲线

不同隐含层节点数下输入数据和重构数据之间的和训练时间如表4所示。

表4 不同隐含层节点数定量指标比较结果

从表4可以看出,训练时间与隐含层节点数成比例增加;RMSE随着RBM 隐含层节点数的增大而减小直至节点数设置为1 500,而隐含层节点数为2 000时相对于隐含层节点数为1 500时的RMSE值略微降低,且训练时间多了约300 s。因此,综合训练效率与误差变化大小,对于双转子不对中状态测试数据,隐含层节点数选择1 000-1 500是较为合理的。

4.3 不同学习率及动量项下信号特征提取性能分析

不同学习率及动量项下输入曲线和重构曲线如图7所示。图中只给出了160维的数据,以便观察局部细节。

从图7(a)、7(b)、7(d)、7(e)可以看出,学习率及动量项为[0.01 0.1]、[0.01 0.4]、[0.1 0.1]、[0.1 0.4]时,输入曲线和重构曲线几乎没有误差。当动量项为0.7时重构曲线几乎为一条直线与输入曲线差异很大,如图7(c)、7(f)所示。这说明动量项过大会导致无法收敛,导致对应部分的重构曲线几乎为一条直线。对比图7中相同动量项下不同学习率下的重构误差曲线可知,学习率在0.01~0.1之间对预训练过程几乎没有影响。因此,学习率对预训练的影响小,动量项最优区间为0.1~0.4。

为了进一步评估输入数据和重构数据的误差,根据第3节中的定量评估方法,计算不同学习率下输入数据和重构数据之间的RMSE和训练时间如表5所示。

表5 不同学习率及动量项定量指标比较结果

从表5可以看出,学习率及动量项为[0.01 0.1]、[0.01 0.4]、[0.1 0.1]、[0.1 0.4]时对应的RMSE较小,动量项为0.7时,对应的RMSE较大,在相同动量项不同学习率时对应的RMSE相差不大,这与从图7中观察的结果是一致的。训练时间不随学习率及动量项的对变化而变化,维持在940 s左右。因此对于双转子不对中状态测试数据,动量项选择0.1~0.4之间是较为合理的,学习率在0.01~0.1之间对预训练的影响较小。

图7 不同学习率及动量项下RBM输入曲线和重构曲线

4.4 优化DBN参数下的不对中特征识别结果分析

利用DBN对不对中故障进行识别,根据5.1节分析结果,将最大迭代次数设为200次;根据5.2节分析结果,将隐含层节点数设为1 500;根据5.3节分析结果,将学习率设为0.01,初始动量设为0.1,迭代10次后,动量变为0.4,网络结构为5层,结构参数为:1024-1500-1500-1500-7。为了进一步验证优化DBN参数的有效性,实验随机选取三组非优化参数进行对比,计算不同参数下DBN模型对相同样本进行识别。其参数设置如表6所示。

表6 不对中故障识别DBN模型参数设置

为了消除随机性误差,每次试验都重复100次,取100次结果的平均值。平均分类识别准确率如表7所示。

表7 双转子不对中故障识别结果

从表7可以得出,实验L1经过参数优化选取后的DBN 的平均识别率最高,达到86.84%。实验L2中由于迭代次数仅为50次,其原始数据与重构数据之间的误差大于迭代次数为200次时原始数据与重构数据之间的误差,从而导致平均识别率低于L1的平均识别率,为79.38%;实验L3中隐含层节点数为500,不足以从数据中提取全部特征,因此平均识别率低于L1的平均识别率,为82.02%。L4中学习率设0.1,初始动量设为0.1,迭代10次后,动量变为0.7,在该参数下迭代过程无法收敛最终导致所有的数据都分为一类,只有14.29%。可以,参数优化后的DBN模型明显提高了双转子不对中故障的识别准确率。

5 结 论

(1)迭代次数越多DBN振动信号特征提取能力越强,综合训练误差和训练时间,对于双转子不对中故障识别,迭代次数在200次是较为合适。

(2)对于双转子不对中故障识别DBN模型,当输入层节点数为1 024时,隐含层节点数选择1 000~1 500是较为合理。

(3)对于双转子不对中故障识别DBN模型,学习率在0.01~0.1之间对预训练的影响较小,动量项在0.1~0.4之间选取是较为合理。

猜你喜欢

动量特征提取重构
长城叙事的重构
应用动量守恒定律解题之秘诀
原子物理与动量、能量的结合
动量相关知识的理解和应用
北方大陆 重构未来
基于Daubechies(dbN)的飞行器音频特征提取
北京的重构与再造
Bagging RCSP脑电特征提取算法
论中止行为及其对中止犯的重构
基于MED和循环域解调的多故障特征提取