APP下载

基于机器学习算法的寿命预测与故障诊断技术的发展综述

2019-03-19

计算机测量与控制 2019年3期
关键词:寿命故障诊断向量

(西南交通大学 数学学院统计系,成都 611756)

0 引言

寿命预测与故障诊断是可靠性分析中的两大基本问题。寿命预测,也被称为剩余服役寿命预测或剩余使用寿命预测,指在规定的运行工况下,能够保证机器安全、经济运行的剩余时间,而在可靠性工程中的寿命预测是进行预测与健康管理的关键技术,是减少生产损失的方法,可以节省维护成本。故障诊断则是指故障检测和故障隔离这两个过程,其中利用各种检查和测试方法,发现系统和设备是否存在故障的过程是故障检测;故障隔离则是要求把故障定位到实施修理时可更换的产品层次(可更换单位),因此故障诊断可以判定出设备故障类型与故障部位,从而对设备进行维修,减少由于设备停运时间过长而造成的损失。

针对不同的时期,寿命预测分为早期预测和中晚期预测[1]。在可靠性工程领域中,早期寿命预测能确定设备的设计(计算)寿命,中期预测则是通过实况监测还处于设计寿命中的设备从而实现对剩余寿命的预测,从而到达避免设备在使用期间出现意外情况的目的;采用晚期预测是因为设计寿命往往都会比较保守,设备还没有得到充分利用就会被认为已经到达使用寿命,这样一来就会造成很大的经济浪费,因此需要利用晚期预测对累计使用时间已经超过设计寿命的设备进行剩余寿命预测。目前寿命预测的方法大体可以划分为三类:基于力学的寿命预测方法、基于概率统计的寿命预测方法、基于信息新技术的寿命预测方法[2]。从本质上来看,基于力学的寿命预测方法是从动力学特性(失效和破坏机制)上来进行寿命预测,可是当多失效模式发生耦合情况的时候,该方法运用起来就得稍显吃力;根据积累的数据(试验数据与现场数据)来建立统计模型,通过确定寿命分布的特征值以及失效概率,在指定可靠度下预测寿命是基于概率统计的寿命预测方法,但此方法的前提是大量的试验和数据的积累。而如今的数据都来源于试验技术:真实的现场试验以及在实验室进行模拟或加速试验,这两种获取数据的方法都是使用产品原型进行试验,普通类型的机械产品适合这两种常规方法,而对于小批量生产的重大机械装备,其造价昂贵,供货时间也长,因而常规的大样本试验方法是非常不合适的,这个时候就需要采用基于信息新技术的寿命预测方法,做到同时兼顾大/小样本数据达到寿命预测的目的。

在可靠性工程中进行故障诊断的步骤:首先判定设备有无故障,接着分析原因,确定故障类型,最后划分故障类别,诊断出设备具体的故障部位以及故障原因,为恢复故障设备做准备。目前,故障诊断的方法也大致分成三类:基于解析模型的故障诊断方法、基于信号处理的故障诊断方法以及基于人工智能的故障诊断方法[3]。发展最早、研究最系统的故障诊断方法是基于解析模型的故障诊断方法,它能够深入系统本质的动态性质和实时诊断,但是很难获得一个系统模型,同时由于建模中有误差、扰动和噪声,使得鲁棒性问题渐渐凸显;基于信号处理的方法尽管易于实现、实时性也比较好,但在对潜在的故障进行诊断的时候就会凸显其不足之处,因此往往将其用于故障检测。而基于人工智能的故障诊断方法能够克服对于模型的过分依赖性,也能对潜在的故障进行诊断,从而提高故障诊断的精度。

当前处于大数据时代,基于信息新技术的寿命预测方法与基于人工智能的故障诊断方法几乎都是利用机器学习算法来进行,但随着技术的不断进步,机器学习算法的种类也在不断增加,因此本文总结了目前在寿命预测与故障诊断中最常用的几种机器学习算法,分析了现有研究的不足,展望未来的研究重点和发展趋势。

1 机器学习算法简介

机器学习,即是通过自主学习大量数据中存在的规律,获得新经验和知识从而提高计算机智能,使得计算机拥有类似人类的决策能力。

基于学习形式的不同通常可将机器学习算法分为监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)以及强化学习(Reinforcement Learning)三类:

(1)监督学习(Supervised Learning):给学习算法提供标记的数据和所需的输出,对于每一个输入,学习者都被提供了一个回应的目标。监督学习主要被应用于快速高效地教熟AI(Artificial Intelligence)现有的知识,被用于解决分类和回归的问题。常见的算法有:决策树、Adaboost算法、人工神经网络算法(Artificial Neural Networks, ANN)、支持向量机(Support Vector Machine, SVM)、朴素贝叶斯、K近邻、逻辑回归、随机森林。

(2)无监督学习(Unsupervised Learning):给学习算法提供的数据是未标记的,并且要求算法识别输入数据中的模式,主要是建立一个模型,用其试着对输入的数据进行解释,并用于下次输入。现实情况下往往很多数据集都有大量的未标记样本,有标记的样本反而比较少。如果直接弃用,很大程度上会导致模型精度低。这种情况解决的思路往往是结合有标记的样本,通过估计的方法把未标记样本变为伪的有标记样本,所以无监督学习比监督学习更难掌握。主要用于解决聚类和降维问题,常见的算法有:聚类算法(K均值、Expectation Maximization算法、Affinity Propagation聚类、层次聚类)、降维算法(主成分分析、局部线性嵌入降维算法)。

(3)强化学习(Reinforcement Learning)该算法与动态环境相互作用,把环境的反馈作为输入,通过学习选择能达到其目标的最优动作。强化学习这一方法背后的数学原理与监督/非监督学习略有差异。监督/非监督学习更多地应用了统计学,而强化学习更多地结合了离散数学、随机过程这些数学方法。常见的算法有:TD(λ)算法、Q_learning算法。

监督学习、无监督学习、强化学习三类方法的主要区别点见表1。

表1 三类机器学习算法的比较

2 机器学习算法在寿命预测中的应用与发展

目前,机器学习算法在寿命预测中应用最多是基于人工神经网络与支持向量机,并在这些算法的基础上灵活运用其他算法或模型进行优化改进,从而提高寿命预测的精度。

自20世纪80年代以来,人工神经网络(又被称为神经网络或类神经网络)逐渐成为了人工智能领域兴起的研究热点,是从信息处理的角度出发,对人脑的神经元网络进行抽象,从而建立起某种简单的模型,根据不同的连接方式组成不同的网络。人工神经网络属于一类运算模型,是由大量的节点(神经元)相互联接构成的,这里每一个节点都代表一种特定的输出函数,称其为激励函数;而每两个节点间的连接被称为权重,即对通过该连接信号的加权值。网络的输出则随着网络的连接方式、权重值以及激励函数而改变。而网络自身往往是对自然界的某种算法、函数的逼近,或者是对一种逻辑策略的表达。由于现在已知的人工神经网络种类较多,因此目前在寿命预测中通常使用BP(Back Propagation)神经网络以及结合灰色模型与人工神经网络模型的灰色神经网络,也有少量采用其他人工神经网络如极限学习机(Extreme Learning Machine,ELM)、递归神经网络(Recurrent Neural Network, RNN)等。在工程中的应用与研究,仅采用BP神经网络有:文献[4-7]通过BP神经网络分别建立起了继电器剩余寿命的关系模型、油浸式变压器固体绝缘老化模型,机械密封寿命预测模型、AISI1045钢材疲劳寿命预测模型,都得到了较好的寿命预测结果;Elforjani Mohamed[8]等则通对比实验发现BP神经网络预测声射技术机器的慢速轴承的剩余寿命的结果优于支持向量机与高斯回归过程。

但由于BP神经网络的初始权值和阈值是随机获取的,容易导致训练陷入局部最优以及延长收敛时间,因此往往需要用其他算法对BP神经网络进行优化改进。在应用与研究中常常与BP神经网络结合的算法有遗传算法、粒子群算法(Particle Swarm Optimization, PSO),文献[9-12]都是用遗传算法去优化BP神经网络分别预测了LED、刀具、除湿机、液压支架的寿命,发现其预测误差小,普适度高;文献[13-15]则是用粒子群算法优化网络权值及阈值,分别对刀具寿命、电动机绝缘剩余寿命、电镀金刚石套钻使用寿命进行预测,并证明了PSO-BP模型的预测精度较BP神经网络模型有一定的提高。也有采用其他算法进行改进的,文献[16-18]都运用了L-M(Levenberg-Marquardt)算法去训练BP神经网络,但很少有关注到对算法本身进行改进之后再去训练神经网络,而文献[19]则首先对L-M算法进行改进,提出了一种采用了动态动量和阻尼L-M算法的混合优化算法,再结合BP神经网络对轴承的剩余寿命进行了预测。当然,除了BP神经网络以外,工程中还存在其他种类的神经网络的应用与研究,如Zhang[20]等发现在预测刀具剩余寿命预测中,模糊神经网络(Neuro-Fuzzy Network, NFN)的预测效果优于BP神经网络和径向基函数网络(Radial Basis Function Network, RBFN);杜占龙[21]等则针对多分类极限学习机缺乏概率输出能力的问题,提出一种基于由Platt[22]提出的sigmoig后验概率映射和Lagrange成对耦合法的多分类ELM(Multi-class Probabilistic ELM, MPELM),并将其用于剩余寿命预测,实验结果表明,相比于多分类概率支持向量机(Multi-class Probabilistic Support Vector Machine, MPSVM),MPELM耗时高于MPSVM,但MPELM所需优化参数少,预测精度高于MPSVM;与基于Hastie[23]成对耦合法的MPELM相比,两者预测精度相近;Guo[24]等提出了一种基于递归神经网络的健康指标用于轴承的剩余寿命预测,并从实验和工业领域收集的两个轴承数据集进行验证,其结果表明,改进后的模型具有较高的单调性和相关性,提高了剩余寿命的预测精度。表2则详细梳理了以上文献中对于神经网络算法改进的具体创新点。

在工程中常用的机器学习算法除了人工神经网络之外,还有支持向量机。支持向量机是1995年由Vapnik依据统计学习理论提出的一种基于结构风险最小化的二分类器。这里的结构风险最小化是指在保证经验风险(即自检正确率)的基础上,优化分类函数的置信范围(即分类函数的可推广性),取得实际风险的最小。二分类器(Binary Classifier):采用两类样本XA、XB训练得到二分类器SVMA-B,给定测试样本XT,SVMA-B能够判定XT更可能属于类别A或是类别B。介于只使用支持向量机所建寿命预测模型精度较低,一般在工程运用中会将支持向量机与其他寿命预测模型或算法相结合,从而提高预测精度:Chen[25]等提出了基于相似理论与SVM的航空发动机的剩余寿命预测模型,并用数据验证了该模型的有效性;Gao和Huang[26]提出了一种基于多项式核和径向基核函数的新型多核SVM,并运用粒子群优化算法搜索模型的核参数,惩罚因子和权重系数,运用该模型去预测锂电池的剩余使用寿命,并通过验证得到改进后的算法不仅具有更好的预测精度和更强的泛化能力,而且还减少了训练时间和计算复杂度;于震梁[27]等针对现有机械零件剩余寿命预测模型在建模过程中无法同时采用已有数据库数据及被预测产品实时退化数据,提出了一种基于SVM和非线性卡尔曼滤波相结合的机械零件剩余寿命预测模型,并以某型号滚动轴承为例,验证了所提出剩余寿命预测模型的精度、稳定性及工程应用价值;王莉[28]等则提出了一种新的电池寿命预测模型,即基于最小二乘SVM的电池寿命预测,并利用此预测模型对实验数据进行了比较验证,验证结果表明,该模型在阀控式铅酸蓄电池寿命预测中具有很好的实用性,预测值与实测值能够保持很好的一致性,因此,基于最小二乘SVM的阀控式铅酸蓄电池寿命预测方法是切实可行的。表3详细梳理了以上应用与研究对SVM算法进行改进的具体创新点。

除了采用人工神经网络与支持向量机这两种机器学习算法,也有采用朴素贝叶斯与随机森林去进行寿命预测,如Wu[29]等采用了基于随机森林的工具磨损寿命预测的方法,并与前馈反向神经网络、支持向量回归作比较,随机森林寿命预测模型更准确;Ng Selina[30]考虑在恒定工作条件下在不同环境温度和放电电流值下的锂离子电池剩余寿命预测,提出了一种朴素贝叶斯(Native Bayes, NB)模型,用于在不同操作条件下对电池进行剩余寿命预测。在该分析中显示,在恒定放电环境下,可以使用NB方法预测,且不用管操作条件的确切值。并且通过实例表明,NB比SVM产生稳定且有竞争力的预测性能。

从上述应用与研究可以看出,机器学习算法在寿命预测中的发展是由单一算法(BP神经网络、SVM)的应用作为起点,为了提高预测精度以及改进算法在不同零件、设备寿命预测中的不足之处,从而将其他种类算法与之结合。而随着人工智能领域的不断发展,又引入了其他种类的机器学习算法,如随机森林、朴素贝叶斯等。

3 机器学习算法在故障诊断中的应用与发展

在数学问题中,故障诊断属于分类问题,故而可以选用机器学习算法中的分类算法进行故障诊断。一般情况下,智能故障诊断系统主要包含以下几个功能模块:数据库模块、知识获取机构、诊断推理模块、学习机构、解释机构以及人机接口。不同的系统与诊断方法会建立的不同功能的故障诊断系统,但前提是必须保证设计的诊断系统符合需求,如可靠性、实用性、可维护性等等;并且要达到指定的诊断准确率和诊断速度。故障信息的不间断更新会影响诊断性能,得到更多的故障知识,实时更新故障内容,并将故障知识用恰当的诊断系统表达出来,这样能使得故障诊断系统的性能更好。在故障诊断中使用机器学习算法的整体框架见下图,在实际情况下,会根据不同的诊断对象对应建立不同的故障诊断模型,并在诊断中不断地对模型进行修改、更新、完善。一般用于故障诊断的机器学习算法是SVM、灰色神经网络、Elman神经网络。

图1 机器学习算法的两种应用

运用SVM时,往往跟其用于寿命预测中一样,会用其他算法去进行优化改进。SVM算法在工程中的应用与研究常常出现在滚动轴承的故障诊断,如Li[31]等提出一种基于分层符号动态熵(Hierarchical Symbol Dynamic Entropy, HSDE)和二叉树支持向量机(Binary Tree Support Vector Machine, BT-SVM)的滚动轴承故障诊断方法;Zhou[32]等提出了在少量训练样本可用时保持较高的故障识别准确率的新方法,即基于集合经验模态分解(Ensemble Empirical Mode Decomposition, EEMD)、加权置换熵(Weighted Permutation Entropy, WPE)和改进支持向量机集成分类器相结合的故障诊断方法,结果表明,该方法能够有效地检测轴承故障;阮婉莹[33]等则是针对滚动轴承故障振动信号的非平稳性和低信噪比的特点,提出基于变分模态分解(Varianational Mode Decomposition, VMD)排列熵和粒子群优化支持向量机(Particle Swarm Optimization-Support Vector Machine, PSO-SVM)的故障诊断方法,在滚动轴承故障诊断实例中,通过与VMD结合SVM和集成经验模态分解结合PSO-SVM进行对比。结果表明,新提出的方法故障诊断的准确率更高。当然,SVM算法的应用不仅仅局限在滚动轴承的故障诊断,例如在感应电动机的故障诊断中,Gangsar和Tiwar[34]用小波包变换与SVM相结合的故障诊断方法,并且考虑了不同小波的影响,其结果表明即使在某些电机工作条件下数据或信息有限,所提出的故障诊断方法也可用于成功检测和隔离各种故障;Liu和Zio[35]针对数据来源不同提出了基于KNN的模糊SVM方法,文中分别用反向KNN检测异常值以及KNN识别边界点用于定义支持向量机中的分类超平面,最后对高速列车的制动系统中进行故障诊断,验证了新方法的可行性;何庆飞[36]等针对单方法所建液压泵寿命预测模型精度较低的缺陷,提出基于灰色理论和支持向量机的组合预测模型的液压泵寿命预测方法,采用该模型对液压泵进行寿命预测,并与灰色模型、单一支持向量机模型进行预测性能对比。结果表明,灰色支持向量机预测性能最优。在表4中,对SVM算法在故障诊断中的应用与研究的创新点进行了梳理。

表4 SVM算法在故障诊断中的改进

在实际中,仅采用SVM算法进行故障诊断解决问题具有一定局限性的,故而会采用其他机器学习算法,如人工神经网络。与SVM算法类似,为了提高预测准确率,会将其他算法与人工神经网络算法相结合,灰色神经网络就是由灰色模型与人工神经网络结合而成的。在故障诊断中,会因为对某些设备的故障信息掌握得不够全面而使得设备故障具有一定程度的灰色性,因此可以采用灰色系统理论来对应解决这类故障诊断问题。灰色理论的一个重要分支是灰色关联度分析,它的作用是确定系统的边界、判别主次要因子、模式识别、灰关联聚类分析等。李婧与王娜[37]将BP神经网络与灰色关联度分析结合,对典型灰色系统变频调速系统进行故障诊断,并通过实例证明该灰色神经网络容易实现,诊断准确率也有所提高;程加堂[38]等针对油中溶解多种气体含量会影响变压器故障类型,为了提高故障诊断的精度,利用灰色神经网络建立了变压器的故障诊断模型,拟合输入、输出之间复杂的非线性函数关系,并证明了该方法的可行性;Elman神经网络是由J.L.Elman在1990年针对语音处理问题而提出的,它属于一种典型的局部回归网络,可以被看作是具有局部记忆单元和局部反馈连接的递归神经网络。通过对已有应用与研究的整理,发现Elmn网络多用于滚动轴承的故障诊断,比如Fu[39]等为实现随机噪声下滚动轴承的精确故障诊断,提出了一种基于集合经验模态分解(Ensemble Empirical Mode Decomposition, EEMD)和优化Elman-AdaBoost的故障诊断方法;杨红叶与高伟军[40]针对提取滚动轴承故障特征向量信号和识别故障类型的问题,为了提高故障诊断的精度,提出了一种新方法:结合小波包分析和BP算法权值修正的Elman神经网络。表5则详细梳理了以上应用与研究对神经网络算法进行改进的具体创新点。

表5 神经网络算法在故障诊断中的改进

在故障诊断中还存在其他机器学习算法。比如温江涛和周熙楠[41]针对在旋转机械的智能故障诊断中,复杂网络结构的非监督学习方法调节参数多,训练时间长,而结构简单的网络诊断准确率不够理想这些问题,采用模糊信息粒化和稀疏自编码器搭建并行结构的学习网络,并行结构的稀疏自编码器同时对粒化后重新构成的多个有效参量信息自适应的进行特征提取,随后使用随机森林方法对提取的特征进行融合分类,实验结果表明该方法可以有效实现高精度故障诊断,且与常用的串行多网络处理结构相比,降低了网络参数调节的复杂度和多层网络的前后影响,并且提高了诊断精度,减少了训练时间;Liu[42]等提出了基于固有时间尺度分解和多级Adaboost相关向量机的故障诊断方法对柴油机故障诊断;Yao[43]等提出了一种利用局部特征尺度分解多尺度置换熵和ELM-AdaBoost算法进行轴承故障诊断的新方法,并用结果表明该方法可以有效地准确诊断铁路轴箱轴承故障。

4 发展趋势

从上述应用与研究中可以发现,机器学习算法在寿命预测与故障诊断中还需要解决的问题主要有以下3个:

第一,机器学习算法的运用现状还仅仅局限于材料试件与局部构件,距离实现重大装备整体的寿命预测与故障诊断还有较大的差距,这未来机器学习算法需要突破的一个重大难点;

第二,目前还只是运用了极少数的机器学习算法,其中应用与研究最为广泛的是人工神经网络与支持向量机,还有大量机器学习算法有待发掘;

第三,已经应用的算法更适用于拥有大样本试验数据的设备,而实际中获得的小样本试验数据的情况居多,因此如何利用机器学习算法对小样本数据的设备进行寿命预测与故障诊断也是需要攻坚的一个难点。

以上难点都需要对其他种类的机器学习算法进行深入学习与研究,才可能最大化地挖掘机器学习算法在寿命预测与故障诊断中的作用。

5 结束语

人工智能下的机器学习算法为可靠性分析中的寿命估计与故障诊断提供了一种高效手段,并且已逐渐运用于工程领域中。本文梳理了机器学习算法的具体应用与研究现状,从现有数据来源来看,都是通过试验技术得到,而试验技术的方法都是采用产品原型试验进行确定,适用于普通机械产品,而对于小批量生产的机械重大装备,由于价格昂贵,供货时间长,采用常规的大样本试验方法是非常不适宜的,甚至是不可能的,因此需要机器学习算法对小样本数据进行寿命预测与故障诊断;从研究对象来看,当前绝大多数运用机器学习算法进行寿命预测的研究还是停留在各种材料试件或者机械装备的各种零部件,距离实现机械重大装备整体寿命预测还需要不断深入研究;从对机器学习算法的运用来看,尽管现如今存在众多机器学习算法,但目前运用最为广泛的是人工神经网络与支持向量机,距离实现机器学习算法的全面应用还需要不断深入发展。

猜你喜欢

寿命故障诊断向量
比亚迪秦EV充电系统故障诊断与排除
向量的分解
基于包络解调原理的低转速滚动轴承故障诊断
人类寿命极限应在120~150岁之间
聚焦“向量与三角”创新题
仓鼠的寿命知多少
马烈光养生之悟 自静其心延寿命
数控机床电气系统的故障诊断与维修
人类正常寿命为175岁
向量垂直在解析几何中的应用