APP下载

案例推理方法在水泵故障诊断中的应用

2018-11-12张媛媛原思聪郭田奇

机械设计与制造 2018年11期
关键词:约简水泵故障诊断

张媛媛,原思聪,郭田奇

1 引言

水泵是工农业生产中用于运送液体或提升液体压力中非常重要的设备,在石油、化工、冶金、采矿、电力、城市给排水和暖通空调等多个领域中有着非常广泛的应用,并且发挥着越来越重要的作用。水泵系统运行状况的好坏直接影响着各类生产能否正常进行,对其开展故障诊断研究有着非常重要的现实意义[1]。目前应用到水泵故障诊断中的智能诊断方法主要有:粗糙集理论、专家系统、人工神经网络和支持向量机等[2]。但当故障形式和特征参数较多时,利用粗糙集则有可能会导致较大的决策表以及较多的规则数目;专家系统有知识获取困难,推理慢等缺点;人工神经网络中网络结构难以确定、收敛速度慢、局部极小点等不足;支持向量机在解决多分类问题时需要将多分类问题转换为二分类问题从而耗费大量的时间。与此同时,伴随泵机组在容量上的扩大,相应提出了较高的运行与维护等要求,对泵机组的运行状态实施监测,并及时预测和上报相关故障,以便根据运行信息去分析、判断故障产生的实际原因,这对泵机组运行状态的安全性保证有重要研究意义。

起源于20世纪70年代后期的案例推理方法是用以往案例的知识或信息进行相似案例问题求解的方法[3],它在知识获取、求解效率、求解质量以及知识积累等方面,有着突出的优势,是多种人工智能技术的综合[4]。将案例推理方法引入水泵机组的故障诊断中,并运用Logistic回归和假设检验进行属性约简,进而提出一种动态KNN算法,在多数重用的基础上引入随机打破距离连接降低模型的方差,提高模型精度。实验证明这种方法有很大的实用性。

2 CBR模型

CBR模型应用于故障诊断领域的基本思想是,新的故障问题可以通过在历史故障问题中进行推理得到,即通过多个已解决的故障问题与新故障问题进行对比,从历史数据库中找到与新故障问题最相似的历史故障问题,根据历史故障问题来找到新故障问题的原因及解决方法[5]。在用CBR进行故障诊断时,关键的问题是:(1)案例表示:案例表示是指以一种合适的方式将要求解的问题在计算机中表达出来,它是案例推理研究的基础和核心。(2)案例检索与匹配,选择合适的属性约简方法和检索方式可以有效提高案例匹配的效率[6]。

2.1 案例表示

水泵故障诊断的预测的初始案例库通常利用已解决的历史数据来构建,可表示为如下的三元组形式:

H:<Xi;Yi;Zi>,i=1,2,…,m

式中:Xi、Yi、Zi—第i个案例的故障特征描述,故障原因和解决方法,Xi可表示为 Xi=(xi1,…xij,…,xin)其中,n—案例属性的个数,xij—第i个案例中第j个属性的特征值。

2.2 案例检索与匹配

2.2.1 属性约简

为了避免噪声和不精确数据对预测结果的影响,就需要对原始特征数据进行特征约简,将与结果不相关或者影响较小的特征进行删除。假设总体的概率密度为p=f(x),显著性检验就是利用图1的阴影部分的概率α(对应于面积s1+s2,也叫截尾面积),如图1所示。若α很小,则事件不可能发生在区间[X1,X2]之外,但若事件在区间[X1,X2]之外实际发生了,且其实际发生的概率P比α还小,这就说明样本事件可能不是来自于总体,即样本与总体是有显著差异的。结合统计学对回归模型中的自变量,按照他们对y的贡献率的大小进行比较,并通过置信度为95%的显著性t检验,把不显著的变量剔除,最终得到既不漏掉对Y影响显著的变量,又不包含对Y影响不显著的变量[7]。

图1 显著性检验Fig.1 Significance Test

主要过程如下:

(1)构造逻辑回归模型:

输入x分类结果为类别1和类别0的概率分别为:

(2)使用双侧假设检验,确定显著性水平α=0.05,计算检验统计量:

2.2.2 检索方式

案例检索方式采用相似度度量的方法,K邻近模型根据2个案例之间的距离来度量它们之间的相似性程度,并根据这K个邻居中出现次数最多的类别(最大表决规则),作为该数据点的类别案例。K值的选择会对K近邻法的结果产生重大影响,若K值过小,预测结果会对近邻的实例点非常敏感。若K值过大,虽可以减少学习的估计误差,但学习的近似误差会增大,导致预测发生错误[8]。针对传统KNN模型K值难确定且得到的相似案例的不唯一性,默认K值为1并在多数重用的基础上引入随机打破距离连接,将距离最近的类别作为测试数据点的类别。当测试数据周围有多个距离相同的邻居时,引入随机打破距离连接并根据最大表决规则来判断测试数据所属的类别。具体过程如下:

(1)计算案例 Ci和 Cj之间的相似度 S(Ci,Cj)

(2)若距离相等的个数为偶数,随机打破一个再进行多数投票。

(3)若距离相等的个数为奇数,直接进行多数投票。

(4)根据最大表决规则判断测试数据所属最终类别。

3 水泵故障诊断

水泵的故障诊断是一个复杂过程,主要包括3大部分:动力不足;泵振动严重;出水问题。通过进一步的分析,得到的故障树,如图2所示。

图2 水泵故障树Fig.2 Water Pump Fault Tree

重点分析泵振动严重的故障类型,具体步骤:

Step1:搜集已有的历史案例及其解决方案,建立原始案例库;

Step 2:利用基于逻辑回归的假设性检验对原始案例库的特征进行属性约简并去除数据噪音,得到精简的案例库;

Step 3:利用距离式(4)计算案例间的相似度;

Step 4:当出现相似度一样的案例时,根据情况分别启用投票法和随机打破距离连接进行多数投票法得到最相似案例,根据最相似案例的类型来判断问题案例的类型。

4 案例推理在水泵故障诊断中的应用

4.1 水泵常见故障

异步电机带动水泵转子高速旋转,水泵高速旋转的叶轮叶片带动液体旋转,在离心力的作用下将液体甩出达到输送的目的。振动信号能够实时反映出水泵机组在运行过程中大多数故障的特征,因此通过对水泵振动信号的分析来确定故障类型[9]。通过大量的分析和研究,得到的水泵故障表,如表1所示。

表1 水泵故障表Tab.1 Pump Fault Table

4.2 水泵故障特征的提取

用加速度传感器测量机壳(轴承座)的振动,监测点的选择,如图3所示。测点1、2、3、4四个个方向的值(轴向、垂直、水平),标出机组的每个测点并在数据采集器或计算机系统进行测点和巡检路径设置,以便计算机存储和处理采集数据[10]。采集到的数据经处理后,如表2所示。

图3 水泵检测时测点的选择Fig.3 Selection of Measuring Points in Pump Testing

表2 水泵故障样本Tab.2 Water Pump Failure Sample

4.3 仿真实验

为方便数据存储和运算,采用框架与规则的知识表示方式,将表1的水泵故障表分别以框架表、规则表、框架规则表、故障事实表、故障原因表的方式与表2的故障特征表一起存于SQL Server2012中。为保证数据的完整性,利用SQL Server 2012将这些表关联起来,如图4所示。

图4 知识库中表的关联Fig.4 The Association of Tables in Knowledge Base

为验证基于逻辑回归的案例推理方法对水泵故障诊断预测的准确度,待检测样本,如表3所示。

表3 待测样本Tab.3 Test Sample

首先利用R语言的逻辑回归包对故障数据集进行数据属性约简结果,如表4所示。(*代表该属性对预测结果的贡献度大小,没有贡献度用0表示)。

表4 属性贡献度Tab.4 Property Contribution

将样本集中贡献度为0的属性去除,得到约简后的样本集。将表3待测试样本放入KNN检索模型里,进行相似度检索,与表2各故障样本间的相似度结果,如表5所示。

表5 相似度结果Tab.5 Similarity Results

表5中,待测样本1与案例5的距离最近,相似度最高,即为故障类型2的轴承故障;同理可看出待测样本2、3为联轴器连接柱销,待测样本4、5为地脚松动,待测样本6为转子不平衡,7、8运行正常。最后结合SQL语句,得到所测故障类型的故障原因及解决方案结果,如图5所示。

图5 诊断结果Fig.5 Diagnostic Results

可以看到基于逻辑回归的案例推理方法不仅可以正确的预测故障类型,还可以快速直观的找出各故障产生的原因以及解决方案。证明该方法可以对复杂的水泵机组及时预测故障并快速解决故障问题。

5 结论

针对水泵机组故障诊断问题,提出一种案例推理故障诊断方法,运用逻辑回归假设性检验与动态KNN相结合的检索模型,实现了故障特征的约减和案例的检索与匹配,并利用振动传感器采集到的特征数据对所建模型的有效性进行了验证,取得了满意的结果,并结合SQL语句将故障发生的原因和解决办法显示出来,方便对设备故障进行快速直观的诊断。

猜你喜欢

约简水泵故障诊断
某型水泵旋转系统故障分析
基于包络解调原理的低转速滚动轴承故障诊断
凝结水泵全系列优化改进
基于粗糙集不确定度的特定类属性约简
水泵节能改造在昆钢的应用实践
基于二进制链表的粗糙集属性约简
数控机床电气系统的故障诊断与维修
实值多变量维数约简:综述
广义分布保持属性约简研究
基于LCD和排列熵的滚动轴承故障诊断