APP下载

基于云加端的电机轴承故障诊断应用研究

2019-05-27耿晓强唐向红陆见光

振动与冲击 2019年9期
关键词:降维特征提取云端

耿晓强,唐向红,2,3,陆见光,2,3

(1.贵州大学 现代制造技术教育部重点实验室,贵阳 550025;2.贵州大学 机械工程学院,贵阳 550025;3.贵州省公共大数据重点实验室,贵阳 550025)

智能制造模式的发展,对生产过程的故障监测提出了更高的要求。随着越来越多的高速传感器的使用,可以从生产线上获取的数据越来越丰富,一方面为故障信号的检测提供了更丰富的数据基础,但另一方面面对体量巨大、实时产生的线上流数据,智能终端无法提供足够的计算能力,而计算能力突出的计算机设备直接部署在生产现场又很不现实。在此背景下,将云端数据处理中心和嵌入式智能终端相结合,提出云加端的数据处理模式,可以有效的解决数据处理的实时性和计算能力不足的问题。

制造业生产线上大量的使用了电动机设备,轴承作为其中重要的机械零件故障发生率一直居高不下,生产过程中对电动机轴承的实时监测,通过各种传感器采集电机轴承运行状态数据并进行分析,是保证生产工作正常进行、避免发生生产事故或者减小事故损失必不可少的一个环节。异步电机转子、轴承等设备是故障高发的设备,针对不同的故障类型[1-2],通过有效的方法提取不同故障的故障特征并对其进行准确的分类,是电机、轴承等设备实时故障诊断需要研究的问题。

电机轴承的故障信息会调制在各种测量信号中,而振动信号可以最为直观、最为准确反映故障,令很多学者争相对其展开研究[3-4]。而且在一些生产现场或者设备运行现场,数据信息多种多样、源源不断,因此很多学者提出了对数据进行实时处理的方法[5]。为了解决传统方法诊断结果不直观、准确率低的问题,机器学习越来越多的用到了故障诊断方面[6]。而且由于支持向量机(SVM)在小样本分类方面优越的性能,在文献[7-8]中SVM被应用到了故障诊断中,并取得了比较理想的效果。但是不断改进的算法导致了对数据处理设备的性能要求越来越高,使得数据的实时处理越来越不易实现,使得理论研究距离工程应用的距离越来越远。

为了解决上述问题,本文提出云加端支持向量机(CaTSVM),将传统的故障诊断方法分为“云端+终端 ”两部分,相对计算复杂度较低的特征提取算法在终端嵌入式设备中完成,而相对来说计算复杂度较高的训练和分类算法放在云端计算中心完成。这一新型的故障诊断架构不仅仅可以将故障诊断算法从实验室环境下搬到实际环境中,而且由于终端嵌入式设备对原始数据进行了预处理操作,使得云端和终端的通信数据体量大大减小,降低了数据传输代价。并且在云端建立故障特征模型库(CFML),不断的更新完善CFML,用完善后的故障特征在线训练SVM模型,进一步提高SVM模型分类能力,使故障诊断系统拥有了“终生学习”的能力。

1 云加端SVM模型

支持向量机(SVM)[9]由Vapnik和Cortes在1995年正式发表在《Machine Learning》杂志上,SVM的出现直接掀起了“统计学习”在机器学习领域的应用高潮。而且由于支持向量机在小样本、非线性以及高维模式分类方面表现出的优秀性能[10],使其比神经网络更加适合应用在电机轴承的故障诊断中。本文将支持向量机与云加端模型结合在一起,应用在轴承故障诊断中。而且当前SVM的理论研究比较多,工程应用研究比较少,本文方法的提出可以进一步丰富SVM的工程应用研究,具有一定的工程指导意义。

1.1 支持向量机

支持向量机(SVM)是一种建立在统计学习理论(Statistical Learning Theory)基础上的机器学习方法,其目标是利用结构风险最小化原则构造最优决策函数来解决二分类问题,求解其最优决策函数的问题实质上就是一个解凸二次规划的问题。

对于一个二分类问题,存在训练样本集D={(x1,y1),(x2,y2),…,(xn,yn)},其中xi∈Rn,yi∈{1,-1},训练的目的就是在包含D的样本空间中寻找一个最优分类超平面,将两类样本按照各自的样本特征分开。而在样本空间中,我们可以将分类超平面表示为

ωTx+b=0

(1)

式中:ω表示超平面的法向量,b为相对偏移量。对于一些在线性空间不可分的样本集,可以将其映射到更高维的特征空间,使样本在该高维空间线性可分,令φ(x)为高维空间特征向量,得到高维空间分类超平面

(2)

式中:k(x,xi)即为此分类问题的核函数。样本中把两类样本分开的超平面的向量称为此二分类问题的“支持向量”,而想要最优化分类超平面,需要最大化两类支持向量到超平面的距离

(3)

式中:yi(ωT+b)≥1,i=1,2,…,n,式(4)等价于

(4)

为了解决某些问题中无法找到合适的核函数使训练样本在特征空间线性可分的问题,提出软间隔的概念,引入松弛变量εi≥0,得到软间隔支持向量机

(5)

其约束于yi(ωT+b)≥1-εi,εi≥0,i=1,2,…,n。引入正则化的概念,将求解最优超平面问题优化为更一般的形式

(6)

1.2 云加端SVM模型

故障特征提取相对于SVM的训练以及分类来说,计算复杂度相对较低,而且对线上实时处理数据的要求比较高,因为如果对原始数据先进行传输再处理,一方面数据体量巨大,传输过程耗时较多;另一方面由于原始数据的不确定性和敏感性,容易在传输过程中引入更多的其他干扰因素。所以原始数据直接在设备端进行实时处理更加合理,并且设备端的嵌入式设备的计算性能也可以满足故障特征提取的要求。将原始数据进行处理后,将提取并经过降维的特征向量传输到云端,一方面减小了数据传输量,另一方面增加了需要传输的数据的可靠性。使用支持向量机对轴承故障特征数据进行分类,计算资源消耗最大的一部分是分类超平面的计算以及数据的分类过程,将这部分计算放在云端,可以在很大程度上提高分类的准确度以及现实的可行性。并且在云端构建故障特征数据库,在故障诊断的过程当中不断完善特征数据库,使用新的特征以替换旧的特征,不仅仅让特征最新,而且让特征数据库中的数据保持一定的规模。云端模型库CFML的建立让本文提出的算法不再像传统的SVM故障特征分类算法一样只具备一次性学习能力,本文提出的算法可以在运行过程中不断完善和丰富,具备“终生学习”的能力。

如图1所示是本文使用的云加端支持向量机模型。

图1 CaTSVM故障诊断模型Fig.1 CaTSVM fault diagnosis model

2 基于云加端的故障诊断方法

2.1 原始数据选择

目前常用的用于故障检测的信号量中,声音信号、电流、电压信号和振动信号尤其受到科研工作者的青睐,究其原因是因为这几类信号最方便采集并且其均在一定程度上可以反映出当前机电/机械设备的运行状态。通过对四种原始数据信号的实验对比,在是否侵入式、测量准确度、反映故障类型、适用范围以及提前预测时间等几方面进行考量,同时考虑到云加端故障诊断系统实际生产应用的需要,在本文中振动信号是最适合用来做机电设备故障诊断以及预测的数据类型。

2.2 故障检测

故障检测的目的是确定设备异常,故障诊断(分类)的目的是确定异常位置。故障检测可以作为故障诊断的前期工作,因为故障检测算法的计算复杂度可以设计的更小,实时性可以更高,并且故障检测可以为后期的故障诊断剔除很多干扰项,以提高诊断效率和准确率。耿晓强等[11]依托云加端的架构提出了一种实时的故障检测方法,其根据电机、轴承等旋转设备故障信号存在周期性的特点,使用聚类的方法对设备的实时数据和历史数据进行处理,进行设备异常检测。本文的故障诊断程序的启动条件是故障检测系统发出故障预警,在此条件下诊断系统在实际的工程使用中可以提高诊断准确率并且大大降低人工参与确定故障的频率。

2.3 特征提取

特征提取在整个故障诊断系统中是计算量相对较小而且对流数据实时敏感的一部分,在本文提出的CaTSVM架构中属于终端数据处理部分。采集到设备的振动信号后,经过FFT变换可以得到信号的频谱,根据以往的研究发现,当机电设备发生故障后会引发系统额外的振动,体现在信号频谱上就是在在原始基波的基础上会引入其他的谐波成分[12-13],利用这一特性可以很好的提取当前故障的特征。但是由于信号频谱特征的数据量和频率分辨率成正比,并且其频谱数据中并不是所有的特征量都可以有效的反映故障特征,如果使用振动信号的频谱作为特征向量,将面临特征向量的维数灾难,而且存在非常大的冗余度,因此对频谱特征进行降维,提取主要特征将是必要的[14]。

主成分分析(PCA降维)可以有效的解决这个问题,它可以重新构建一个超平面来对所有的输入样本进行恰当的表示,然后通过对新的样本表示进行重要性排序(特征值大小),来选择可以在一定程度上表示原来的样本特性,并且将维度降到我们可以接受的范围之内的样本映射。

PCA算法可以描述为以下过程[15]

输入:输入数据D={x1,x2,…,xm};降维后目标维数d′

输出:降维后数据W=(ω1,ω2,…,ωd′)

2.4 CaTSVM模型在线训练

传统的SVM模型大多是采用“离线训练-离线分类”[16-18]或者“离线训练-在线分类”的结构[19],这样的结构对于解决实验室数据并没有太大的问题,因为实验室数据存在太大的理想性。或者频繁的对模型进行训练[20],可能导致过度的资源占用以及模型的过拟合,起到和预期相反的效果。此类结构并没有充分考虑到在实际的工程应用中,机器的故障特征可能在发生着微妙的变化,导致当前设备故障特征和SVM模型所依据的故障特征偏差越来越大,间接地造成了SVM模型分类准确度的下降。

本文的CaTSVM在线训练模型采用了“离线训练+在线训练-在线分类”的结构,在初始阶段,使用已经分类完成的故障数据对CaTSVM模型进行离线训练,建立初始CaTSVM模型;之后开始在线的故障诊断,初始CaTSVM模型诊断的结果通过人机交互界面通知现场,经过工作人员实地检查故障后反馈给系统,并且将故障特征向量保存在云端特征模型库,由系统统计诊断的准确率,当准确率低于指定阈值,调用云端特征库对CaTSVM模型进行二次训练,即在线训练,同时也避免了过度的资源占用。CaTSVM模型训练过程如图2所示。

图2 CaTSVM模型训练过程图Fig.2 CaTSVM model training process

2.5 算法描述

本文将故障特征提取和特征分类分别放在终端和云端进行处理,终端负责对故障特征进行提取,计算量相对较小,云端负责计算复杂度相对更高的特征学习和分类计算,并且随着时间的推移,CaTSVM模型可以根据机电设备状态的变化进行终身的在线学习。由于终端对现场的实时反应能力较强,并且经过特征提取之后的特征数据量相较于原始数据体量更小,可以大大减小网络带宽消耗并且提高数据传输和计算的实时性。终端、网络、云端构成了一个数据处理的并行“流水线”结构,可以再次在较大程度上提高系统的实时性。算法描述如下:

步骤1使用已知种类的故障特征数据离线训练CaTSVM,并将训练好的CaTSVM放在云端处理器,并且在云端建立特征模型库CFML,将训练数据加入CFML;

步骤2终端原始数据采集;

步骤3终端FFT算法计算振动信号的频谱,提取故障特征并进行降维;

步骤4将特征向量拷贝到无线设备模组发送缓冲区,启动发送;运行下一步,同时再次启动步骤2;

步骤5云端接收故障特征数据,调用CaTSVM模型对特征向量进行分类;

步骤6将分类结果返回人机交互界面,通过人工检查,确定CaTSVM分类结果正确与否,并返回检查结果;

步骤7根据人工复检结果将特征向量分类加入特征模型库CFML;

步骤8计算当前故障分类准确率,若准确率低于阈值,从CFML取数据,再次在线训练CaTSVM;返回步骤5。

3 实验和对比

3.1 数据获取

本文的实验数据采自CUT-2转子振动试验台(见图3),终端处理器包括用于测量、预处理数据的测量模组(包括MCU和振动传感器)、无线设备模组。分别在不同负载以及故障情况下对轴承进行故障诊断,包括① 正常轴承② 轴承内圈故障③ 轴承外圈故障④ 轴承滚珠故障。每种状态分别取500组数据,共2 000组数据分别进行训练和测试,对比不同算法准确率以及效率,另外当负载变化和故障尺寸变化后各状态均增加500组数据用于实验。为了实验对比以及实验结果的记录,云端设备使用DELL precision TOWER 5810服务器,终端使用Cortex M3系列处理器ADuCM3029。

图3 CUT-2转子振动试验台Fig.3 CUT-2 rotor vibration test bench

3.2 特征提取

本文的特征提取需要应用在系统的两部分中,第一部分是已经获取的分类数据的特征提取,用于对PCA降维矩阵的训练以及CaTSVM分类模型的训练;第二部分是直接对实时采集的数据进行特征提取,用于故障诊断以及在线学习中二次训练CaTSVM分类模型。信号的频谱中包含了丰富的故障信息,直接计算出来的信号频谱维度非常高,但是如果将频谱进行采样或者求取部分信号的积分,将丧失频谱信号对故障信息准确反映的优势,因此本文直接将信号的频谱进行PCA降维,在减小数据维度的同时保持了信号的完整性。

(1)原始数据经过FFT计算出其频谱,进而求出其功率谱,使用z-score标准化方法对数据进行标准化处理。将标准化结果作为PCA算法的输入,计算出对功率谱特征贡献率最大的d′个特征,生成代表原始特征和降维特征对应关系的降维矩阵D。其中d′的选择是根据所选特征维数对整体特征的贡献率不小于C%来确定的。计算出前k维特征向量对原始特征的贡献度为

Con={0.596 4,0.755 6,0.827 1,0.880 5,0.897 5,0.910 3,0.921 5,0.932 0,0.939 6,0.945 0,0.949 5,0.952 7}

令C%=95%,取d′=12,得到的降维矩阵为

Dn×12=

(2)降维矩阵在CaTSVM模型训练阶段就确定了下来,而特征提取贯穿整个系统运行的始终。在诊断过程中,数据要经过传感器采集,FFT计算数据频谱、功率谱,数据降维,诊断分类等几个阶段。最后输入到CaTSVM模型的特征向量是经过降维矩阵降维之后的特征向量,如表2所示。

表1 不同故障对应特征向量Tab.1 The eigenvector of different fault

3.3 故障诊断策略

SVM分类算法本质上属于二分类算法,虽然其可以通过更改算法实现多分类器,但是其计算复杂度大大提升。因此本文采用一对一的分类方法(One-Versus-One,OVO SVMs)分别对k类故障进行两两分类,最后对k(k-1)/2个分类器的结果进行投票汇总,得到最终的故障分类结果。此类方法对分类类别较少的情况有很好的分类效果和满意的计算复杂度,非常适合机电设备的故障诊断。

根据本文对方法的改进以及考虑到实验的可行性,本文从两方面展开对比实验,以充分说明本文提出方案的优势。第一方面,考虑到生产设备普遍的需要长时间运行,在此期间设备的状态难免的发生一些变化,而且由于系统的负载也会时常发生不确定性的变化,这些变化导致传感器采集的数据并不能像设备初始状态下一样反映设备的运行状态。如果系统不能对设备的当前状态进行在线学习,无疑系统的诊断准确率将不断的降低,直至无法正常工作。而本系统可以根据诊断的准确率判断系统运行状态,进行在线学习,以解决设备状态的逐渐演变给诊断模型带来的干扰。第二方面,对于很多关键设备,系统的实时诊断是保障设备安全、正常运行的重要条件。传统的故障诊断大多数停留在实验室阶段,即使用已经采集的数据进行实验研究,实时性较差;即使将诊断方案封装成计算机应用,仍然需要在设备现场部署计算机进行诊断。本文使用的系统包括终端和云端两部分,在系统初始化设置完毕之后可以只将体积小巧的终端设备置于设备上采集数据并进行特征提取,之后将特征上传云端进行诊断以及在线学习。这种流水线分布式数据处理方式充分考虑到了数据处理的实时性要求,是一项重要的实验指标。

图4 一对一法多分类支持向量机Fig.4 One versus one method multi-classification SVM

3.4 故障诊断准确度实验

机械设备在运行过程中可能发生设备状态变化,其原因包括负载变化以及设备长时间运行造成的机械磨损等,本文提出的系统解决方案有助于降低这类变化给诊断系统带来的诊断误差。本实验将采集不同负载情况下的数据作为负载状态变化,将采集不同故障直径情况下的数据作为长时间运行造成的机械磨损,以此两方面展开实验研究。为了使用大量的数据进行诊断准确率的计算,这里将“算法描述”部分的“人工检查”换成故障标签以判断诊断正确与否。表2中给出了在线学习法和离线学习法原始诊断准确率的数据,该数据是在负载和故障尺寸均未变化的情况下测试得到,从中可以看出在初始状态下在线学习算法和离线学习算法的诊断准确率基本持平。表3、表4、表5所示是当用负载变化和故障尺寸变化模拟设备状态变化后传统离线学习和本文提出的在线学习诊断准确度对比:

表2 原始诊断准确率Tab.2 Original diagnostic accuracy

表3 负载变化20%后诊断准确率对比Tab.3 Comparison of diagnostic accuracy after load change 20%

表4 故障尺寸变化10%后诊断准确率对比Tab.4 Comparison of diagnostic accuracy after fault size change 10%

根据利用轴承负载变化和故障尺寸变化来模拟轴承长时间运行给系统带来变化的实验得到表3、表4、表5的数据,由表3可知,负载的变化导致了传统的离线学习方法诊断准确度的降低,虽然没有大幅度的降低,但是和在线学习方法相比仍然体现出了其劣势;由表4可知,故障尺寸的变化相较于负载的变化会对诊断准确率带来更大的影响,但是在线学习方法仍然表现出了优越的性能;表5同时使用负载变化和故障尺寸变化来模拟系统状态变化,由表中数据可以得出,在线学习法完全可以适应系统的变化,但是传统的离线学习方法的故障诊断准确率已经大大降低,无法满足诊断系统的实际需求。

表5 负载变化20%+故障尺寸变化10%后诊断准确率对比Tab.5 Comparison of diagnostic accuracy after load change 20% and fault size change 10%

3.5 诊断系统实时性实验

在传统的机器学习故障分类方法中,特征提取,高维特征降维以及故障分类均放在同一个PC端进行顺序处理,下一步必须在上一步计算完成释放CPU使用权之后才能开始;在本文的云加端结构中,数据采集、特征提取、降维、数据传输以及SVM分类分别放在终端和云端进行,随着系统的运行,可以把几部分看作是并行处理数据,是一种更为高效的数据处理方式。云加端流水线结构和传统数据处理结构如图5所示。

从图5中可以看出,流水线诊断结构可以并行的对数据进行处理,形成了一种多环节并行的故障诊断模式,而传统的诊断结构对数据的处理只能是顺序完成的。其中数据采集(COD)发生在MEMS传感器中,采集的数据放在FIFO空间中;特征提取/降维(FE/DR)在MCU中进行计算;数据传输(TDR)由RF芯片完成;故障特征的分类(CLOF)即故障诊断在云端进行。

注:COD: Collection Data;

FE/DR: Feature Extraction/Dimensionality Reduction;

TRD: Transmission Data;

CLTF: Classify the Feature

图5 两种故障诊断结构对比图

Fig.5 Comparison chart of two kinds of fault diagnosis structure

并行的流水线数据处理结构要比普通的顺序结构效率高很多,并行结构可以同时充分调动各个计算单元对数据进行处理,一方面降低了单一处理器的计算负担,另一方面让各个处理单元的“等待时间”大大降低,提高了系统的工作效率。如图6所示给出了传统的顺序结构和并行流水线结构在相同时间内完成任务数的对比,从图中可以看出,随着时间的推移,并行流水线结构相较于传统顺序结构体现出越来越大的效率优势。

图6 传统诊断结构与流水线诊断结构效率对比Fig.6 The efficiency comparison of traditional structure and pipeline structure

通过以上分析,从计算分布以及实际工程应用的角度出发,云加端的故障诊断方法更加符合实际的工程应用,而且由于其可以直接布置在实际运行的设备之中,真正实现了设备的在线实时故障诊断,相较于传统只能先采集数据再进行集中数据处理的方式更加符合实际。

4 结 论

文章中提出了一种云加端的改进支持向量机(CaTSVM),并将其运用到旋转轴承的故障诊断中,通过云端和终端的配合,使得将故障诊断设备部署在生产线设备现场成为切实可行的方案。终端、无线传输以及云端并行流水线数据处理方式使得故障诊断系统的实时性得到大大提高,对系统的实时监测有重大意义。

CaTSVM可以根据当前被测设备状态的变化适时的进行在线训练,以随着被测设备状态的缓慢变化不断的学习新的特征,使故障诊断系统具备“终身学习”的能力。通过在线训练可以让诊断系统的诊断准确度不受设备状态变化的影响,提高分类器的识别能力。

猜你喜欢

降维特征提取云端
混动成为降维打击的实力 东风风神皓极
四海心连·云端汇聚
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
在云端永生
云端之城
降维打击
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
Bagging RCSP脑电特征提取算法
一种基于LBP 特征提取和稀疏表示的肝病识别算法