APP下载

基于特征抽取和SVM分类器的故障诊断*

2016-10-18

关键词:特征提取分类器故障诊断

陈 虎

(重庆市轨道交通总公司,重庆 400042)



基于特征抽取和SVM分类器的故障诊断*

陈虎

(重庆市轨道交通总公司,重庆 400042)

为了提高支撑向量机(Support Vector Machine,SVM)的性能,降低时间开销;提出一种基于特征提取的SVM算法,并将其用于汽轮发电机组的故障诊断;使用KFDA(Kernel Fisher Discriminant Analyst)算法提取汽轮发电机组数据的关键特征,并使用SVM分类器对特征数据集合进行分类检测;实验结果表明:算法是可行和有效的,在分类性能和训练时间上都得到了提高。

故障诊断; 特征抽取; 核Fisher鉴别分析;支撑向量机

随着工业化水平的不断提高,各种设备、装置及工程控制系统在工业及日常生产生活中得到广泛的应用,而在运行和应用的过程中不可避免的为产生各种问题和故障,因此故障问题已经成为工业界及日常生产生活中普遍且长期存在的问题。为了提高工业生产等的效率和可靠性,对故障的诊断和及时解决提出了更高的要求,如何保证设备高效无故障的运行成为当前大家关注的问题。因此故障诊断技术逐渐成为当下研究的热点,各种智能的技术和方法应用于该领域,其中比较有代表性的如神经网络、支撑向量机[1]、粒子群优化模糊聚类算法[2]、因果图定性分析法[3]和组合的算法[4-6]的使用,都取得了一定的效果。

故障诊断的实质可以看作是一个模式分类和识别问题,就是通过对设备状态数据的分析来判断设备是否处于正常状态。在常见的分类算法中,支撑向量机(Support Vector Machines,SVM)算法[7]只需要确定模式类样本数据之间最优分类面就可以完全的确定分类器,具有所需样本小,可靠性高的优势,因此提出采用SVM来完成故障的诊断和监测。

由于SVM算法只针对小样本数据才能体现其效率和优势,当数据规模较大时会极大降低SVM的处理效率,甚至会影响SVM的分类性能,因此在使用SVM进行分类检测之前,首先对设备状态数据进行特征提取,依据提取的特征重新组织数据集,然后再使用SVM在进行了特征提取的数据集上完成分类检测。这样既可以保证SVM的性能同时也降低了SVM处理数据的时间开销。

结合汽轮发电机组的数据集的特点,引入了核Fisher鉴别分析(Kernel Fisher Discriminant Analysis,KFDA)方法对数据集进行关键特征的提取。基于此提出一种基于特征抽取和Support Vector Machines(SVM)的故障诊断算法,首先通过KFDA进行关键特征抽取,然后,将SVM分类器应用于提取特征后的数据进行分类。选用汽轮发电机组的数据集对算法进行了验证,实验结果表明,算法取得了理想的结果,在分类性能和训练时间上得到了提升。

1 基于特征抽取和SVM的故障诊断

1.1基于KFDA的特征抽取

线性FDA的思路找到一个最佳投影方向,方向通常能够使得Fisher线性鉴别函数达到极值。这样在方向进行投影后,可以使得类间离散度最大,并且类内离散度最小[8]。KFDA则是通过引入一变换核函数,将样本经过非线性映射变换到一高维空间,从而在高维空间完成FDA的过程,获得在高维特征空间中的一组最优鉴别向量,具体过程如下。

在此设定X={xi},其中i=1,2,…,n为训练样本集。

(1)

其中:

通过再生核理论的结论,可以得到H空间中的任意解w,有公式:

(2)

将式(2)代入式(1),得:

(3)

在此:

然后,在保证Kw非奇异的前提下,可得到最大化式(3)的最优解向量α,它可以看做是广义特征方程Kbα=λKwα的前m个最大特征的特征向量。

其中m=min(K-1,N),那么在H空间可以得到任何样本φ(x)在w上的投影可以记作:

(4)

1.2支持向量机分类思想

Vapnik提出的支持向量机(Support Vector Machine, SVM)以训练误差作为优化问题的约束条件,以置信范围值最小化作为优化目标,即SVM是一种基于结构风险最小化准则的学习方法,其推广能力明显优于一些传统的学习方法。SVM是从线性可分情况下的最优分类线发展而来,基本思想如图1所示。其中圆形和方形分别表示一类样本。H就是分类线,H1、H2分别为过各类中离分类线最近的样本且平行于分类线的直线。H1、H2之间的距离记作分类间隔。

图1 线性可分情况下的最优分类线Fig.1 Linearly separable cases with optimal classification lines

在此,要做的就是找到一个分类间隔最大且能区分两类的最优分类线。将其推广到高纬空间,就是要找到一个最优分类面。

设有线性可分的样本集(xi,yi),其中i=1,2,…,n,x∈Rd,y∈{+1,-1}。则在d纬空间的判别函数可记作:g(x)=xw+b,分类线方程为xw+b=0。

而要求分类面对所有样本正确分类,就是要满足条件:

(5)

然后,可以使用拉格朗日乘子法并满足KKT条件将最优分类面问题转换为与其对偶的问题,从而得到约束条件:

(6)

最后可得到解上述问题后得到的最优分类函数如下:

(7)

式(7)中的求和实际上只对支持向量进行。b*是分类阈值,可以用任一个支持向量求得,或通过两类中任意一对支持向量取中值求得。

1.3基于特征抽取和SVM的故障诊断模型

算法包括两个内容,一是特征提取,二是进行分类检测。每个内容都包括两个阶段(训练和检测两个阶段),通过交叉验证的方式获得有效的结果。特征提取的两阶段如图2所示,分类检测的两阶段如图3所示。

图2 特征提取的两阶段Fig.2 Two stages of feature extraction

图3 分类检测的两阶段Fig.3 Two stages of classification detection

从图2可以看出,除了利用KFDA算法本身的特性获取有效特征外,还借助SVM的分类故障检测,进一步的对特征进行再次的优化和选取,总而可以获取更有效的特征。

2 仿真结果

采用汽轮发电机组的数据集作为实验数据来验证算法的有效性,集中输入数据包含6个振幅数据,其中f代表发电机转子的频率(表1)。

表1 汽轮发电机组数据集

在实验的过程中,将SVM应用在未进行特征提取和进行了特征提取两种数据集中,经过多次实验,得到检测率和训练及检测时间的均值比较结果如表2所示。其中两种情况下的数据集的记录规模是相同的。

表2 算法与SVM性能比较

根据两种算法在正确检测率方面的比较可以看出,基于特征抽取和SVM的故障诊断算法明显优于单一的SVM算法,因此基于特征抽取和SVM的故障诊断的算法在检测率方面取得了良好的效果,并且也大大节约了训练时间。

3 结束语

为了提高故障诊断的准确率降低处理的时间,首先引入KFDA对汽轮发电机组的故障数据进行特征提取,使用提取出的特征重新构造数据集,从而降低了数据规模。然后使用SVM构造分类器,针对状态数据进行学习训练,形成可用于故障诊断的分类器。从实验结果看,算法能够提高故障的检测率,同时降低了时间消耗。

[1] GE M,DU R,ZHANG G C.Fault Diagnosis Using Support Vector Machine with an Application in Sheet Metal Stamping Operations [J].Mechanical Systems and Signal processing,2004,18 (1):143-159

[2] 赵新.粒子群优化模糊聚类算法在煤气鼓风机组振动故障诊断的应用[J].重庆工商大学学报(自然科学版),2013,30(2):37-41

ZHAO X.Application of PSO Fuzzy Clustering Algorithm to Fault Diagnosis of Gas Blower Group Vibration [J].Journal of Chongqing Technology and Business University(Natural Science Edition),2013,30(2):37-41

[3] 马超.因果图定性分析法及其在故障诊断中的应用[J].重庆工商大学学报(自然科学版),2015,32(9):73-75MA C.Qualitative Analysis of Causal Diagram and Its Application in Fault Diagnosis [J].Journal of Chongqing Technology and Business University(Natural Science Edition)2015,32(9):73-75

[4] JAYASWAL P,VERMA S N,WADHWANI A K.Application of ANN,Fuzzy Logic and Wavelet Transform in Machine Fault Diagnosis Using Vibration Signal Analysis[J].Journal of Quality in Maintenance Engineering,2010,16(2):190-213

[5] 王波,刘树林,张宏利,蒋超.相关向量机及其在机械故障诊断中的应用研究进展[J].振动与冲击,2015,34(5):145-153,167

WANG B,LIU S L,ZHANG H L,et al.Advances about Relevance Vector Machine and Its Applications in Machine Fault Diagnosis [J].Journal of Vibration and Shock,2015,34(5):145-153,167

[6] GAN M,WANG C,ZHU C A.Construction of Hierarchical Diagnosis Network Based on Deep Learning and Its Application in the Fault Pattern Recognition of Rolling Element Bearings [J].Mechanical Systems and Signal Processing,2016,72(3):92-104

[7] VAPNIK V N.The Nature of Statistical Learning Theory [M].New York:Springer Verlag,1995

[8] 陈才扣,高林,杨静宇.一种基于空间变换的核Fisher鉴别分析[J].计算机工程,2006,31(8):17-18,60

CHEN C K,GAO L,YANG J Y.Space Transformation-based Kernel Fisher Discriminant Analysis [J].Computer Engineering,2005,31(8):17-18,60

责任编辑:田静

Fault Diagnostics Based on Features Extraction and SVM Classifier

CHEN Hu

(Chongqing Rail Transit Corporation, Chongqing 400042, China)

In order to improve the support vector machine (Support Vector Machine, SVM) performance, reduce the time cost, this paper proposes a SVM algorithm based on feature extraction, and uses it for fault diagnosis of steam turbine generator set. Firstly, Kernel Fisher Discriminant Analyst (KFDA) algorithm is used to extract the key features of the turbine generator set data, and then the SVM classifier is used to classify the feature data set. Experimental results show that the algorithm is feasible and effective, and it has been improved in classification performance and detection time.

fault diagnosis; features extraction; Kernel Fisher Discriminant Analysis; support vector machine

10.16055/j.issn.1672-058X.2016.0005.006

2016-02-24;

2016-04-06.

国家自然科学基金(61472137); 国家安全监管总局安全生产重大事故防治关键技术科技项目(ZHISHU-031-2013AQ).

陈虎(1982-),男,山东省冠县人,工程师,硕士研究生,从事故障诊断、检测及管理研究.

U212.6

A

1672-058X(2016)05-0025-04

猜你喜欢

特征提取分类器故障诊断
基于包络解调原理的低转速滚动轴承故障诊断
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于Daubechies(dbN)的飞行器音频特征提取
数控机床电气系统的故障诊断与维修
基于实例的强分类器快速集成方法
Bagging RCSP脑电特征提取算法
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
因果图定性分析法及其在故障诊断中的应用
基于MED和循环域解调的多故障特征提取