APP下载

基于误判损失最小化支持向量机的故障诊断

2010-09-05宋晓峰冒泽慧

关键词:结点正确率类别

易 辉 宋晓峰 姜 斌 冒泽慧

(南京航空航天大学自动化学院,南京210016)

基于误判损失最小化支持向量机的故障诊断

易 辉 宋晓峰 姜 斌 冒泽慧

(南京航空航天大学自动化学院,南京210016)

为了解决决策导向无环图支持向量机(DAG-SVM)故障诊断的划分偏好问题,采用误判损失最小化支持向量机(MLM-SVM)对多分类决策结构进行寻优.传统方法以最大化诊断正确率为目标,该方法则考虑了各类误判引发损失的差异性,以最小化误判带来的损失为优化目标.针对k类故障进行诊断时,MLM-SVM首先给出各误判情况的惩罚因子,并生成k!种决策结构的误判损失混淆矩阵;然后,结合总体损失风险函数,求解出各结构对应的误判损失风险,进而获取具有最小误判损失风险的决策结构用以故障诊断.将该方法用于变压器故障诊断中,寻找得到最佳结构;然后采用k!种决策结构进行故障诊断,统计其误判损失,得出最佳结构.两者所选结构吻合,从而验证了该方法的有效性.

故障诊断;误判损失最小化支持向量机;结构选择

支持向量机(support vector machine,SVM)[1]是目前常用的一种基于数据驱动的故障诊断方法.相比神经网络方法,SVM具有需要样本量少、无维数灾难、不存在局部最小解等优点,因而得到了广泛的运用.但是,传统SVM是针对二分类问题设计的,而故障诊断所需解决的多为多分类问题.因此,采用支持向量机方法进行故障诊断,首先需进行多分类扩展,如 1-against-rest法[2]、1-v-1 法[3]、决策树法[4]等,其中Plantt等[5]提出的决策导向无环图支持向量机(DAG-SVM)引起了广泛的注意.这种方法借鉴图论中的决策导向无环图思想(decision directed acyclic graph,DDAG),有效避免了传统多分类扩展策略存在的决策冗余、样本不对称、存在划分盲区等问题,是目前最高效的扩展策略之一[6].然而,对于一个k分类问题(k>2,k∈R),DAG-SVM方法一共可提供k!种不同的DDAG决策结构,且不同的DDAG结构存在不同的误判偏好,可能会导致不同的划分结果[7-9].如何选择合适的DDAG结构,是DAG-SVM运用时必须首先考虑的问题.目前,通常通过重复试验比较正确率或者最小化决策结构误判概率来选取DDAG结构[10-13].这些方法只考虑了诊断的正确率,而未考虑到实际工程应用中不同误判带来的损失差异性.针对这一问题,本文采用误判损失最小化支持向量机对DAG-SVM结构进行选择,该方法将误判损失作为结构选取的重要标准,并将该方法应用至故障诊断中.

1 DAG-SVM及其划分偏好

1.1 DAG-SVM结构

对于k类问题,DAG-SVM方法共有k(k-1)/2个结点分布于k层结构中,每个结点对应划分特定类别的SVM分类器.其中,顶层只含1个根结点,第2层含有2个叶结点,依此类推,第i层含有i个结点.对于任意样本,只需经过k-1个结点即可划分其类别(除去最底层外,每层选用1个结点).第i+1层的选用结点由第i层中选用结点的决策结果所导向.采用DAG-SVM 法对一组4类样本a,b,c,d进行决策,流程见图1.图中,结点a-d为针对类别a和d设计的SVM二分类器,该分类器能够有效地对a和d两类数据进行识别.采用图1所示的流程,对于任意类别样本,该系统只需要经过3次识别即可对其进行类别定位.

图1 四分类决策结构

这种决策方法能在不增加决策计算量的情况下,为不同类别样本选取不同的决策路径,从而提高了划分精度.同时,采用类似递推式推理方式,可以避免传统算法的划分盲区问题.由于每个分类器都只包含2类样本,因此不易出现因正、负样本不对称而引起的过拟合现象.

1.2 决策偏好

DDAG结构不是唯一的.对于k分类问题,DAG-SVM共有k!种可行的DDAG结构,而不同的DDAG结构都有不同的决策偏好[7].通常,根结点处对应类别的划分正确率低于叶结点处对应类别.以图1为例,假设每层划分正确率为p,类别划分正确率为r,则类别a,b,c,d的划分正确率为

DAG-SVM任一分类节点,通常都可认为由弱分类器构成,即满足

结合式(1)、(5)和(6),可得

即对于四分类问题,DAG-SVM决策有利于类别b和c.

2 误判损失最小化支持向量机

在实际应用中,决策系统的误判往往会带来相应损失,而不同的误判带来的损失也不一样[7].在故障诊断中,如果把正常状态误判为故障状态,就会带来不必要的停工或维修;如果把故障状态误判为正常状态,则会导致设备损坏甚至更进一步的破坏.通常而言,后者带来的损失比前者大.

设X∈{A,B},误判A→B的惩罚因子为P(A),误判B→A的惩罚因子为P(B).分类器SVM1和SVM2对X具有相同的划分正确率p.在SVM1中,误判状况为A→B;在SVM2中,误判状况为B→A.则这2组分类器对应误判损失为m(A)=P(A)(1-p)和m(B)=P(B)(1-p).

不同于传统方法以最大化划分正确率p为目标,误判损失最小化支持向量机同时考虑了划分正确率p及决策结构对应的误判惩罚因子,使得多分类结构具有最小的损失风险,因此更具现实意义.误判损失最小化支持向量机的算法流程如下:

①定义误判损失矩阵.针对k类诊断问题,生成k×k大小的误判损失矩阵,即

式中,lij为第i类样本被误判为第j类所带来的损失,由专家根据经验给出.

②生成损失混淆矩阵.DAG-SVM具有k!种不同的决策结构,而每种结构都对应不同的误判惩罚因子分布.根据给定的误判损失矩阵,针对不同决策结构生成不同的损失混淆矩阵P,以对惩罚因子的分布进行描述.以四分类问题为例,设其第4层分布顺序为a,b,c,d,则损失混淆矩阵为

式中,{a,b,c,d}∈{1,2,3,4}.

③构建总体损失风险函数.假设每个SVM二分类器划分正确率为p,且p∈[0.6,1].样本进入无关分类器时,其类别划分随机,即概率为1/2.分别统计各类别样本误判会导致的损失风险mi,以四分类问题为例,各类别损失风险如表1所示,表中Pij为损失混淆矩阵的第i行第j列元素.

表1 四分类误判的损失风险

为误判损失最小化支持向量机所用决策结构.

3 基于MLM-SVM的变压器故障诊断

实验采用的变压器故障数据来源于文献[10].采用油中溶解气体分析法,对变压器运行状况进行测量.充油电器设备内的绝缘油和有机绝缘材料在电和热的作用下会产生各种低分子烃类气体,溶解在油内的各种气体含量与变压器的运行状况密切相关.选择H2,CH4,C2H6,C2H4,C2H2五种气体作为测量对象,针对变压器正常工作情况、过热、低能放电、高能放电这4种运行状况进行故障数据选取(见表2).

表2 变压器故障样本

根据误判所带来的实际经济损失,由专家知识可得如下的误判损失矩阵:

则四分类问题的总体损失风险函数为

采用误判损失最小化支持向量选择的结构为 S[1342],S[2431],S[1432]和 S[2341].采用3 重交叉验证,各结构所对应误判损失值如图2所示.本文算法所选的DAG-SVM决策结构具有明显优势,验证了该算法的有效性.

图2 各结构对应误判损失

4 结语

采用支持向量机方法解决故障诊断问题面临的一个重要问题是如何选择合理的决策结构.本文将误判损失最小化支持向量机(MLM-SVM)应用至故障诊断,与传统方法以最大化划分正确率为目标不同,该方法以最小化误判带来的经济损失为目标,对决策结构进行有效选择.经变压器故障实验验证,该算法具有工程实用性.

References)

[1]Vapnik V.Statistical learning theory[M].New York,USA:John Wiley&Sons,1998.

[2]Knerr S,Personnaz L,Dreyfus G.Single-layer learning revisited:a stepwise procedure for building and training a neural network[M].New York,USA:Springer-Veerlag,1990.

[3]Takahashi F,Abe S.Decision-tree-based multiclass support vector machines[C]//Proceedings of the 9th International Conference on Neural Information Proceeding.Singapore,2002(3):1418-1422.

[4]Platt J C,Cristianini N,Shawe-Taylor J.Large margin DAG's for multiclass classification[M].Cambridge,UK:MIT Press,2000:547-553.

[5]Hsu C W,Lin C J.A comparison of methods for multiclass support vector machines[J].IEEE Transactions on Neural Networks,2002,13(2):415-425.

[6]Ussivakual N,Kijsirikul B.Multiclass support vector machines using adaptive directed acyclic graph[C]//Proceedings of the IEEE/INNS'International Joint Conference On Neural Networks(IJCNN-2002).Honolulu,Hawaii,USA,2002:980-985.

[7]Ma Ruowei,Tang Chunyang.Building up default predicting model based on logistic model and misclassification loss[J].Systems Engineering:Theory &Practice,2007,27(8):33-38.

[8]Parag Pendharkar,Sudhir Nanda.A misclassification cost-minimizing evolutionary-neural classification approach[J].Naval Research Logistics,2006,53(5):432-447.

[9]Ganyun L,Cheng H Z,Zhai H B,et al.Fault diagnosis of power transformer based on multi-layer SVM classifier[J].Electric Power Systems Research,2005,74(1):1-7.

[10]易辉,宋晓峰,姜斌,等.基于节点优化的决策导向无环图支持向量机及其在故障诊断中的应用[J].自动化学报,2010,36(3):427-432.Yi Hui,Song Xiaofeng,Jiang Bin,et al.Support vector machine based on nodes refined decision directed acyclic graph and its application to fault diagnosis[J].Acta Automatica Sinica,2010,36(3):427-432.(in Chinese)

[11]王定成,姜斌.在线稀疏最小二乘支持向量机回归的研究[J].控制与决策,2007,22(2):132-137.Wang Dingcheng,Jiang Bin.Online sparse least square support vector machines regression[J].Control and Decision,2007,22(2):132-137.(in Chinese)

[12]王定成,姜斌.支持向量机控制与在线学习方法研究的进展[J].系统仿真学报,2007,19(6):1177-1181.Wang Dingcheng,Jiang Bin.Review of SVM-based control and online training algorithms[J].Journal of System Simulation,2007,19(6):1177-1181.(in Chinese)

[13]宋晓峰,陈德钊,胡上序.结构可调的支持向量回归估计[J].控制与决策,2003,18(6):698-702.Song Xiaofeng,Chen Dezhao,Hu Shangxu.Adjustable structure support vector regression estimation[J].Control and Decision,2003,18(6):698-702.(in Chinese)

Fault diagnosis based on misclassification loss minimized SVM

Yi Hui Song Xiaofeng Jiang Bin Mao Zehui
(College of Automation Engineering,Nanjing University of Aeronautics and Astronautics,Nanjing 210016,China)

In order to solve the classification bias problem in fault diagnosis based on the decision directed acyclic graph support vector machine(DAG-SVM),a misclassification loss minimized SVM(MLM-SVM)is proposed to optimize the multi-type decision structures.Compared with conventional methods which are aimed to maximize the diagnosing accuracy,this approach takes the different losses brought by different misclassifications into consideration and sets the minimization of misclassification losses as the goal for optimization.Dealing with the k-type fault diagnosis,the MLMSVM first gives the penalty factors for all misclassification cases,and generalizes the misclassification loss confusion matrixes for all k!decision structures.Then,the misclassification loss confusion matrixes and the risk function for total losses are combined,and the misclassification losses for all corresponding decision structures are obtained.Furthermore the decision structure with the smallest misclassification loss for fault diagnosis is obtained.The approach is applied to the transformer fault diagnosis and the best structure is obtained.Then,all the k!decision structures are made for diagnosis and the corresponding misclassification losses are calculated to obtain the best structure.The two results are consistent,indicating the effectiveness of the proposed approach.

fault diagnosis;misclassification loss minimized support vector machine;selection for structure

TP183

A

1001-0505(2010)增刊(I)-0116-05

2010-05-18. 作者简介:易辉(1984—),男,博士生;姜斌(联系人),男,博士,教授,博士生导师,binjiang@nuaa.edu.cn.

江苏省自然科学基金重点资助项目(BK2010072)、南京航空航天大学基本科研业务费专项科研资助项目(NS2010071).

猜你喜欢

结点正确率类别
基于八数码问题的搜索算法的研究
门诊分诊服务态度与正确率对护患关系的影响
壮字喃字同形字的三种类别及简要分析
Ladyzhenskaya流体力学方程组的确定模与确定结点个数估计
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意
服务类别
多类别复合资源的空间匹配
中医类别全科医师培养模式的探讨