APP下载

基于蝙蝠算法优化最小二乘双支持向量机的变压器故障诊断

2018-07-28雷昳刘明真田威

电测与仪表 2018年5期
关键词:蝙蝠分类器故障诊断

雷昳,刘明真,田威

(国网湖北省电力公司检修公司,湖北 宜昌 443001)

0 引 言

电力变压器是电力系统中的核心设备,同时也是数量最多的设备,在电网中主要负责变换、分配和传输电能,是电力系统实现电力供应的重要支撑。变压器故障一直是影响电力系统安全可靠运行的重要因素,一旦发生故障,会严重影响电力系统供电的可靠性、安全性、持续性。因此,及时准确地诊断出变压器内部潜伏性故障对电力系统的运行尤为重要。

变压器运行过程中油中溶解气体的含量容易监测,能准确反映变压器的运行状态,基于油中溶解气体分析(DGA)技术可以不停电、实时在线进行诊断,已成为目前对油浸式变压器进行故障诊断最方便有效的手段之一[1]。经过学者们和相关部门的不断研究,在油中溶解气体分析(DGA)技术的基础上已经形成了特征气体法、罗杰斯比值法和改良三比值法。其中改良三比值法由于原理简单、容易实施,得到了广泛的应用。但在实际应用中暴露出编码不全、编码过界和过于绝对等缺陷[2]。随着计算机技术的发展,人工智能方法在工程应用中表现出了广阔的前景。学者们纷纷研究了基于神经网络[3-5]、支持向量机[6-9]、贝叶斯网络[10-11]、模糊理论[12-13]和云理论[14]等人工智能方法的变压器故障诊断技术,并取得了良好的效果。文献[5]采用SOM神经网络进行故障诊断,通过SOM网络对训练样本进行提取和优化,显著提高了BP神经网络的诊断精度。文献[9]采用遗传算法从变压器典型故障数据库中获取最佳溶解气体比作为样本训练SVM故障诊断模型,实例证明该方法在故障诊断中具有较好的鲁棒性和泛化性。文献[11]将选择性贝叶斯分类器引入到变压器的故障诊断中,该方法在解决信息不完备方面有一定的优势。文献[14]结合云理论和Adaboos算法建立了变压器集成诊断模型。

双支持向量机(TSVM)[15]是Jayadeva在2007年提出的一种二分类算法。与传统支持向量机不同的是,在解决二分类问题时,双支持向量机求解两个规模更小的二次规划问题产生两个非平行的超平面,每一个超平面在尽可能靠近一类样本的同时远离另一类样本[16]。通过将传统支持向量机中的较大规模的二次规划问题转化为两个较小的二次规划问题,双支持向量机的训练时间大大的缩短,约简到传统SVM的1/4[17]。作为双向量机的延伸,最小二乘双支持向量机(LSTSVM)用等式约束替代原二次规划问题中的不等式约束,大大降低计算的复杂度。与传统SVM相比,LSTSVM计算速度快,而且对不平衡数据分类有一定的适应能力。

文章基于油中溶解气体分析(DGA)技术,采用最小二乘双支持向量机和决策树对变压器进行故障诊断。为了减少误差积累、加快诊断速度、提高精度,在建立变压器故障诊断模型时,结合最小二乘双支持向量机和哈夫曼树实现多类分类,并在训练过程中采用蝙蝠算法优化最小二乘双支持向量机的参数。

1 多分类LSTSVM模型

1.1 LSTSVM基本理论

双支持向量机通过求解两个小规模的二次规划问题,使计算量大大的减小,但是仍需要求解一个比较复杂的凸二次规划问题。为此,M.Arun kumar和M.Gopa[18]受双支持向量机启发,在2009年提出最小二乘版本的双支持向量机。最小二乘双支持向量机将两个二次规划问题转化为两个线性方程,计算速度得到了明显的提高。

对于一个二分类问题,给定包含(m1+m2)个n维样本的样本集X∈Rm×n,m1×n维的矩阵A表示正类样本集,m2×n维的矩阵B表示负类样本集,非线性最小二乘双支持向量机可以通过求解如下优化问题得到:

s.t.-(K(B,CT)v1+e2γ1)+ξ2=e2

(1)

s.t.-(K(A,CT)v2+e1γ2)+ξ1=e1

(2)

式中C=[ATBT]T;ξ1和ξ2为松弛变量;c1和c2是值大于0的惩罚参数;e1和e2为全一向量;v1和γ1分别为所求得最优超平面的法向量和偏移量。K表示核函数,文中采用Gauss径向基核函数。

对于式(1)和式(2),将等式约束代入目标函数中得到:

(3)

(4)

式(3)分别对v1和γ1求偏导,式(4)分别对v1和γ1求偏导,可以得到:

(5)

(6)

式中G=[K(A,CT),e1],H=[K(B,CT),e2]。εI是为了避免出现病态解而加入矩阵项,其中I是单位矩阵,ε是一个很小的正数。

根据求解的结果构造两个非平衡超平面:

K(xT,CT)v1+γ1=0

(7)

K(xT,CT)v2+γ2=0

(8)

最终可得最小二乘双支持向量机的分类判决函数为:

(9)

1.2 基于哈夫曼树的多分类LSTSVM模型

哈夫曼树[19]是一种加权路径长度最小的二二叉树[20],采用自下而上的构造方式,每次都从所有的类中寻找最难分割的两类作为二叉树的下层节点,直至二叉树建立完毕。在哈夫曼树的构造过程中,两类之间分类的难易程度采用类间相异度来衡量。相异度的定义如下:

对于一个包含K类样本的样本集,X={X1,X2,...XK},将每一类样本集投影到特征空间,并在特征空间里构造K个超球体,每个超球体包含其中一类样本。则i类样本与j类样本之间的相异度Dij的计算公式如下:

(10)

式中dij表示i类中所有样本到j类样本的超球体中心的平均欧氏距离;Nij(dij)表示i类样本到j类样本所对应的超球体中心欧氏距离大于dij所有样本的数量;d(i,j)为两超球体球心的欧氏距离;ni和nj为i类样本和j类样本的样本数量。

对于基于决策树的多分类模型,层次结构的合理性直接决定了其分类准确率和分类决策速度。哈夫曼树作为最优二叉树,将其与LSTSVM相结合自下而上构造一种多分类LSTSVM模型,不仅可以降低误差积累,提高分类精度,还能有效缩短训练和分类时间。

基于哈夫曼树的多分类LSTSVM模型的建立过程如下:

(1)两两计算训练样本集中各个类之间的相异度,构造相异度矩阵D;

(2)将所有类中相异度最小的两类Xi和Xj合并为一个类簇,将合并后的样本集作为两类LSTSVM的训练样本集进行训练,得到的两类LSTSVM分类器构成哈夫曼树的一个非叶子结点;

(3)对于类Xi和Xj合并之后的K-1个类簇,计算这K-1个类簇两两间的相异度;

(4)按照(2)中训练一个两类LSTSVM分类器,构成一个新的非叶子节点;

(5)重复上述过程,建立完整的哈夫曼树。

2 基于蝙蝠算法的LSTSVM参数优化

2.1 蝙蝠(BA)算法概述

蝙蝠(BA)算法是由剑桥大学学者Yang[21]受自然界微型蝙蝠寻找食物和躲避障碍物的过程而提出的一种新型随机搜索优化算法。微型蝙蝠是一种具有较强的回声定位能力的生物,其通过发出声波和探测回声来建立周围空间的声音-图像,协助其准确地抓捕猎物。在其飞行过程中,蝙蝠向周围空间中发出较高频率和较宽频带的声波,并根据周围猎物的距离自动调节声波脉冲的响度和频率,在搜索猎物时,脉冲响度可以高达110 dB,当靠近猎物时,脉冲响度降为0。

蝙蝠(BA)算法正是基于模拟蝙蝠的觅食行为对优化问题可行解空间的最优解进行搜索,达到寻优的目的。在其寻优过程中,通过模拟蝙蝠觅食行为中声波脉冲的响度、频率的自适应调节过程,实现全局寻优和局部寻优的自由切换,从而使算法的全局搜索能力和局部搜索能力得到平衡。

fi=fmin+(fmax-fmin)β

(11)

(12)

(13)

式中fi表示蝙蝠i发出声波的频率,fi∈[fmin,fmax],在初始化是在其取值范围内随机给定;β是一个随机数,β∈[0,1]。X*表示t时刻全局搜索过程中最优的蝙蝠位置。

在局部搜索过程中,从当前的最优解集中随机选取一个解并给其一个随机扰动,在该最优解的邻域内进行局部搜索。局部搜索时,该蝙蝠的位置更新公式如下:

xnew=xold+εAt

(14)

式中xold表示所选取的一个最优解;ε是一个随机数,ε∈[-1,1];xnew表示对选取的最优解进行一个随机扰动之后得到的新解。

为了平衡全局搜索和局部搜索,在蝙蝠觅食过程中,其发射声波响度和频率需要跟随搜索猎物的进程自动调节,未发现猎物时,蝙蝠需要尽可能增大声波响度,增加搜索猎物的机会,当发现猎物时,蝙蝠则降低其发出声波的响度、提高频率。蝙蝠i发出声波响度Ai和频率ri的调节公式如下:

(15)

(16)

2.2 蝙蝠(BA)算法优化LSTSVM参数的步骤

多分类哈夫曼树中的每一个非叶子节点的两类LSTSVM分类器的分类性能直接影响着整体的分类精度,而每一个LSTSVM分类器的分类性能与惩罚参数c1、c2和高斯核参数σ的选取有很大的关系。因此,采用蝙蝠算法对每一个LSTSVM分类器的惩罚参数c1、c2和核参数σ进行寻优,以期获得最佳的分类效果。基于蝙蝠算法优化LSTSVM参数的具体步骤如下:

(1)收集样本,并将其分为训练样本和测试样本;

(2)设置相关参数,包括蝙蝠种群数Xsize、最大迭代次数Maxgen,觅食空间维数d,声波频率最大值fmax和最小值fmin、最大声波响度A0,初始频率r0,声波响度增加系数α以及常量γ;

(3)初始化,随机产生蝙蝠i的位置Xi和速度Vi,蝙蝠i的初始位置Xi包括三种属性:c1、c2和σ;

(4)评估蝙蝠个体适应度,并找出当前时刻最优解X*。将蝙蝠的位置所对应的三种属性值作为LSTSVM的参数,利用训练样本集进行训练得到分类器,利用校验样本集进行测试,将测试准确率作为适应度函数,适应度最好的蝙蝠个体所对应的位置即为当前最优解X*。

适应度函数为:

(17)

式中lt为正确分类的样本数;l为校验样本总数。

(5)按照式(12)和式(13)更新蝙蝠个体的位置和速度;

(6)在[0,1]范围内产生一个随机数rand,与ri比较,若rand>ri,则根据式(14)给当前最优解一个随机扰动,产生一个新解,并作越界处理;

(7)生成随机数rand,若rand

(8)计算各个蝙蝠个体的适应度,更新当前时刻最优解X*;

(9)判断迭代终止条件是否满足,若不满足,则转到步骤(4);

(10)输出最优解所对应的c1、c2和σ的值,将其作为LSTSVM的参数。

3 基于BA-LSTSVM的变压器故障诊断

3.1 特征量选取与数据预处理

电力变压器在运行过程中,内部发热或放电故障引起变压器油发生分解产生一些特征气体,主要包括H2, C2H4, C2H6, C2H4, C2H2五种,发生不同性质和不同程度的故障时,这些特征气体的含量会有明显的差异。因此,选取油中溶解H2, C2H4, C2H6, C2H4, C2H2五种气体的含量作为特征量。所以故障诊断模型的输入特征向量记为x=(x1,x2,x3,x4,x5),其中x1,x2,x3,x4,x5分别代表油中H2, C2H4, C2H6, C2H4, C2H2五种气体的含量。考虑到五种气体气体含量较大的差异可能会引起计算误差,所以将五种气体的含量按下式进行归一化:

(18)

x′={x1/c1,x2/c2,x3/c2,x4/c2,x5/c2}

(19)

归一化之后,原始输入特征向量的各维属性值均映射到[0,1]区间。

3.2 故障类型划分

在变压器实际运行过程中,内部故障主要包括两大类:放电性和过热性,有时这两种故障还会同时存在。参考相关规定以及一些变压器实际运行资料数据,将变压器的故障模式细分为6种,包括中低温过热T1(低于700 ℃)、高温过热T2(高于700 ℃)、低能放电D1、高能放电D2、局部放电PD以及放电兼过热DT。

3.3 变压器故障诊断的具体实现过程

变压器的故障模式有6种,其故障诊断过程实质是一个多类分类问题。LSTSVM作为一个二分类器,不能直接用于多类分类,所以本文结合哈夫曼树和二分类LSTSVM构造多类分类器,并应用于变压器的故障诊断中。具体故障诊断实现过程图1所示。

图1 基于多分类器的变压器故障诊断实现过程

(1)数据预处理:采集变压器运行过程中各种故障模式的DGA数据构成故障诊断样本集,归一化后,将各类故障样本按比例分类训练样本集和测试样本集;

(2)建立故障诊断模型:计算相异度矩阵,并依据各种故障模式之间分类的难易程度自下而上建立故障诊断哈夫曼树,采用蝙蝠算法对每一个非叶子结点的LSTSVM的参数进行寻优,以最优参数构造LSTSVM分类器;

(3)测试:针对待测样本,沿哈夫曼树自上而下进行判断,直至叶子结点,得到待测样本的故障类型。

4 实际案例

从某地区供电局的生产资料中获取到178 组变压器DGA数据,从其中选取99组样本作为训练样本集,其余的样本均作为测试样本,各种故障类型的样本分布如表1所示,采用文中的模型进行故障诊断。

表1 各种故障类型样本分布

根据各类训练样本数据构建的多分类哈夫曼树如图2所示。

图2 多分类哈夫曼树

根据建立的哈夫曼树,针对6种故障类型,需要训练5个二分类LSTSVM分类器。在训练各个LSTSVM分类器,采用蝙蝠算法对其参数进行寻优。蝙蝠算法的相关参数设置为:种群规模xsize=30,最大迭代此时Maxgen=200,觅食空间维数d=3,fmax=2,fmin=0,A0=1.6,r0=0.000 1,α=0.9,γ=0.99。优化后,各个LSTSVM分类器的参数选取如表2所示。

表2 LSTSVM参数优化结果

基于最优参数建立的故障诊断模型对测试集中各种故障类型的诊断准确率如表3所示。

表3 测试集诊断结果

从表3中诊断结果可以看出,文中故障诊断方法在中低温过热、高温过热、低能放电、高能放电四种故障类型的诊断过程中均取得了较高的准确率,而对于局部放电和放电兼过热故障,由于样本太少,导致诊断准确率偏低。

为了验证该方法的优越性,采用支持向量机对原样本集进行故障诊断,并与文中方法进行比较。采用支持向量机方法进行故障诊断时,参考文献[22]中的二叉树模型建立基于支持向量机的多类分类模型,每一个二分类支持向量机的参数采用粒子群算法进行优化。两种方法的故障诊断效果对比如表4和表5所示。

表4 PSO-SVM方法与本文方法训练时间对比

对比表4中两种方法各个子分类器的时间可以看出,文中方法的训练时间远远小于PSO-SVM方法,说明采用文中算法对变压器进行故障诊断时计算复杂度得到了显著的减小。

对表5中两种方法的故障诊断结果分析可知,对于放电兼过热故障,文中方法的诊断准确率略低于PSO-SVM方法;对于低温过热、高能放电、局部放电三种故障类型,文中方法的诊断准确率与PSO-SVM方法相等;而对于高温过热、低能放电故障,与PSO-SVM方法相比,该方法的诊断准确率得到了很大的提升。同时,该方法整体的故障诊断精度要显著优于PSO-SVM方法。

表5 PSO-SVM方法与本文方法诊断结果对比

5 结束语

作为支持向量机的改进算法,LSTSVM具有更优的分类性能。文章使用LSTSVM对变压器进行故障诊断,并结合两分类LSTSVM和哈夫曼树建立多分类故障诊断模型,对于多分类哈夫曼树中每一个子分类器,采用蝙蝠(BA)算法对其参数进行优化,使其分类性能达到最佳。实际案例表明,采用该方法对变压器进行故障诊断,不仅可以大大地缩短训练时间,而且能获得更优的诊断精度,在故障诊断中能取得更好的效果。

猜你喜欢

蝙蝠分类器故障诊断
BP-GA光照分类器在车道线识别中的应用
蝙蝠
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
因果图定性分析法及其在故障诊断中的应用
蝙蝠女
蝙蝠为什么倒挂着睡觉?
基于LLE降维和BP_Adaboost分类器的GIS局部放电模式识别
基于LCD和排列熵的滚动轴承故障诊断
基于WPD-HHT的滚动轴承故障诊断