APP下载

基于改进萤火虫算法和多分类支持向量机的变压器故障诊断

2022-03-16李俊冯俊杰武文吉刘迎澍

电测与仪表 2022年3期
关键词:步长适应度萤火虫

李俊,冯俊杰,武文吉,刘迎澍

(1. 国网山西省电力公司检修分公司,太原 030032; 2. 天津大学 电气自动化与信息工程学院,天津 300072)

0 引 言

电力变压器是实现电能转换的关键设备,处于电力系统核心环节。在变压器发生故障时第一时间发现并确定故障类型对保证电力系统安全运行意义重大。现阶段,主要用于变压器故障诊断的方法是油中溶解气体分析法(Dissolved Gas Analysis, DGA)[1-2]。三比值法[3]、罗格斯法[4]和改良三比值法等常规DGA方法因其在故障诊断中存在编码缺失等问题而使用受限[2]。近年来,贝叶斯分类器[5-6]、人工神经网络(Artificial Neural Network, ANN)[7-8]和支持向量机(Support Vector Machine, SVM)[9-10]等人工智能方法开始在变压器故障诊断领域大量使用。贝叶斯分类器所需数据样本较大,而ANN方法存在过拟合和易陷于局部最优的问题。SVM是一种新型机器学习算法,其以统计学习理论为基础,具有较强的小样本学习能力与较高的分类准确性,可以有效解决非线性和过拟合等常见问题[9]。

核函数参数和惩罚因子是影响SVM分类结果的关键参数,如何选取合适的核函数参数和惩罚因子是SVM应用领域的主要研究课题之一。现阶段,遗传算法(Genetic Algorithm, GA)、粒子群算法(Particle Swarm Optimization, PSO)、模拟退火算法(Simulated Annealing, SA)等多种智能算法在SVM核函数参数和惩罚因子寻优中已有广泛应用。萤火虫算法(Firefly Algorithm, FA)以其简单的数学模型、较好的全局和局部寻优平衡能力、较快的收敛速度等优势在许多优化问题中均表现出良好的性能[11]。文章将混沌优化理论和自适应变步长机制引入萤火虫算法,提出一种改进萤火虫算法(Improved Firefly Algorithm, IFA)用以对SVM参数进行寻优,利用优化得到的SVM模型进行变压器DGA故障诊断,并将其诊断结果与PSO-SVM模型、FA-SVM模型结果进行比较,结果表明IFA较其他两种算法收敛速度快,寻优能力强,故障诊断准确率高。

1 改进萤火虫算法

1.1 萤火虫算法

萤火虫算法由Xin-She Yang于2009年提出[12],该算法以萤火虫发光而相互吸引的生物群体行为为理论基础,同时遵循以下三条规则:

(1)与真实的萤火虫不同,算法中任意萤火虫之间都可以相互吸引;

(2)萤火虫所发出的荧光亮度与萤火虫的适应度函数值有关,适应度值大的萤火虫发出的光较强,适应度值小的萤火虫发出的光较弱;

(3)萤火虫所发出的荧光亮度与萤火虫之间的距离决定了萤火虫之间吸引度的大小。萤火虫荧光亮度越高,萤火虫之间距离越近,相互之间的吸引度就越大,反之亦然。

基于上述规则,定义萤火虫之间的相对亮度为:

(1)

式中I0为萤火虫的绝对亮度,是由萤火虫的适应度值决定的。萤火虫的部分荧光在传播过程中被空气所吸收的现象用光强γ吸收系数来表示,为一常数。任意两只萤火虫之间的距离dij可通过式(2)计算得出:

(2)

式中D为搜索空间维度;xi,k和xj,k分别为萤火虫i和j在搜索空间中坐标位置的第k个分量。

假设萤火虫xj的荧光亮度比xi的荧光亮度高,那么xj将吸引xi向其方向运动。xj对xi的吸引度可通过式(3)来计算:

(3)

式中β0为rij=0时xj对xi吸引度的最大值。萤火虫xi向xj靠近时将按照式(4)改变其坐标位置:

xi=xi+β·(xj-xi)+α·(rand-1/2)

(4)

式中步长因子α是一常数,rand是一随机数,二者的取值范围均为[0,1]。

1.2 萤火虫算法的改进

通常情况下,萤火虫的初始位置均通过随机分配的方式来完成,但这种方法并不能保证萤火虫位置的相对分散。为了解决上述问题,文章使用混沌优化理论来完成萤火虫位置的初始化。混沌序列的随机性、遍历性和非周期性等特性能够使萤火虫个体的初始位置在搜索空间中呈现均匀分布,改进萤火虫算法正是在混沌序列这些特性的基础上完成对解的寻找,进而保证了解的最优性。

文中采用立方映射来完成萤火虫初始位置的混沌优化,立方映射通过式(5)完成:

(5)

式中yi,k为萤火虫i在混沌序列D维空间中的第k个分量,yi,k∈[0,1]。

通过式(6)可求得与萤火虫个体初始位置相对应的搜索空间中的解:

xi,k=L+(1+yi,k)·(U-L)/2

(6)

式中U和L分别为搜索空间的上限和下限。

为了保证算法在拥有较强全局寻优能力的同时兼顾局部寻优性能,需对萤火虫位置更新时的步长因子α进行动态调整。当α取值较大时,萤火虫收敛速度较快,使其在搜索前期尽可能避开局部最优点,从而更好地完成全局寻优任务,但较大的α在算法搜索后期容易使萤火虫位置更新时跳过最优值,移动到最优值的另一侧,即在最优值附近震荡,若这种情况多次出现,算法的准确度和收敛速度将难以保证。如果α取值较小,算法的收敛效果虽然较好,但收敛速度有所降低,全局寻优能力变差,所得解极有可能为局部最优。基于上述分析,将自适应变步长机制应用于步长因子α的调整中,从而在迭代过程中根据搜索进度完成对α取值的动态更新。

α按照式(7)进行动态更新:

(7)

式中t为当前迭代次数;U和L的取值同式(6)。

2 支持向量机及其参数优化

2.1 支持向量机

设线性可分样本(xi,yi)(i=1,2,…,n;xi∈Rd,yi∈{-1,+1}),n为样本数量,d为样本空间维度,yi为样本所属类别。

d维空间中的线性判别函数为:

g(x)=ω·x+b

(8)

由式(8)得分类超平面方程为:

ω·x+b=0

(9)

(10)

由于不能保证所有样本均线性可分,因此在目标函数中增加了惩罚项来间接增大目标函数值。其中,ξi为松弛变量,对应于线性非可分样本,C(C>0)为惩罚因子。式(10)所示优化问题通过拉格朗日乘子法求解之后的对偶形式可用式(11)表示:

(11)

前述理论均针对线性样本,但大多数样本呈现非线性,因此需借助核函数完成最优分类超平面的求解。径向基核函数的表达形式如式(12)所示:

(12)

在此基础上可实现对非线性样本所属类别的判定,判定公式为:

(13)

2.2 支持向量机参数优化

采用IFA对参数C和σ进行优化,步骤如下:

(1)初始化算法参数,包括萤火虫位置上下限U、L,萤火虫种群规模N,步长因子α的初始值,光强吸收系数γ,最大吸引度β0,最大迭代次数T;

(2)利用式(5)、式(6)对N只萤火虫初始位置进行随机分配,每只萤火虫的位置坐标包含两个分量,分别为C和σ,由C和σ确定每只萤火虫的适应度值,此值即为萤火虫个体的绝对荧光亮度I0。文章选取SVM的分类准确率作为萤火虫个体的适应度值。;

(3)根据式(1)和式(3)分别计算萤火虫个体的相对荧光亮度I和吸引度β;

(4)按照式(7)修改步长因子α,并将其带入式(4)确定萤火虫坐标位置,再次计算相对荧光亮度;

(5)将当前迭代次数t加1,并与T进行比较,未达到T返回步骤(3)继续搜索,否则跳转至步骤(6);

(6)算法结束,根据最优萤火虫位置对应的C、α对SVM进行参数设置。

3 基于多分类SVM的变压器故障诊断

3.1 特征向量的选择和处理

为真实反映变压器运行状态,根据《变压器油中溶解气体分析和判断导则》[13],将CH4、C2H6、C2H4、C2H2和H2作为变压器故障诊断训练样本和测试样本的特征向量。不同气体在变压器油中含量的量级有所不同,使用前还需归一化处理数据样本。

3.2 多分类SVM故障诊断模型的搭建

选择正常、中低温过热、高温过热、低能放电和高能放电作为变压器的运行状态,其编码如表1所示,此编码即为故障诊断模型的输出。

表1 变压器状态及其编码

SVM为二分类算法,为完成变压器的故障诊断,需构造多分类SVM。相对于其他方法,二叉树法训练时间短,准确率高,所需二分类器少。采用二叉树法构造的多分类SVM故障诊断模型如图1所示。

图1 多分类SVM故障诊断模型

3.3 变压器故障诊断的实现

变压器故障诊断功能可通过以下步骤实现:

(1)读取训练和测试样本,对其进行归一化处理;

(2)以SVM的分类准确率为萤火虫个体的适应度值,调用IFA对各二分类SVM进行参数寻优;

(3)将步骤(2)求得的各(C,σ)组合带入各二分类SVM,在此基础上完成训练过程,得到式(13)所示的各二分类SVM的分类决策函数;

(4)根据图1所示的多分类SVM故障诊断模型,对测试样本进行分类,确定其故障类型。

4 变压器故障诊断与分析

4.1 实例样本的收集

从相关文献[14-15]中收集了多组具有明确结论的变压器DGA样本,去除相似、异常样本后,选取64组样本作为故障诊断样本,其中训练样本40组,测试样本24组。各类样本统计结果如表2所示,各二分类SVM训练样本统计结果如表3所示。

表2 各类样本统计表

表3 各二分类SVM训练样本统计表

4.2 SVM参数寻优

为了验证IFA具有较好的寻优能力,分别采用PSO、FA、IFA三种算法对SVM参数进行优化。3种算法的种群个体数目N均设为20,最大迭代次数T设为200,C和σ的取值上限为100,下限为0.01。PSO学习因子c1、c2设为1.5,惯性权重ω设为0.8,粒子的最大、最小速度分别设为0.5和-0.5。FA、IFA光强吸收系数γ和最大吸引度β0均为1,步长因子α为0.5,其中IFA步长因子将从0.5开始随迭代次数的增加而减小。各算法针对SVM4的参数寻优过程如图2所示。

从图2寻优结果来看,无论是PSO还是FA,其最终的适应度值均小于IFA,这说明IFA的参数寻优能力较PSO、FA更强。

图2 各算法参数寻优过程

另一方面,PSO的平均适应度值无法像FA、IFA那样达到最佳适应度值,这得益于FA、IFA没有使用PSO全局最优位置、个体最优位置等记忆功能来控制计算的方式,同时萤火虫的移动没有使用速度这一概念,避免了由于速度超过阈值引起的问题[16]。

IFA在FA基础上有了较大改进,适应度值达到稳定所需迭代次数明显减少,比FA的收敛速度更快,在同一组训练和测试样本下的适应度值更高,说明IFA的萤火虫初始位置混沌优化和自适应变步长机制较好地平衡了收敛速度和收敛精度之间的关系,使收敛速度和收敛精度均能达到最优。

4.3 变压器故障诊断

分别使用PSO、FA、IFA优化得到的参数建立基于二叉树的多分类SVM故障诊断模型,另外选取30组测试样本用于变压器的故障诊断,得到如表4所示的诊断结果。

表4 变压器故障诊断结果

IFA-SVM在故障诊断中存在3处错误,故障诊断的准确率为90%,而PSO-SVM和FA-SVM的故障诊断准确率分别为80%、83.3%。这说明IFA-SVM的分类性能明显优于PSO-SVM和FA-SVM,也从侧面反映出IFA-SVM具有较强的全局寻优能力。

5 结束语

文章提出一种改进萤火虫算法,并将其应用于SVM参数寻优,搭建基于IFA-SVM的变压器故障诊断模型,完成对模型有效性的验证,并得出以下结论:

(1)将萤火虫初始位置混沌优化和自适应变步长机制引入FA能使算法更容易跳出局部最优点,更好地完成全局寻优任务,同时保证收敛速度的快速性;

(2)IFA未使用记忆功能来控制计算的方式和基于萤火虫间距离确定萤火虫间光强和吸引度的机制使其较PSO寻优能力更强,稳定性更好,收敛速度更快;

(3)提出的IFA-SVM可以有效地对变压器故障进行诊断,诊断结果要优于PSO-SVM和FA-SVM的诊断结果。

猜你喜欢

步长适应度萤火虫
中心差商公式变步长算法的计算终止条件
改进的自适应复制、交叉和突变遗传算法
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
一种改进的变步长LMS自适应滤波算法
萤火虫
萤火虫
启发式搜索算法进行乐曲编辑的基本原理分析
基于动态步长的无人机三维实时航迹规划
抱抱就不哭了
夏天的萤火虫