APP下载

基于概率盒的电网故障诊断方法研究

2016-03-17刘彦君王清心丁家满司怀伟张晋芳

计算机测量与控制 2016年2期
关键词:信息融合支持向量机故障诊断

刘彦君,王清心,丁家满,司怀伟,张晋芳

(昆明理工大学,昆明 650500)



基于概率盒的电网故障诊断方法研究

刘彦君,王清心,丁家满,司怀伟,张晋芳

(昆明理工大学,昆明650500)

摘要:针对电网故障信息存在丢失、误动、拒动等不确定性问题,文章采用概率盒理论和支持向量机相结合的方法对电网故障进行诊断,充分利用概率盒在处理不确定问题上的优势;首先利用概率盒对故障录波、电气量等数据建模,然后利用融合规则将得到的多个概率盒进行融合,并提取特征向量;最后,利用支持向量机进行分类,并得出诊断结果;为了验证方法的有效性,采用仿真线路进行概率盒的故障诊断,实验验证该方法合理可行,且有较高的诊断率。

关键词:电网;故障诊断;概率盒;支持向量机;信息融合

0引言

电网发生故障后,生成大量的故障信息,快速定位故障设备,缩短故障处理时间对于电网恢复是至关重要的[1]。随着电网系统日益复杂,采用单一的智能诊断方法已经很难得到精确地结果,研究将多种数据源融合的故障诊断方法具有十分重要的现实意义[2-3]。在故障定位[4]和数据信息融合等故障诊断领域[5]已经获得一些实质性进展。

故障特征提取以及故障分类是故障诊断的重要环节,决定诊断的精度和效率。故障信息存在丢失、误动、拒动等不确定性问题,影响故障诊断的精确度。常用的故障诊断方法有专家系统、人工神经网络、优化算法等[6]。在当前电网运行中,保护动作的正确率高达98%,对于故障诊断系统,剩余2%的小样本才是关键[7-9]。故障信息不完善的情况在很大程度上影响了对故障诊断的准确判断,从而影响维修人员对故障的处理[8]。概率盒(Probability-box, P-box)是用来表征不确定数组成的偶然不确定性和认知不确定性,经常用于风险分析或者是定量的不确定性建模[10]。概率盒可以用来解决小样本、概率分布类型未知、信息源依赖关系未知、测量不确定性、遗漏测量等不确定性问题。支持向量机(Support Vector Machine, SVM)是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性和学习能力之间寻求最佳折衷,以期获得最好的泛化能力。SVM在解决小样本、非线性及高维模式识别中表现出许多特有的优势。

本文提出了基于概率盒理论和支持向量机的电网故障诊断方法。该方法利用概率盒进行多源信息融合并提取故障特征,解决小样本、故障信息不确定的问题,提高诊断率;再利用SVM方法对故障分类,得出诊断结果。实验结果证明该方法有较高的精确度和诊断效率。

1基于概率盒的故障特征属性的概率界限分析

1.1概率盒

由于故障诊断中各种特征存在很大的不确定性,影响故障诊断的效率,概率盒可以根据记录对数据进行概率界限分析,使得指标数据在一个界限范围内,并根据该界限提取数据的一些特征向量,并将特征向量应用于故障诊断中。

概率盒上界:

(1)

概率盒下界:

(2)

图1 概率盒示意图

1.2DS结构体

DS结构体(Dempster Shafer Structure, DSS)由一个区间和一个信度组成,具体定义如下。

(3)

在假设空间Θ上基于BPA m的信度函数(Bel)定义为:

(4)

似然函数定义为:

(5)

对于假设空间Θ中的某个假设A,根据基本概率分配分别计算出有关该假设的信度函数和似然函数组成信任区间[Bel(A),Pls(A)],该区间用以表示信任程度。

基于Dempster规则可获取独立证据m1,m2的组合或融合结果[9],即

(6)

1.3概率盒与DSS的关系

(7)

(8)

同一概率盒可以由不同的DSS组成,将概率盒分解为等信度的DSS的过程称为概率盒的离散化。

1.4支持向量机故障诊断原理

一个完整的、可以处理线性和非线性,并能容忍噪音和离群点的SVM描述如下:

(9)

约束条件

(10)

其中:ω表示分类超平面的权系数向量;C为惩罚因子,表示对错分样本比例和算法复杂度折衷;ξi为松弛变量,即数据点xi允许偏离的函数间隔的量;b为分类阈值。利用拉格朗日数乘法求解,得到原目标的对偶问题为:

(11)

约束条件:

(12)

其中K为核函数,主要用于将特征进行从低维到高维的转换;αi为拉格朗日乘子。

2基于概率盒的SVM故障诊断模型

2.1构建概率盒

得到概率盒的方法有:专家估计,建模,鲁棒贝叶斯,约束缩小区间法以及测量观测法[11]。测量观测法是根据实验数据的估计值进行累积的一种概率盒的建模方法。通过测量观测法进行概率盒指标的建模过程描述如下。

在测量观测法中通常用一个区间,如[2.31, 3.44]表示观测的实验数据。这种区间通常会有一些说明,例如[2.31, 3.44, 10%]表示这段观测值的置信度。另外证据结构体的表示形式为([2.13, 3.6], 3.1),这3个数字可以表示为一个三角形,其中[2.13, 3.6]代表间隔范围,3.1表示峰值的最佳估计,这个三角形如图2中第一幅图所示。这3个数字不代表任何一个三角分布,只代表一个最佳点和一段区间。如图2第一幅图中X轴的三角形所示数值,三角形的宽度是不确定性数据的一种表示方法,表示数据集的可变性。图2第二幅图表示这些实验观测数据所得到的概率盒,横轴同样表示数据集,而纵坐标表示累积概率分布。概率盒是根据三角形的左边界和右边界两两分别做累积分布(CDF)得到的。对经验函数(EDF)进行累积,使得实验数据集中的所有数据都可以包含在概率盒中。

用简单的数据具体说明整个建模过程,假设我们有如下数据3±3,8±5,11±5,14±4,15±4,15±4,16±4,17±3,19±3,20±3,21±2,25±2,28±1,32±1,38±1。在下图中用三角形的峰值表示最好的估计值,并且用峰值作为正负间隔的标准,例如:3±3,其中3作为最好估计值为三角形的峰值,它的正负区间分别为0~ 3、3~6。图2第二幅图表示用这些数据得到的概率盒。不确定变量的特征我们考虑是由正负区间导致的。上边界是累积区间的左端点,而下边界则是累积区间的右端点。综上所述,这条边界类似于经验分布函数。相关证据结构体为: {([0, 6], 1/15), ([3, 13], 1/15), ([6,16], 1/15), ([10, 18], 1/15), ([11, 19], 2/15), ([12, 20], 1/15), ([14, 20], 1/15), ([16, 22],1/15), ([17, 23], 1/15), ([19, 23], 1/15), ([23, 27], 1/15), ([27, 29], 1/15), ([31, 33], 1/15),([37, 39], 1/15)}。

图2测量观测法所得概率盒示意图

当数据量足够大时边界线将是一条光滑的曲线。采用测量观测法构建概率盒的步骤如下:

步骤1:观测采样。

步骤2:估计采样数据的峰值及其正负区间。

步骤3:利用统计学方法获得经验分布函数以及证据结构体以及置信区间。

步骤4:根据累计所得的分布函数(CDF)或DS结构体构建概率盒。

如图3所示为非故障情况下得到的电压概率盒。

图3 非故障情况下电压概率盒示意图

2.2信息融合与特征提取

通过不同的方法或者在不同的条件下可以得到多个不同的概率盒,将不同概率盒进行综合就可以得到相对完整、一致的信息。概率盒常用的融合方法有:交集融合、均值融合、包络、贝叶斯融合、DS证据结构体融合以及其改进算法等。本文根据包络融合规则进行数据融合,得到非故障情况下的电压、电流如图4所示。

图4 非故障电压、电流概率盒融合示意图

包络法融合概率盒原理简介如下。

假设有n个概率盒:

它们的包络定义为:

则有

这种方法可以扩展到DS结构体上,对每一个概率盒进行置信函数的累积和似然函数的累积。聚合这些概率盒然后进行离散化,即可转换到DS结构体。

将不同信息进行融合,提取融合后的特征量可以增加诊断精确度。累积不确定测量方法可以得到一些单一标量或者概率盒上下界区间,用于SVM模式识别。结合文献[10]、[11]、[12],对得到的概率盒进行6个特征向量提取,所得向量分别为:

向量1:累积宽度。

向量2:对数累积宽度。

向量3:累积区间边界值。

向量4:边界值。

向量5:矛盾区间统计。

向量6:置信区间。

2.3SVM故障诊断

随着采样频率的增加,概率盒的重叠部分随着不确定区间的减少而减小,但是仍然存在重叠部分,不可避免。采样频繁又会增加计算成本。为了解决该问题,采用支持向量机方法进行故障分类,解决概率盒分类的问题。SVM故障分类过程如下。

步骤1:建立训练数据和测试数据。训练数据和测试数据应当同时、随机构造。

步骤2:归一化数据。将特征量归一化处理,作为SVM的输入。

步骤3:选取核函数和SVM所需参数。

步骤4:输入训练数据得到训练模型。

步骤5:输入测试数据,通过训练模型得到分类结果。

图5 故障诊断流程图

基于SVM的故障诊断流程如图5所示,根据输入的特征向量依次诊断故障类型,每一次诊断之后,再进行一次二分类,直至识别出故障。

3算例分析

选取电压等级为220 kV,长度300 kM,采样频率为2 000 Hz的线路进行仿真实验。线路在0.08 s时发生故障,0.24 s故障切除。取故障前后0.02 s数据作为诊断数据。

针对电流、电压采用建模法构建概率盒,首先采用观测法进行采样。记录30 s内电压、电流的最佳估计值以及正负区间,并分为一组。出现已采样范围内的数据时采样结束,基于上述采样,得到经验分布函数和证据结构体。根据数据采样利用2.1节概率盒构建方法进行建模。进行分布函数累积或则取证据结构体左、右边界,即可得到概率盒。然后使用包络法进行融合。

故障情况下电压、电流概率盒融合如图6所示。

图6 故障电压、电流概率盒融合示意图

图6中所示的每个概率盒都有不同形状,盒子的宽度、边界值等各不相同,这些即为概率盒的特征。选取累积宽度、对数累积宽度、累积区间边界值和边界值作为故障诊断的特征向量。

将得到的特征向量随机分为训练数据和测试数据作为SVM的输入。先对数据进行归一化处理,利用SVM分类方法进行训练,得到训练模型。再将测试数据送入训练模型,可以得到分类结果以及精确度。

SVM常用的核函数有线性核函数、径向基核函数、多项式核函数等,使用不同核函数得到的精确度不同,实验结果如表1所示。

表1 不同核函数精确度对比

表1表明,使用径向基核函数精确度最高,为93.64%,因此选用径向基核函数(RBF)。在分类过程中,故障模式由数据识别符标示。RBF应用广泛,具有更多优势,例如线性核函数是RBF的一个特例,RBF可以将一个样本映射到更高维的空间等。RBF公式如下所示:

(12)

其中:γ为核函数的宽度。

取电压、电流单一指标进行故障诊断,与融合后的结果进行对比,得到的诊断结果如表2所示。

表2 不同指标的诊断结果对比

从表2可以看出,理想情况下采用概率盒融合后的实验结果更加精确,体现了使用概率盒方法进行特征提取的有效性,以及融合的必要性。概率盒在处理小样本、不确定性问题时有一定的优势,可以提高准确率。

4结论

本文采用概率盒方法对多源故障信息进行融合、特征提取,充分利用概率盒处理不确定问题的优势,解决故障信息存在的拒动、误动等不确定性问题;并利用SVM方法对特征向量进行分类,得出诊断结果。实验证明该方法有较高的准确率。

结合更多故障信息,进行故障测距等诊断是本文的下个目标。

参考文献:

[1] 高振兴, 郭创新, 彭建伟,等. 基于多源信息融合的电网故障诊断方法研究[J]. 电力系统保护与控制, 2013, 39(6): 17-23.

[2] 苏广宁, 张沛超, 胡炎.等. 基于多源信息的电网故障诊断新方法[J]. 电力系统自动化, 2012, 36(1): 61-64.

[3] 夏可青, 陈根军, 李力,等. 基于多源信息融合的实时电网故障分析及实现[J]. 电力系统自动化, 2013, 37(24): 81-88.

[4] 杨毅, 曾祥君, 徐舜等. 基于分布式行波检测的配电网单相接地故定位方法[J]. 电测与仪表, 2015,52(5):59-64.

[5] 郭创新, 彭明伟, 刘毅.多数据源信息融合的电网故障诊断新方法[J].中国电机工程学报, 2009,29(31):1-7.

[6] 张旭, 魏娟, 赵冬梅,等. 电网故障诊断的研究里程及展望[J]. 电网技术, 2013, 37(10): 2746-2753.

[7] 张燕, 佘维, 李平,等. 基于Petri网和故障树的电力系统故障诊断模型[J]. 计算机测量与控制, 2015,23(8): 3-3.

[8] 李凤莲, 李园园, 金铖,等. 改进的QPSO算法在电网故障诊断系统中的应用 [J]. 计算机测量与控制, 2014, 22(12): 3860-3863.

[9] 韩德强,杨艺,韩崇朝. DS证据理论研究进展及相关问题探讨[J]. 控制与决策,2014, 29(1):1-11.

[10]Scott Ferson, Vladik Kreinovich. Constructing Probability Boxes and Dempster-Shafer Structures[R]. Sand Report, 2003.

[11]Fulvio Tonon. Using random set theory to propagate epistemic uncertainty through a mechanical system[J]. Reliability Engineering and System Safety,2004,85:169-181.

Fault Diagnosis of Power System based on Probability-box Theory

Liu Yanjun, Wang Qingxin, Ding Jiaman, Si Huaiwei, Zhang Jinfang

(Kunming University of Science and Technology, Kunming650500, China)

Abstract:The fault information of power system often has the problems of missing information, malfunction and failure to operation, in order to solve the problems and improve the diagnosis ability, a new method based on probability-box theory and support vector machine was proposed. Firstly, the data of fault record and electrical quantities were used as the information source to construct the p-box. Then to take advantage of the complementation of the information source, the different p-box were fused and extract the feature from the p-boxes. Finally, using SVM classification and obtain the result. In order to verify the validity of the method, the simulation circuit is adopted to improve the probability box of fault diagnosis, the experimental shows that the p-box theory has high degree of diagnosis accuracy and is characterized by fast diagnosis and good real-time.

Keywords:power system; fault diagnosis; probability box; support vector machine; information fusion

文章编号:1671-4598(2016)02-0053-04

DOI:10.16526/j.cnki.11-4762/tp.2016.02.014

中图分类号:TM73

文献标识码:A

作者简介:刘彦君(1990-),女,河南沁阳人,硕士研究生,主要从事概率盒处理不确定性信息、故障诊断方向的研究。王清心(1958-),男,辽宁丹东人,教授,主要从事决策理论与方法,模式识别等应用研究。丁家满(1974-),男,江苏于都人,副教授,主要从事决策理论与方法,不确定信息等应用研究。

基金项目:国家自然科学基金资助项目(51467007);云南省应用基础研究所计划资助项目(2013FZ020)。

收稿日期:2015-09-01;修回日期:2015-09-30。

猜你喜欢

信息融合支持向量机故障诊断
基于包络解调原理的低转速滚动轴承故障诊断
数控机床电气系统的故障诊断与维修
大数据背景下的信号处理分析
多传感器图像融合技术
大数据环境下基于多维信息融合的高校教学评价
一种无人飞艇高度传感器信息融合方法
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
基于熵技术的公共事业费最优组合预测
基于支持向量机的金融数据分析研究