APP下载

SOM神经网络和C-均值法在负荷分类中的应用*

2011-08-16王文生王科文

电力系统及其自动化学报 2011年4期
关键词:均值聚类特性

王文生,王 进,王科文

(1.长沙理工大学电气与信息工程学院,长沙 410114;2.湛江中心人民医院,湛江 524037)

在电力系统运行分析与仿真计算中,将变电站母线或线路供电的所有用户的集合称为综合负荷。综合负荷从电网吸收的功率随母线电压与频率而变化的关系称为综合负荷特性[1]。工程中用到的负荷模型要求有一定的精度且简单实用,又随着负荷特性记录装置记录的负荷特性数据不断积累,对负荷动态特性的聚类与综合是负荷模型走向实用化的有效手段。负荷动特性的分类包括特征向量的选取和聚类方法的确定两方面。

较早提出的最小距离分类法和贝叶斯分类法等统计模式识别方法使用的模型过于简单,相应的负荷特性聚类效果不尽人意。文献[3]首次提出负荷特性分类与综合的理论和实践方法;文献[4]提出应用KOHONEN神经网络对负荷动态特性进行聚类;文献[5]应用模糊等价关系对电力系统负荷特性进行分类与综合研究;文献[6,7]分别基于模型激励响应和轨迹灵敏度对负荷特性进行分类。

SOM神经网络[2],即自组织特征映射神经网络,它将多维数据映射到低维规则网络中,属于无监督竞争学习算法,可有效进行大规模的数据挖掘,且速度快,但不能提供分类后精确的聚类信息。而C-均值聚类在已知聚类数目和中心点的情况下有着很高的精确性,比较适用于中小型数据集。结合这两种算法的优缺点,本文提出基于SOM神经网络的C-均值聚类算法的负荷特性分类,对于分类样本庞大的应用场合,以此算法为基础的建模实践表明了该方法的适应性和有效性。

1 算法描述

1.1 SOM神经网络结构

SOM神经网络是由Kohonen教授提出的对神经网络的数值模拟方法。该网络由输入层和输出层组成。其中输入层神经元个数的选取按输入网络的向量个数而定,输入神经元接收网络的输入信号,输出层则是由神经元按一定的方式排列成一个平面。输入层的神经元与输出层的神经元通过权值联结在一起。当网络接收到外部输入信号后,输出层的某个神经元便会兴奋起来。自组织特征映射神经网络模型结构如图1所示。

图1 SOM神经网络Fig.1 SOM neural network

SOM神经网络结构具有两个明显特点:其一,拓扑映射结构不是通过神经元的运动重新组织实现的,而是由各神经元在不同兴奋状态下构成一个整体,所形成的拓扑结构;其二,这种拓扑映射结构的形成具有自组织特点,还具有按几何中心或特征进行聚类的独特性质。SOM神经网络是一种无监督的学习模式,它可将数据从高维空间映射到低维空间上,经降维寻找到多维数据的主要统计特征,并根据数据间的相似性自动将数据分成不同类别,以此达到增强顾客有用信息、降低噪声的目的。但SOM神经网络不能提供分类后精确的聚类信息。

1.2 C-均值聚类算法

C-均值聚类算法是一种应用较广泛的聚类算法,该方法简单、快速以及能有效处理大型数据库。但是C-均值聚类算法存在一些缺点:1)随机选取初始值可能会导致不同的聚类结果,甚至可能无解;2)该算法基于梯度下降,故有可能陷入局部极优;3)该算法要求预先输入聚类数目,但很多情况下聚类数目是未知的;4)该算法对“噪音”和孤立点数据有些敏感,少量的该类数据能对平均值产生很大影响。

许多研究者对C-均值聚类算法进行各种改进。其中常见的是结合遗传算法对C-均值聚类算法进行改进,但当样本数目、维数和类别较大时,这种算法会出现过早收敛于局部极值点的问题。

2 基于SOM神经网络的C-均值法在负荷特性分类中的应用

2.1 基于SOM神经网络的C-均值法

本文提出的基于SOM神经网络的C-均值聚类算法须由两阶段实现。

第一阶段通过SOM网络初始聚类,得到聚类数目和各类中心点。

1)设输入矢量,即负荷特性向量集合为X=[x1,x2,x3,…,xn]T,第 i神经元的权系数构成的加权矢量wi= [wi0,wi1,…,win]T,在没有反馈的情况下,神经元的稳态输出值为

2)找到yi取最大值时的神经元i,则其为最佳匹配单元c。

3)为使网络具有一种聚类功能,定义最佳匹配单元c的一个拓扑邻域Nc,使Nc内的单元输出为1,Nc外的单元输出为0,即

4)权值的训练公式为

式中0<a(t)<1,为学习因子。权值训练后返回步骤2),直到Nc或a(t)满足要求为止。

5)输入下一个输入矢量,转入1)进行下一轮的学习,直到所有的样本都学习完为止。

6)输出聚类数目C和聚类中心Z={Z1,Z2,…,Zc}。

第二阶段将第一阶段的输出结果作为C-均值算法的初始输入,进行迭代。

7)选择阈值ε,置迭代次数k=0,以步骤6)的输出结果作为C-均值聚类算法的初始输入值进行迭代计算,直至收敛。

8)输出聚类信息。

2.2 负荷特征向量的求取

聚类过程是在特征空间进行的,因此样本特征向量的选取相当关键。对于负荷分类,应用最为广泛的特征向量包括:负荷的实测响应、标准电压激励下的模型响应、负荷模型参数。

采用模型参数作为负荷特性分类特征向量,用具有全局收敛性的遗传算法进行模型参数辨识,遗传算法具有很好的全局寻优能力,辨识得到的参数较稳定。根据文献[8],参数灵敏度[8]反映了模型参数取值对模型响应的影响程度。若由于参数灵敏度过小而在模型响应中看不到参数变化产生的贡献,则所辨识的结果误差相对较大,即灵敏度小的参数在辨识结果中呈现较大分散性。考虑每个参数辨识结果误差不同,故对不同参数取不同的权值。对于辨识结果误差较小的参数取较大的权值,而对误差较大的参数则选取较小的权值。

1)对采集到的n组负荷扰动数据分别进行辨识,得出相应的模型参数辨识结果为x=(x1,x2,…,xn),其中的每个xi表示为xi=[GBRsx'T0nH](i=1,2,…,n)。

2)对原始数据进行归一化。由于采集的各数据单位不一致,可能引起网络训练时间增加,还可能引起网络无法收敛,所以需要在进行聚类之前对要处理的数据限制在一定范围内。这里采用数据极差正规化方法,如式(4)所示。

式中:[xij]min为第j列元素的最小值;[xij]max为第j列元素的最大值。

3)权值处理。根据前人研究成果,各参数取值情况如表1。将要分类的输入样本就可表示成:

表1 负荷模型参数权值的选取Tab.1 Selection of parameters weight

3 算例分析

算例数据来自动模实验[9],其中实验数据的负荷为恒阻抗加感应电动机形式,分别代表对应民用和商业的静态负荷及工业的动态负荷。采用遗传算法对处理过的动模数据进行综合电动机负荷模型参数辨识,辨识结果、样本负荷构成及电压扰动情况如表2。可知,样本共有3类。第1类为样本1和2,第2类为样本3和4,第3类为样本5和6。

表2 负荷特性数据特征及参数辨识结果Tab.2 Data of load characteristics and parameter identification results of the sample

对样本特征向量数据按照前述方法进行归一化,权值处理后,采用基于SOM神经网络的C-均值聚类算法对样本进行负荷特性分类。最后求得每个样本与每个类重心之间的距离矩阵,见表3。

由表3可知分类结果为,样本1和2分为第1类,样本3和4分为第2类,样本5和6分别为第4类和第3类。样本5错误分为第4类,其余分类结果都正确。分析样本,由于辨识结果中两者差异过大,导致样本5和样本6不能分到同一类。

表3 距离矩阵Tab.3 Distance matrix

对表2中的数据采用单一的C-均值聚类方法进行分类,首先设定有3个聚类中心,将此聚类结果和基于SOM神经网络的C-均值聚类算法的分类情况作比较,结果如表4所示。

表4 两种算法分类的对比Tab.4 Comparison of two algorithms classification

从表4可知,采用基于SOM神经网络的C-均值聚类算法的分类不但可自动给出合适的聚类数及稳定的聚类结果,而且效果要比单一C-均值聚类效果好。尤其遇到大量负荷样本时,基于SOM神经网络的C-均值聚类算法更能体现出优势。

4 结语

对负荷进行分类是解决负荷时变性,提高仿真准确度的重要方法。本文结合两种算法的优点,提出基于SOM神经网络的C-均值聚类算法的新的负荷分类方法,可有效进行大规模数据挖掘的SOM网络首先找出负荷特性向量样本的聚类数目和各中心点,因C-均值具有较强的局部搜索能力,得到合适初始值的C-均值聚类算法收敛速度和精度提高。并将其应用于电力负荷的动态特性聚类分析中,然后与基于单一C-均值聚类的分类结果进行比较。结果表明此算法不依赖于任何的初始条件,可自动获取聚类数目,实现无监督学习,聚类结果更加稳定,能够更加客观、准确地提取同类负荷的共同本质特征,取得良好的分类效果。

[1]Carson W Taylor.Power System Voltage Stability[M].北京:中国电力出版社,2001.

[2]Kohonen T.Self-organized formation of topologically correct feature maps[J].Biological Cybernetics,1982,43(1):59-69.

[3]贺仁睦,周文(He Renmu,Zhou Wen).电力系统负荷模型的分类与综合(The cluster and sunthesis of electric power system load models)[J].电力系统自动化(Automation of Electric Power Systems),1999,23(19):12-16.

[4]张红斌,贺仁睦(Zhang Hongbin,He Renmu).基于KOHONEN神经网络的电力系统负荷动特性聚类与综合(The characteristics clustering and synthesis of electric dynamic loads based on Kohonen neural network)[J].中国电机工程学报(Proceedings of the CSEE),2003,23(5):1 -5,43.

[5]李培强,李欣然,陈辉华,等(Li Peiqiang,Li Xinran,Chen Huihua,et al).基于模糊聚类的电力负荷特性的分类与综合(The characteristics classification and synthesis of power load based on fuzzy clustering)[J].中国电机工程学报(Proceedings of the CSEE),2005,25(24):75-78.

[6]郑晓雨,马进,贺仁睦,等(Zheng Xiaoyu,Ma Jin,He Renmu,et al).基于模型激励响应的负荷分类及泛化能力(Classification and generalization of the load model based on model dynamic responses)[J].电工技术学报(Transactions of China Electrotechnical Society),2009,24(2):132 -138.

[7]郑晓雨,贺仁睦,马进,等(Zheng Xiaoyu,He Renmu,Ma Jin,et al).基于轨迹灵敏度的负荷分类(A method of load classification based on the trajectory sensitivity)[J].电工技术学报(Transactions of China Electrotechnical Society),2010,25(9):145 -150.

[8]鞠平,金艳,吴峰,等(Ju Ping,Jin Yan,Wu Feng,et al).综合负荷特性的分类综合方法及其应用(Studies on classification and synthesis of componsite dynamic loads)[J].电力系统自动化(Automation of Electric Power Systems),2004,28(1):64 -68.

[9]周玉光(Zhou Yuguang).电力系统动态负荷建模与负荷动静比例的提取(Power System Dynamic Load Modeling And Acquisition of Dynamicstatic Percentage)[D].上海:上海交通大学电子信息与电气工程学院(Shanghai:College of Electronic and Electrical Engineering of Shanghai Jiaotong University),2006.

[10]金群,李欣然,刘艳阳,等(Jin Qun,Li Xinran,Liu Yanyang,et al).一种改进遗传算法及其在负荷建模中的应用(An improved genetic algorithm and its application to load modeling)[J].电力系统及其自动化学报(Proceeding of the CSU-EPSA),2006,18(2):35-40.

猜你喜欢

均值聚类特性
谷稗的生物学特性和栽培技术
色彩特性
基于K-means聚类的车-地无线通信场强研究
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
进一步凸显定制安装特性的优势 Integra DRX-5.2
Quick Charge 4:什么是新的?
基于高斯混合聚类的阵列干涉SAR三维成像
关于均值有界变差函数的重要不等式
一种层次初始的聚类个数自适应的聚类方法研究