APP下载

基于极限学习机的电力系统暂态稳定评估方法

2019-07-03张林林胡熊伟于之虹

上海交通大学学报 2019年6期
关键词:暂态正确率电网

张林林, 胡熊伟, 李 鹏, 石 访, 于之虹

(1. 山东大学 电气工程学院, 济南 250061; 2. 中国石油大学(华东) 信息与控制工程学院, 山东 青岛 266580; 3. 中国电力科学研究院有限公司, 北京 100192)

随着清洁能源发电规模的不断增长和负荷多样性不断增加,电网结构日趋复杂,给电网状态监测、调度管理、运行控制等带来巨大的挑战[1].风电、光伏发电等具有发电随机性强、间歇性强、可调节能力弱等特点,大规模新能源的并网会降低系统的惯量,引起频率支撑能力下降、电网电压水平波动加剧、暂态稳定性恶化等一系列问题[2];而电动汽车、柔性负荷等新型负荷的接入使得负荷波动随机性增强,现代电力系统表现出强互动、多耦合和高随机的典型特征[3].风机、光伏阵列、储能元件等都需要通过逆变器并网,变换器等电力电子设备具有惯性小、响应速度快、过流能力弱等特性,使得其控制及管理理念与常规系统有很大的不同[4].因此,传统同步发电机占主导地位的电力系统正在逐渐演变,电力系统的动态特征将变得更加复杂.

传统的电力系统稳定分析一般通过建立物理元件的数学模型,然后选取数值积分及代数方法求解非线性微分-代数方程组,得到数值计算结果.每次仿真计算前需要确定全部数学模型、参数及仿真场景,故计算量比较大,对模型精确度要求较高.电力系统本质上是非线性复杂的动态网络系统,各个元件之间及其与外部因素间均存在耦合,而物理模型的建立通常基于一定的假设和简化.电力电子化电力系统的动态行为更为复杂,元件精确建模困难,传统研究的假设条件可能会失效[5-7],这使得数值仿真结果有时不能充分反映电网实际运行状况[1].另一类电网稳定分析方法是以能量函数为基础的直接法,通过判断扰动结束时系统的运行点是否仍然在稳定域内,即扰动后的系统能量是否小于渐近稳定域临界能量值来判别系统的稳定性.基于经典模型的直接法已应用于简单电力系统的暂态功角稳定分析,但由于难以准确计及负荷动态,且难以应用于复杂系统,从而限制了它在实际电网中的应用[8-10].

电网作为一种高维复杂的能量传递网络,伴随能量传递的过程将有大量运行数据的产生,这些数据可反映系统的时空特性与稳定程度.传统的分析方法并不能有效利用这些运行数据,即无法以数据驱动为途径及时、准确地进行系统分析和辅助决策[11],造成了资源的浪费.随着电力量测技术的发展和能源互联网及智能电网建设的不断推进,电网量测体系中积累了大量的电力数据[12-13],为将大数据挖掘与分析技术应用于电网稳定评估提供了可能[14-17].数据驱动型暂态稳定评估方法能够在一定程度上脱离电网物理模型,从数据角度分析电网量测信息与电网运行状态的关联性,直观迅速地获知电网当前运行情况,使调度人员或自动调节控制装置及时对电网状态做出必要修正,提高系统稳定水平.

以机器学习为代表的数据驱动算法已成功应用于电力系统暂态稳定评估,并取得良好的效果.文献[18]利用带有输入记忆功能的多层感知器网络改善电力系统的稳定裕度;文献[19]将支持向量机(SVM)和决策树相结合,在兼顾输入特征信息量和整体计算效率的情况下进行组合式暂态稳定评估;文献[20]基于故障后发电机端电压受扰轨迹簇特征,利用SVM构造预测器进行暂态稳定预测.利用数据挖掘技术进行暂态稳定预测实质上是基于量测数据的,通过离线学习获得数据关键特征与系统运行轨迹的映射关系,形成数学预测模型.但是,电网的网络结构和运行方式处于不断变化中,量测数据也处于不断产生和更新中,若不能快速给出预测结果或者利用最新量测数据快速更新和训练相应评估模型,将会产生不可信的结果.为提高暂态稳定评估模型训练速度,提出可在线应用的电网稳定判别算法,本文研究基于极限学习机(ELM)[21-22]的电力系统暂态稳定判别模型.ELM是一种改进的单隐层前馈神经网络,它克服了传统神经网络梯度下降算法需要多次迭代求解、网络结构复杂等缺点,具有参数选择简单、训练速度快、泛化能力强等优点,适于在线应用.论文通过特征集选取、特征分析及评价指标定义等,改进ELM方法,使之适用于在线电网暂态稳定评估,并用仿真算例进行了验证和分析.

1 极限学习机原理

随着智能电网建设的不断推进,量测装置逐渐覆盖电力网络的关键节点,调度中心可实时获取高压母线及线路上的各电气量信息,如线路有功功率、无功功率、节点电压模值及相角.对于m个节点的电力网络,每个节点选取r个量测信息,构成反映电力网络的d维特征向量x,其中d=mr.

(1)

以n维类型向量t表示不同运行状态下系统的稳定水平,向量元素取值集合为{0,1},当全1时表示系统安全裕度最高,全0表示系统失稳.

(2)

本文中取n=1,即t=1时系统稳定,t=0表示系统失稳.一个完整的训练样本可以表示为

(3)

在发电机出力变化、负荷水平变化或者系统发生不同地点、不同类型的故障情况下,电网处于不同的运行状态,得到多个样本向量形成样本集合P(设样本数量为N):

(4)

对应上述数据表示方法,图1所示为一个输入为d维、隐藏层为L维、输出为n维的单隐层神经网络.输入层与隐藏层连接权值为w,隐藏层中每个神经元均具有阈值b,根据网络连接关系可以计算出隐藏层的输出矩阵为

(5)

式中:s(·)为激活函数,负责将连续量映射为离散量,即实现(-∞,+∞)⟹(0,1)的映射.

图1 单隐层神经网络Fig.1 Single-hidden layer neural network

当输入数据经权重加和后大于阈值,相应的隐藏层神经元输出为1,反之为0.为保证整个数学模型的光滑可微,一般采用Sigmoid函数作为激活函数:

(6)

模型的输出为隐层输出矩阵H与外权值β之积Y=Hβ,即

Y=

(7)

选择所有训练样本的实际类别与模型输出结果的误差累计之和作为目标函数进行优化,定义如下:

(8)

式中:k=1,2,…,n.使E达到最小值的参数即形成理论上性能最佳的神经网络,根据矩阵理论[23]相关知识,上式可以改写为

E=(Hβ-T)T(Hβ-T)

(9)

(10)

(11)

(12)

式中:H†为Moore-Penrose增广逆阵,简称伪逆.实际中常用正交法获得H†:

(13)

(14)

1对应稳定,0对应不稳定,进一步划分可产生不同稳定裕度的对应关系.

2 暂态稳定评估算法构建

2.1 原始特征的构建及特征分析

实际仿真中发现暂态稳定问题存在明显的样本不平衡特征,即仿真产生的稳定样本数量明显多于不稳定样本.在这种情况下,模型经过训练容易出现过拟合的问题,即分类器将稳定样本本身的一些特点当作所有样本都会有的一般性质,使分类误差增大.另外,若采用传统的正确率,即分类正确个数与样本总数的比值作为评价模型泛化能力的标准,模型对不稳定样本的识别能力会因为“大数吃小数”而被稳定样本所掩盖.

为解决上述问题,全面反映模型的性能,提出以下两项措施:

(1) 基于裕度距离的欠采样.由于我国电力系统运行均留有一定的裕度,大量的稳定样本与稳定边界有较大的距离.而对于ELM训练来说,理想的样本应该以与稳定边界接近的数据为主,从而得到精细化的稳定规则.所以对仿真得出的样本数据进行筛选,剔除部分距离稳定边界较远(稳定裕度很高)的稳定样本,提高训练集中不稳定样本的比例.实际电力系统中不稳定情况仅占所有数据的3%左右,若通过欠采样降低稳定样本数使两者比例相同,则总体样本将偏少;但通过调整初始运行的方式增加失稳样本的绝对数量,又会面临大电网仿真调整策略不易确定、潮流不收敛、计算量显著增加等问题.考虑到一般认为不同类别样本不平衡比例超过 4∶1 时分类器才会因数据不平衡性而无法满足分类要求,为在提高失稳样本比例的同时保证足够的样本总量,本文控制稳定样本和不稳定样本的比例为 2∶1.

(2) 改进泛化能力评价标准.考察不稳定样本中的正确率与稳定样本中的正确率的几何均值,采用全局正确率作为评价指标:

(15)

式中:Au表示数据集中不稳定样本的正确率;As表示稳定样本的正确率.可以看出,全局正确率与样本绝对数量没有太大关系,只有两类样本的正确率都较高的时候,最终结果才会比较高.

输入特征构建的合理与否会影响最终分类器的预测性能.综合文献 [24-26],经过初步筛选,使系统暂态稳定性突变后会出现明显变化的且易于获取的电气量在特征集中占较大权重,忽略部分不发生变化的电气量,最终构建以潮流计算为基础的137维原始特征,具体特征如表1所示.

输入特征过多时,数据属性中常常含有和暂态评估无关的特征或者多个特征之间互有重叠,这种冗余性不仅会使训练时间大大增加,更有可能导致算法最终无法收敛,带来“维数灾”问题.因此采取措施进行特征分析以获取最有价值的特征集是非常有必要的.

表1 原始特征集Tab.1 Original feature set

借鉴SVM中的递归特征消除思想[27],本文将递归特征消除法应用在ELM上进行特征分析,算法流程如下.

算法1递归特征消除法获取最有价值的特征集

Input:训练数据集Dtrain,测试数据集Dtest,隐层节点数Lbest,激活函数s(·)

Output:所保留的特征数目value及其在原始特征集中的索引值表index

计算采用全部特征时的正确率G0

fori=1,2,…,N

消除第i维特征;

训练并测试模型,测试正确率为Gi;

取μi=G0-Gi为该特征的重要性指数;

end for

对i=1,2,…,N依μi降序排列并记为index

依index对原始特征排序得到新的特征集

forj=1,2,…,N

取前j维特征进行训练;

end for

具体思路为:依次消除原始输入特征的某一维特征,此时模型的性能会发生变化,这种变化反映出了这一维特征对于模型的重要性,每次消除一维特征,递归进行直到最后一维;接着按照特征的重要性从大到小对原始特征排序,然后消除排序靠后(重要性不高)的一部分特征得到最有价值的特征集.

2.2 暂态稳定评估算法流程

根据以上介绍,基于ELM的暂态稳定性评估的具体步骤如下:

(1) 利用仿真软件搭建电力系统模型,随机设置初始条件及故障条件进行仿真,获取足够的反映系统暂态稳定性特征的样本.

(2) 利用递归特征消除法对原始样本集进行特征分析保留最有价值的若干特征形成样本集.

(3) 按一定比例将样本集随机分为训练集和测试集,同时保证两者的稳定样本与不稳定样本的比例大致相同.

(4) 通过交叉验证[28]优化网络结构,确定ELM的隐含层节点数.由于网络结构中内权值和阈值均随机初始化,交叉验证所得到的最佳隐层节点数必然会出现波动.为此引入统计学方法,多次试验得到多个最佳数目,在此基础上剔除异常值后取均值作为隐层节点的最终取值.

(5) 利用训练集训练ELM,确定输出层的权值向量.然后对测试集进行分类测试,根据结果对ELM模型性能作出评价.

由于ELM的输入权重和阈值可以随机生成,仅需要计算一个广义逆阵就可以得到输出权重,整个算法的训练时间很短,实际仿真中仅需几十毫秒就可以完成训练.算法所需要储存的变量为输入特征集索引值向量、连接权重及阈值,经特征筛选后,这些参数的维度大大减少,算法空间复杂度较低.

3 算例分析

3.1 算例简介

本文选取图2所示的IEEE 39节点标准测试系统验证所提出方法的有效性,它包含了46条线路、39个节点和10台发电机.

仿真软件采用电力系统分析软件BPA,负荷水平范围设置为75%~125%,发电机母线电压水平在90%~110%范围内调整,发电机有功控制在70%~130%内,按照均匀分布概率决定具体的数值以获取大量不同的电力系统断面数据.

假定系统发生三相短路故障,故障后 0.1 s切除故障,根据任意两发电机相对功角差是否大于360° 来判定系统是否稳定[29],并分别以“1”和“0”标记,将样本分为两类.最终共生成 1 240 组数据,随机分成训练集和测试集,训练集864例样本,其中稳定与不稳定样本比例为2∶1;测试集376例样本,其中稳定样本282例,不稳定样本94例.

图2 IEEE 39节点系统Fig.2 IEEE 39-bus system

3.2 仿真结果分析

由于ELM中输入权重w与阈值b随机生成,交叉验证所得到的隐层节点数会发生波动,所以统计多次试验的结果,如图3所示,剔除明显偏离大部分数据的异常点后取平均值作为最佳统计结果,最终最佳隐层节点为98个.

图3 网络结构优化结果Fig.3 Result of network structure optimization

递归特征消除结果如图4所示,横轴表示特征对应的维度索引值,纵轴为该特征的重要性指数,值越大表示该特征对提高模型分类能力起的作用越大,重要性指数会影响接下来排序筛选得到的输入特征集,进而影响ELM模型的输入层节点数量.

将特征按照图4中重要性指数从大到小排序,然后逐一消除排序靠后的特征,统计测试正确率得到如图5所示曲线,当保留特征个数为68时(约为特征总数的48%),得到的ELM模型具有较好的性能.若特征空间中包含的特征数较少,分类器预测性能较弱;若保留特征个数高于68个,分类器在预测性能上没有太大差异,但特征空间维度越高,算法计算量越大.为在保证性能的同时尽可能降低存储空间和计算时间,选择保留特征排序后的前68维特征,此时的预测准确率为97.505%.最终得到训练完成并通过测试的ELM模型,其输入层、中间层和输出层节点数目分别为68、98和2,输入及输出权重矩阵和中间层阈值向量采用排序筛选中最优性能(68维)处对应的取值,模型训练耗时约为30 ms.

为比较有无递归特征消除对ELM性能的影响,利用原始特征集训练ELM并统计测试结果与有特征选择的ELM进行对比,如图6所示.未加入递归特征消除的ELM正确率仅为91%,加入特征分析后ELM准确率提高到97%,特征分析能够明显提高ELM的预测准确率,改善模型的性能.

图4 特征重要性Fig.4 Importance of different features

图5 特征排序筛选结果Fig.5 Result of feature sorting and screening

图6 递归特征消除结果Fig.6 Result of recursive feature elimination

3.3 其他机器学习模型的评估结果

为了验证ELM相对于其他机器学习算法在暂态稳定评估中的优势,选取在电力系统中已经得到了较多研究的SVM进行对比试验.SVM是一种通过寻找数据空间中不同类别数据之间的最优分类超平面来实现分类功能的算法.

测试中使用的计算机配置:CPU为Intel Core i5-6500 3.2 GHz;RAM为8 GB;操作系统为Windows 10;仿真软件及版本号为MATLAB R2017b.SVM的核函数依次选择线性核、多项式核和高斯核,分别进行训练和测试,统计训练时间和测试正确率,并与ELM进行对比,结果如表3所示,输入变量递归筛选作为对输入数据的处理,通过一次离线计算完成,不包含在训练时间中.

表3 SVM与ELM对比结果Tab.3 Results comparison between SVM and ELM

由上表可知,多项式核函数SVM正确率达到了97.29%,略低于ELM(97.51%).但ELM需要的训练时间远少于SVM,证明了所提方案的有效性及其在线应用的可行性.

4 结语

本文提出了一种基于ELM的电力系统暂态稳定预测方案.首先采用递归特征消除法分析原始样本集保留最有价值的若干样本,然后利用交叉验证法优化ELM网络结构,并利用特征分析后的样本集训练神经网络,最终得到电网暂态稳定评估结果.ELM不需要面对过拟合、局部最小值等问题,只需一步就可以构造出单隐层反馈神经网络,具有结构清晰的优势.利用IEEE 39节点系统进行算例研究并与SVM方法进行对比试验,结果表明,ELM作为分类器应用于电力系统暂态稳定评估可大幅提高效率,利用输入特征筛选方法可保证较高的预测准确率.上述方法的在线应用将是下一步研究的重点.

猜你喜欢

暂态正确率电网
穿越电网
基于李雅谱诺夫直接法的电力系统暂态频率稳定分析
门诊分诊服务态度与正确率对护患关系的影响
电网调控技术在电力系统中的应用
电力系统全网一体化暂态仿真接口技术
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意
动车组升弓电磁暂态的仿真与测试
暂态扭矩在多支承转子系统中的传递特性