APP下载

基于AE-MFCM技术的电力用户响应特性分析方法

2021-05-11王剑锋倪家明王旭东孔祥玉于建成

电力系统及其自动化学报 2021年4期
关键词:电价权值种群

王剑锋,倪家明,王旭东,孔祥玉,姚 程,于建成

(1.国网天津市电力公司,天津 300010;2.智能电网教育部重点实验室(天津大学),天津 300072)

随着智能表计大规模推广应用及电网精益化管理带来的配用电数据爆炸性增长,对电力用户精准分类及特征分析成为电网公司的一项重要工作。掌握用户需求响应特性有助于充分挖掘用户需求响应用户潜力、提高需求响应实施效率,是制定需求侧管理方案和电价套餐的基础[1]。随着经济与技术的发展,电力用户类型及用电行为复杂多样,获取的电力用户数据呈现出高维、海量的特点,使得用户分类及响应特性分析变得更加困难。因此,复杂用户数据的高效处理及用电特性的准确分析方法至关重要。

目前,用户响应特性研究主要分为机理性与非机理性分析两类[2]。机理性分析主要是在特定环境下对电价等激励信号与用户负荷之间的关系进行机理性分析并建模。例如,文献[3]对市场环境下的电力用户的用电特征及策略竞价行为进行分析,建立发电商和电力用户的双边博弈模型。文献[4]以分时电价环境为例,分析了用户随价格变化的自弹性和互弹性特征,从而建立了用户响应模型。这些研究能够清楚解释电价等激励信号对用户负荷的机理性作用,对小规模特定用户适应较好,但建模较为复杂,不适合于特性差异较大且数量众多的用户。非机理性分析通过对进行用户数据挖掘来分析电价等激励性手段对用户负荷的作用,其核心技术为聚类算法与数据拟合,主要分为两步:①通过聚类算法对用户用电特性进行分类,将用电特性一致的用户归为一类;②利用历史数据对每类用户需求响应特性进行建模[5]。

随着经济科技的迅猛发展,用户用电行为将更加多样化,用电数据维度将更高,聚类所面临的不仅是数据量越来越大的问题,更重要的是用电数据高维度的问题。针对这一问题,非机理性分析方法更受关注。文献[6]使用模糊C均值FCM(fuzzy C-means)聚类法对电力用户进行聚类,该方法是一种软聚类算法,克服了硬聚类非此即彼的分类缺点,但该方法对初始聚类中心敏感,需要人为确定聚类数,容易陷入局部最优解。文献[7]利用凝聚层次聚类法对用电数据进行分析,该方法不需要确定分类数,但对于复杂数据类型合并执行,聚类质量受限制。文献[8]考虑用户负荷的随机特性,提出基于傅里叶变换的用户分类和行为建模方法,但忽略了较多的非主因素信息。自组织映射SOM(self-organizing map)聚类算法[9]与深度学习法[10]被用于电力用户的用电模式分类,这两种算法属于机器学习聚类方法,能够有效处理高维数据,但难以适应大规模数据。文献[11]利用逐段线性回归对用户需求响应进行分类和建模,该方法虽然操作简单,但激励与用户用电量之间并非简单的线性关系,这使得模型准确性较差。文献[12]构建了基于长短时记忆网络的用户响应行为分析模型,并应用等梯度迭代学习的方法获得合适的激励方案。上述方法尝试对降维后的数据进行聚类,能够解决部分较高维度的数据聚类问题,但降维过程中对高维非线性数据难以处理。自动编码器AE(automatic encoder)等技术能够有效解决面对高维数据时出现“维度灾难”的问题[13],已在工程上有所应用。

本文提出一种基于AE与改进模糊C均值MFCM(modified fuzzy C-mean)聚类算法结合的电力用户特征分析方法,用来解决智能用电数据挖掘效率低导致聚类结果不准确的问题。其中,AE具有良好的特征提取能力,能够高效地将高维非线性数据映射至低维空间;MFCM通过遗传算法对FCM算法聚类中心的优化,弥补传统FCM算法易陷入局部最小值的不足。本文结合用户特征,利用神经网络等智能算法构建需求响应模型,能够简单有效反映各影响因素与用户响应量之间的复杂关系,从而实现针对不同业务需求的用户响应特性提取。

1 基于AE-MFCM的用户用电模式聚类

由于用户的用电行为复杂,在对用户进行需求响应分析时,应首先对用户用电行为进行聚类,然后在针对每类用户的用电特性进行分析。基于AE-MFCM的电力用户响应特性分析方法架构如图1所示。其中利用AE对高维的用户数据进行降维,以及利用恰当的聚类算法对用户进行聚类,是两个关键环节。

图1 基于AE-MFCM的电力用户响应特性分析方法架构Fig.1 Architecture of analysis method for power user response characteristics based on AE-MFCM

1.1 用户用电数据降维

依托能源大数据中心,可收集到多类型的能源数据。日负荷曲线含有反映用户特性的丰富信息,以用户类属为基础,通过对用户日负荷曲线的特征分析确定用户用电模式。本文对电量负荷数据、温度、湿度、节假日特征数据、需求侧管理电价/激励数据作为输入进行聚类,其中每个电力用户量测数据均为每15 min采样一次的日负荷曲线。对大量用户长时间的96维日负荷数据进行聚类,传统的算法通常难以高效解决。本文首先利用AE对用电量测数据进行降维,AE结构如图2所示。

图2 应用于用电数据降维AE结构Fig.2 Structure of automatic encoder applied to power data dimensionality reduction

由图2可知,AE共分为两部分,编码部分与解码部分。在编码部分中,sk(i)表示第k个用户的第i个特征指标值 ,i=1,2,…,96;隐含层个数为h(h<96),即降维后用户数据的维数。隐含层的输出为编码后的用户数据,记为zk(j),j=1,2,…,h。sk(i)与zk(j)之间的映射可表示为

式中:f为激活函数,这里采用sigmoid函数;wij为输入层的第i个神经元与隐含层第j个神经元之间的连接权值;bj为隐含层中第j个神经元的偏置。

式中:αij为解码部分神经元i和j个之间的连接权值;βi为输出层中第i个神经元的偏置。

由解码层输出与电力用户样本数据可以得到AE的重构误差E,E可表示为

式中,N为用户总数。

通过训练调整AE连接权值与阈值,使得重构误差达到训练要求,则此时AE的隐含层输出即为所需的降维后的用户电量测数据。结合遗传算法,本文提出的权值与阈值训练方法如下。

步骤1对AE的权值与阈值进行编码并随机生成初始种群。由于权值与阈值是无约束的连续变量,因此对权值的编码采用实数编码[14]。每个个体(权值与阈值)可以表示为

式中:og个体O中的第g个基因;G为最大基于个数。基因的长度L由输入层与隐含层之间的连接权值数目以及隐含层与输出层的阈值数目h决定,即

步骤2计算个体适应度。对AE的权值与阈值进行训练的最终目标是使误差函数最小,因此个体适应度函数F可表示为

步骤3计算个体适应度找出当前种群中最好个体与最差个体,然后比较当前种群中最好个体的适应度与上代种群中最好个体的适应度,若当前最好个体优于上代最好个体,则用上代最好个体替换掉当前种群中最差个体。

步骤4对种群中个体进行算术交叉操作。设进行交叉的两父代个体为O1和O2,交叉后得到子代个体为

在早期迭代中,较大的交叉概率可以引入新的基因,进而提高全局搜索能力。但当种群进化后期时,为了避免优秀基因的丢失,应降低交叉概率,这里引入自适应交叉概率pc,即

式中:fmax为个体的最大适应度;favg为种群平均适应度;fhigh为父代中较高的适应度;pc_max、pc_min分别为最大和最小自适应交叉概率,推荐值为pc_max=0.9,pc_min=0.6。

步骤5对种群个体进行非均匀变异操作。设个体O中基因og(g=1,2,…,L)是1个被变异的基因,该基因变异后可表示为

其中

式中:omax、omin分别为历代种群中基因og的最大值与最小值;r1、r2分别为区间[0,1]内均匀分布的随机数;G、Gmax分别为当前迭代次数与最大迭代次数。

为提高收敛速度并避免早熟现象,加强全局搜索能力,本文采用自适应变异概率pm,可表示为

式中:NG为自上次进化以来至当前代为止未进化的代数;c为变异率提高系数,通常取值为0.005。

步骤6将上述遗传算法中权值与阈值作为反向传播BP(back propagation)算法权值与阈值训练的初始值,然后利用BP算法对权值与阈值进行训练,直至达到训练要求,文献[15]对BP算法有详细叙述,这里不再赘述。

1.2 基于MFCM算法的用户用电模式聚类

用户用电数据变为低维数据后,便可利用FCM对用户用电模式进行聚类。FCM算法虽然聚类效率高、聚类准确度高,被广泛应用于聚类领域,但由于FCM算法本质上是一种局部搜索寻优算法,因此该算法极易陷入局部最优解。为了弥补这一缺缺陷,本文利用遗传算法对FCM算法的聚类中心进行寻优。

MFCM算法作为1个优化问题,其优化目标函数为

式中:Jm为聚类中心数值;zn为第n个样本空间数据,即第n个用户用电数据,n=1,2,…,N;N为样本总数,即为用户总数;ωm为第m类的聚类中心,m=1,2,…,M;M为聚类数;μmn为第n个用户属于第m类的隶属度;u为模糊指数,用来控制分类矩阵的模糊程度,u∈(1,+∞),u越大,分类的模糊程度越高,通常取值为2;dmn(zn,ωm)为第n个用户用电数据与第m个聚类中心的欧式距离,其计算公式为

基于改进FCM算法对用户用电模式的聚类,主要步骤如下。

步骤1随机初始化聚类中心。

步骤2由于二进制编码搜索能力强,用于交叉及变异操作简单高效,因此这里采用二进制编码方案。每条染色体包括h×M基因链,每个基因链代表一维的用户数据。基于MFCM算法的染色体结构如图3所示。

图3 基于MFCM算法的染色体结构Fig.3 Chromosome structure based on MFCM algorithm

在图3中,len(i)为第i个基因链长度,i=1,2,…,h,其满足以下不等式:

式中,max(i)为第i维用户用电数据的最大值。

步骤3初始种群的确定。初始种群中一半个体由通过FCM算法得出,另一半个体随机产生,这保证算法既能在较好的基础上进行,又保证了种群的多样性。

步骤4计算适应度函数。遗传算法优化目标为使Jm最小,因此适应度函数为

步骤5利用精英选择方法选择种群中较好的个体。

步骤6对种群中个体进行单点交叉操作。在每个染色体基因链中设置1个交叉点,然后随机选择2个个体作为父代个体,相互交换其交叉点后面的那部分基因块,从而产生2个新的个体。

步骤7对种群中个体进行单点变异操作。随机选择变异个体,然后随机选择1个基因进行改变。

步骤8重新计算适应度函数,若达到目标则停止训练,否则转至步骤5。

步骤9按最大隶属度原则对用户进行聚类,即每个用户被归为隶属度最大的一类中。

由于用电数据受多类型的影响,经训练样本训练的网络具有一定的泛化能力,特别是市场机制的加入,会影响新输入给出合理响应。本文采用遗传算法和神经网络相结合的技术,有助于分析隐含在数据背后的规律,对于学习集以外的具有同一规律的数据,经过训练的网络也能给出合适的输出。

1.3 用户用电模式聚类评估指标

聚类评估指标是判断聚类效果的重要依据,本文引入平均类间距离与平均类内距离这两个聚类指标来衡量用户用电模式聚类效果。

(1)平均类间距离是指每个类中心到全域中心的距离的平均值。若平均类间距离越大,则说明各个类差距越大,聚类效果越好;若平均类间距离越小,则说明不同类之间的差别很小,相似度较高,聚类效果不明显。

(2)平均类内距离是指同一簇类内所有数据到该类中心的平均值。若平均类内距离越小,则说明同一类中数据距离越相近,相似性程度越高,类别凝聚力越大,聚类效果越好;若平均类内距离越大,则说明同一类中数据之间距离较远,相似性程度较低,类别凝聚力小,聚类效果不明显,有可能存在孤立点或噪声点。

2 基于分类的电力用户业务应用特性分析

在用户分类后,为了更近一步地获取每类用户的需求响应潜力,在上述分类的基础上对各类用户响应效果进行建模,以更好地挖掘用户需求响应潜力。

2.1 输入输出属性的选择

由于影响用户负荷响应的因素有很多,针对工商业不同用户,具有不同的主影响因素,大致可以分为天气因素、经济因素、电价因素、时间因素等。天气因素主要指温度、降水、风力等;经济因素主要指经济发展状况;电价因素主要指电价的变化;时间因素指工作日、双休日、节假日。不同业务类型对影响因素的分析有所不同,例如,需求侧管理电价对工作日期间用户不同时间段负荷的影响分析,模型输入为不同类型用户的特征,以及电价、气温等短期负荷的影响因素,模型的输出为用户不同时间段的用电量。

2.2 基于人工智能算法的用户响应特征分析模型

需求侧管理方案编制过程中,需求响应服务管理者对参与响应的电力用户或者级联的需求响应聚合商等参与主体的响应容量、响应开始时间、结束时间、响应类型进行分析,并在此基础上进行决策。以工业需求侧响应能力为例,在不影响生产进度及产品品质的情况下,企业负荷可通过短时间中断、转移的方式来响应系统需求。用户的错时避峰潜力需综合考虑紧急可限负荷、负荷波动率、用电容量、行业属性、高耗能标识等因素对避峰措施的影响,错峰避峰潜力的量化方法可表示为

式中:Eapp为错峰避峰潜力指数;Pal为可转移负荷;Rlf为负荷波动率;Pell为紧急可限负荷;Cap为用户容量;Gtrade为行业属性;Ge为高耗能标识;Iq为单位电量产值;Gtax为单位电量税收;Gc为错时用电单位成本;k1,k2,k3,k4,k5,k6,k7为调整系数。

用户的错峰避峰潜力中各特征因素与电价、气温共同影响用户用电量,且与用电量的关系多是非线性的,可采用神经网络进一步实现用户需求响应建模,所构建的分析模型如图4所示。

图4 基于BP神经网络的用户响应特征分析模型Fig.4 Analysis model of user response characteristics based on BP neural network

该模型输入中行业属性、负荷波动率、高耗能标识等可采用行业平均水平数据,其他因素可结合分类用户的自身历史数据获取。

3 算例分析

本文采用某城市电网2 000户工商业用户负荷数据进行实验,分析数据包括2016年1月―2019年6月的用电量测数据,以及气象信息、需求侧管理措施等非电计量数据。

3.1 用户特性分类

对用户分类首先需要确定聚类数,图5为本文算法在不同聚类数下平均类内距离与平均类间距离的指标曲线。由图5(a)可知,聚类数为4是平均类内距离曲线的1个拐点,当聚类数小于4时,随聚类数的增大,平均类内距离迅速变小;当聚类数大于4时,随聚类数的增大,平均类内距离的减小变缓慢。同时,由图5(b)可知,聚类数为4是平均类间距离曲线上一个较大的极值点,当聚类数高于4时,平均类间距离会有所降低。综上所述,当聚类数为4时,能够保证平均类内距离与平均类间距离指标均同时取得较好结果,聚类效果好。

图5 基于本文算法获得的聚类指标曲线Fig.5 Curves of clustering index obtained based on the proposed algorithm

图6为当聚类数为4时,用户典型用电模式(聚类中心)。第1类用户在08:00时负荷开始快速攀升,在09:00左右达到最高水平,并持续维持这一水平直到11:00,负荷在11:00—13:00期间有所下降,在13:00之后又恢复至先前负荷水平并维持这一水平至19:00,然后开始快速下降至最低水平。该类用户的用电峰谷期与总体负荷的用电峰谷期基本一致,根据此类用户的工作性质的,此类用户宜采用削峰的需求响应手段。第2类用户负荷为典型的双峰型负荷,第1次峰时段为06:30—08:30,第2次峰时段为19:30—21:30,其夜间谷时段与总体谷时段相同,可通过调整电价等手段促进用户在夜间时段多用电,以达到该时段负荷填谷的目的。第3类用户负荷在夜间负荷较高,而白天负荷较低,该类负荷的峰谷时段与总体峰谷时段基本上相反,是重要的需求响应资源,可通过分时电价等手段进一步提升其需求响应能力。第4类用户负荷较为平稳且负荷相对较小,这类用户需求响应能力小,可不执行需求响应。根据用户用电模式,对不同类型用户进行分类管理。

图6 用户典型日负荷曲线Fig.6 Curves of users’typical daily load

为了验证所提聚类算法的有效性,本文利用本文所提AE-MFCM聚类算法、主成分分析法PCA(principal component analysis)与FCM相结合的聚类算法(PCA-FCM)、FCM算法分别对用户进行聚类,这3类算法的聚类效果如图7所示。

图7 3种不同算法聚类效果对比Fig.7 Comparison of clustering effect among three types of algorithms

由图7可知,对于平均类间距离指标和平均类内指标,本文所提算法都明显优于其他两种算法,这说明本文所提聚类算法能够更加准确、清晰地对用户用电模式进行聚类。但是由于算法中加入了AE和用户用电数据降维,导致运行时间较FCM有所增加。但综合来看,本文所提聚类算法对海量、高维用户用电数据的聚类具有较好的实用价值。

3.2 用户需求响应特性分析

本文仅以第1类和第2类用户削峰为例,建立相应的需求响应模型。模型测试结果如图8所示。

图8 各类用户峰时段电量预测结果Fig.8 Prediction results of peak electricity consumption of different types of users

由测试结果可知,本文用户需求响应模型能较好地拟合用户实际响应情况,因此可以用该模型去预测不同电价下用户的实际响应电量。不同电价下用户响应情况如图9所示。电价对用户的用电量具有重要影响,第1类用户为电价敏感型用户,用电量随电价增加而降低,但当电价增加幅度高于80%时用电量减少较慢,主要原因是可进行削减的负荷措施已经用完,再进行需求响应则需要通过重新安排班次错时生成,边际成本增加。第2类用户为电价相对敏感型用户,在初始时刻会对部分非生产类设备(主要是空调设备)进行削减或错时用电控制,但当用电量到达0.95 p.u.时,用电削减变化趋于平缓,生产性负荷调整潜力非常小。

图9 不同电价下各类用户的用电量变化Fig.9 Changes in electricity consumption of users at different electricity prices

4 结语

本文针对在用户数量大、用户特性差异大的情况下,传统需求响应分析方法难以对用户需求响应进行建模的问题,提出了一种基于AE-MFCM与BP算法的用户需求响应特性分析方法,该方法首先利用AE良好的特征提取能力,将高维数据映射至低维;然后利用MFCM优异的大规模低维数据处理能力,对降维后的用户数据进行聚类,MFCM算法利用遗传算法对FCM算法的聚类中心进行优化,提升了FCM算法的全局搜索能力,避免了传统FCM聚类算法易陷入局部最优解的缺点。最后,基于以上分类的基础,利用BP神经网络去构建需求响应模型,该模型能够简单有效拟合激励信号与需求响应之间的复杂非线性关系。

猜你喜欢

电价权值种群
山西省发现刺五加种群分布
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
德国:电价上涨的背后逻辑
中华蜂种群急剧萎缩的生态人类学探讨
探索电价改革
基于权值动量的RBM加速学习算法研究
基于多维度特征权值动态更新的用户推荐模型研究
可再生能源电价附加的收支平衡分析
争议光伏标杆上网电价