APP下载

基于剪枝策略和密度峰值聚类的行业典型负荷曲线辨识

2021-03-06金伟超刘晟源黄荣国潘柏良林振智

电力系统自动化 2021年4期
关键词:剪枝相似性聚类

金伟超,张 旭,刘晟源,黄荣国,潘柏良,林振智

(1. 浙江大学电气工程学院,浙江省杭州市310027;2. 国网浙江省电力有限公司营销部,浙江省杭州市310007;3. 国网浙江省电力有限公司营销服务中心,浙江省杭州市311121;4. 浙江华云信息科技有限公司,浙江省杭州市310008)

0 引言

随着新一轮电力体制改革,用电量大且用电稳定的工商业用户将直接参与双边交易[1]、电力现货市场、需求侧响应并承担清洁能源配额[2],对发电调度计划、电网运行方式、电网调峰能力、新能源消纳等有重要影响。基于用电信息采集系统中积累的海量用户历史用电数据,挖掘并掌握各行业的生产特点和用电需求,不仅能够提高配电公司负荷预测精度和调度管理水平[3],而且也能够为电价制定、经济调度、需求响应[4]等提供支撑。因此,辨识各行业的典型负荷曲线对于配电网的精细化管理和售电公司的营销服务、风险管理均有重要意义。

分析某一(类)用户一定时段内的用电行为,可以获得用户的典型负荷曲线与特征。目前国内外在电力负荷曲线分类与辨识方面已有一定的研究。文献[5]采用混合高斯分布模拟用户的用电模式,并提出了基于对称化广义Kullback-Leibler(KL)散度的分布距离量度方法,有效辨识了居民用户的典型负荷模式。文献[6]提出了一种基于时间马尔可夫模型的电力负荷动态行为建模方法,并采用密度峰值快速搜索聚类(clustering by fast search and find of density peaks,CFSFDP)算法获得典型的动态负荷行为。文献[7]提出一种基于自适应k-means 的分布式聚类方法,采用两阶段聚类实现了海量用户的用电态势感知。文献[8-9]提出了用电特征的互信息量、相关系数和聚类结果的准确度、有效度等评价指标,以确定负荷曲线聚类的最优特征集和最优聚类数。与居民用户相比,工商业用户的生产需求及用电特征与其行业特点有紧密联系[10],因此需要分不同行业对负荷曲线分别进行分析。文献[11]采用向量误差修正(vector error correction,VEC)理论识别不同行业之间电力需求的关联关系,并在此基础上提出了一种新型的中长期负荷预测方法,避免了用电结构突变对负荷预测带来的不良影响。文献[12]构建了人口、气象、经济等影响因素与不同行业的关联度矩阵,并针对不同行业构建了基于深度信念网络的中长期负荷预测模型。

综上所述,现有研究通常采用聚类等方法对用户用电数据进行挖掘分析,并辨识用户的典型负荷曲线。然而,现有研究采用的欧氏距离或特征降维方法对负荷曲线之间的形态相似性量度不够准确。此外,当前行业用电分析的研究与应用中[10-12],均未考虑电网公司营销管理系统中存在的档案行业信息错误对分析效果的影响。鉴于此,本文提出一种基于剪枝策略和密度峰值聚类的行业典型负荷曲线辨识方法。该方法将快速动态时间扭曲(fast dynamic time warping,FDTW)距离作为电力负荷曲线相似性指标以准确量度负荷形态相似性,采用加权密度峰值聚类算法和重心平均(barycenter averaging,BA)算法对行业负荷进行准确分类并辨识具有共同形态特征的典型负荷曲线。

1 基于剪枝策略和FDTW 距离的负荷曲线相似性量度

1.1 负荷曲线形态相似性量度理论

基于电力负荷曲线的形态进行聚类是实现典型负荷曲线辨识的重要手段[13]。在负荷聚类分析中,必须选取合适的负荷形态相似性量度才能得到合理的结果。在比较时间序列时,距离相似性量度方法需要能识别其多种变化才有实际意义[14]。时间序列常见的变化有:尺度变化,即时间序列在尺度(缩放)中存在差异;位移变化,即时间序列具有相似的形态,单相位(时刻)具有一定偏差;噪声变化,即时间序列在采集中受到不同程度噪声干扰。

在电力负荷曲线相似性量度中,尺度变化和位移变化是常见的。例如,同一地区两家相同行业的企业,可能仅在工作时间存在一定的偏差。同一用户的日负荷也容易受天气、交通等因素影响,在短时间内也会发生一定的位移变化。尺度变化则主要由负荷数据采集缺失或者采集频率不同引起。当前用电信息采集系统的采集精度和采集成功率均已达到较高水平,解决了电力负荷曲线存在的尺度变化问题。位移变化由于电力用户自身用电的随机性和不同用户的差异性始终存在,已成为电力负荷曲线相似性量度的主要难点[5]。

1.2 电力负荷曲线的FDTW 距离

量度电力负荷曲线、语音信号等时间序列的相似性有很多种方法,常见量度方法有闵可夫斯基距离[3](包括欧氏距离、曼哈顿距离等)、相关系数[3]、Kullback-Leibler(KL)散度[5]等。闵可夫斯基距离和相关系数对位移变化和尺度变化较为敏感;KL散度是2 个概率分布间差异的非对称量度距离,对位移变化和尺度变化不敏感,但是在对称化中会损失部分精度。为了解决电力负荷曲线存在的位移变化、尺度变化等问题,本文采用FDTW[15]距离量度电力负荷曲线的相似性。动态时间扭曲(dynamic time warping,DTW)通过对时间序列进行延伸和缩短,来计算2 个时间序列之间的相似性,已被应用于电力系统的故障检测[16]、负荷辨识[17]、误差监测[18]等研究。FDTW 是对DTW 的改进,通过约束搜索空间在提高计算效率的同时避免了时间轴过度扭曲引起的量度异常。下面介绍DTW 距离以及适用于负荷曲线形态相似性量度的FDTW 算法。

假设2 个电力负荷曲线A 和B,相同采集时段内的采集点数分别为m 和n,即A=[a1,a2,…,am]和B=[b1,b2,…,bn]。首先构建大小为m×n 的代价矩阵D(m,n),元素d(ai,bj)表示电力负荷曲线A 在第i 个采集点ai与负荷曲线B 在第j 个采集点bj的功率差异,一般采用欧氏距离衡量。DTW 可以归结为寻找一条从代价矩阵D 的起点(1,1)到终点(m,n)的最佳路径,使得路径通过的矩阵点累积距离最小。定义路径W=[w1,w2,…,wK]且满足边界性、连续性和单调性[16]约束,则最优路径的目标为累积距离DDTW(A,B)最小,即

式中:d(wk)为wk中从ai到bj的距离;K 为路径W 的长度。

在寻找路径的过程中,借助动态规划的思想,使用迭代的方法计算,定义一个累积距离S(i,j),并从边界点(1,1)开始匹配这2 个负荷曲线。边界起点为S(1,1)=d(a1,b1),则累积距离可表示为:

FDTW 的实现方法主要有分段近似计算和空间约束2 种方法。其中分段近似计算通过牺牲DTW 精确度以提高计算效率,空间约束则通过限制代价矩阵中可用单元的数量以减少DTW 搜索路径。与其他一般的时间序列相比,电力负荷数据的采集时刻是对齐的,其位移变化主要由电力用户自身用电的随机性和同类型用户的微小差异引起,变化值较小。因此,采用约束搜索空间不仅更加合理,还可以避免2 种完全不同的负荷曲线在DTW 匹配中的过度扭曲。

FDTW 常见的空间约束有Itakura 平行四边形约束和Sakoe-Chiba 带状约束[19],与Itakura 平行四边形约束相比,Sakoe-Chiba 带状约束适用于任意位置发生位移变化的时间序列匹配。本文选取的电力负荷数据采样间隔为15 min,采集长度均为1 d,即m=n=96。由于负荷的位移变化具有不确定性,无法确定位移变化发生的时段,因此本文选择Sakoe-Chiba 带状约束,则DFDTW的表达式为:

式中:τ 为路径空间约束参数。

Sakoe-Chiba 带状约束下FDTW 路径空间如图1 所示。

图1 Sakoe-Chiba 带状约束下FDTW 路径空间Fig.1 FDTW path space under Sakoe-Chiba band constraint

通过约束FDTW 路径空间,不仅避免了负荷曲线匹配过度扭曲,还减小了路径的搜索空间(图1 绿色部分),使计算复杂度从O(m2)减少为O(τm),其中O(·)为复杂度函数,提高了FDTW 的计算效率。

1.3 基于剪枝策略的负荷曲线相似性量度

电力负荷曲线之间的形态相似性准确量度是负荷曲线准确分类和辨识的前提。位移变化主要存在于形态相似的电力负荷曲线之间,而形态差异较大的负荷曲线则存在用电习惯的区别。为了更好地衡量负荷之间位移变化后的相似性并提高其计算效率,本文提出一种基于剪枝策略和FDTW 距离的负荷曲线相似性量度方法。其中剪枝策略通过选取FDTW 距离的上下界来估计FDTW 距离的范围值,搜索相似的负荷曲线并采用FDTW 距离衡量其形态相似性以避免位移变化的影响;对差异较大的负荷曲线之间的FDTW 距离则进行剪枝[20],即不进行进一步的FDTW 距离求解,从而在保证负荷聚类距离计算精度的基础上提高相似性量度距离计算效率。基于剪枝策略和FDTW 距离的负荷曲线相似性量度矩阵的计算流程如下。

步骤1:对于某一行业的用户负荷数据集X∈RM×N,M 表示分析时段采集分析的负荷样本数,N表示一个分析时段内负荷的采样点数,本文取N=96,将用户负荷曲线样本X=[X1,X2,…,XM]作为输入,计算其上、下界距离矩阵DUB和DLB,且上、下界 距 离 满 足 DLB(Xi,Xj)

步骤2:对于负荷曲线聚类待求取剪枝后的距离矩阵D,其距离搜索的剪枝判据如下。

判据1:DLB(Xi,Xj)>dc或DUB(Xi,Xj)

判据2:DUB(Xi,Xi(k))

判据1 和2 分别适用于基于dc和基于距离排序的聚类算法。当满足判据1 或2 时,可以对负荷样本Xi和Xj之间的FDTW 距离进行剪枝,即令D(Xi,Xj)=DUB(Xi,Xj),否 则D(Xi,Xj)=DFDTW(Xi,Xj)。

采用以上FDTW 距离搜索的剪枝策略,可以基于电力负荷样本集的上、下界距离矩阵确定负荷曲线聚类所需的FDTW 距离集。剪枝后的FDTW 距离计算复杂度为βO(DFDTW)+O(DLB+DUB),其中β为剪枝保留的比例。因此剪枝策略提高FDTW 距离计算效率的关键是选取能准确估计FDTW 距离范围值且计算复杂度低的上、下界距离。目前已有多种计算FDTW 距离下界的算法,其中LB_Keogh算法是目前最准确的FDTW 距离下界算法,满足DLB(A,B)

由于FDTW 距离是基于欧氏距离矩阵动态规划所得最小路径的距离,故满足DLB(A,B)

本文采用的CFSFDP 算法是一种密度聚类方法。该方法基于截断距离dc判断样本的邻域密度,故可以采用基于剪枝策略的FDTW 距离矩阵进行聚类,在保证聚类准确性的同时提高聚类效率。

2 基于加权密度峰值聚类的行业典型负荷曲线辨识

与居民用户的用电习惯相比,工商业用户的用电特征与其行业特点有紧密联系,其档案的行业信息正确率会影响该行业典型负荷曲线的辨识效果。因此,本文在电网公司行业分类信息的基础上,采用加权CFSFDP[22]算法对各行业的负荷曲线进一步分类,并采用密度异常指标识别该行业用户中存在的档案信息错误与异常用电。

CFSFDP 是一种基于密度的聚类算法,其核心思想是认为聚类簇的中心由一些局部密度比较低的点围绕,并且这些点与其他有高局部密度的点距离都比较大。该算法分别计算了局部密度ρ 和密度相对距离δ 来确定聚类中心。对于某一行业的用户负荷数据集X=[X1,X2,…,XM],任一负荷曲线样本Xi的局部密度ρi和密度相对距离δi的表达式分别为:

式中:χ(x)为距离截断函数,用于判断其他样本是否在Xi的邻域内;密度相对距离δi为样本Xi与密度更大的其他样本间的最小距离,若样本Xi的局部密度为最大,则密度相对距离取δi=max(D(Xi,Xj));j=1,2,…,M。

与居民用户负荷相比,同一行业的工商业用户由于企业规模、产值的差异,在日用电量上的差异很大。日用电量数十千瓦时和数十兆瓦时的工商业用户对于该行业生产的代表程度不同,因此在聚类中有必要基于用户的用电量对其负荷曲线赋予权重。工商业用户的负荷对其行业用电的代表程度主要体现在用电量上,但是直接以电量作为聚类权重会导致聚类结果完全以大型用户为中心。考虑一个行业内的用户规模及用电量通常呈对数正态分布[23],其电量经过对数变换后满足正态分布,故可认为是一种较为合理的权重赋值分布[24]。因此本文对行业内用户负荷样本的日用电量进行对数变换并归一化,将其作为负荷曲线聚类分析的权重。负荷曲线Xi的权重ωi表达式为:

式中:Ei为负荷曲线Xi对应的日用电量;E=[E1,E2,…,EM]为该行业的M 条负荷曲线对应的日用电量向量。

在获得该行业内各用户负荷曲线的聚类权重后,本文对CFSDFP 算法进行相应的改进[7],改进后的加权局部密度可表示为:

加权CFSFDP 算法根据样本集原始空间距离分布确定加权局部密度ρW和密度相对距离δ,如图2所示,其中样本的大小表示对应的权重,ζc为异常指标阈值。

图2 加权CFSFDP 指标示意图Fig.2 Schematic diagram of weighted CFSFDP index

由图2(a)可知,在原始的样本空间分布中,样本10、14 处于高密度簇的中心且具有较高的加权权重,而样本4、11 和20 则属于离群点。根据样本加权局部密度ρW和密度相对距离δ 可以快速确定聚类中心和离群点并完成聚类。图2(b)中具有高样本加权局部密度ρW和高密度相对距离δ 的负荷样本意味着处于某一类负荷曲线簇的中心且具有较大的用电量,因此可以作为负荷曲线聚类中心;图2(b)中具有低样本加权局部密度ρW和高密度相对距离δ 的负荷样本意味着用电量较少或用电特征与该行业其他用户负荷差异均较大,可能存在行业档案信息错误、异常用电、特殊生产等情况,故将其视为离群点。为了定量确定行业中的离群点负荷样本,本文采用密度异常指数[25]衡量样本的离群程度,即

ζi越大,则认为该用户负荷的用电异常程度越高,存在行业信息错误、异常用电等情况的可能性越大,故将该部分用户负荷曲线作为离群点并排除在负荷聚类划分之外。其余样本点则划分到离它最近的簇中心所在的簇。

基于形态相似性距离对负荷曲线样本集进行聚类划分后,其典型负荷曲线可以用来描述该类负荷样本集合的整体形态特征。传统k-means 方法取每一类负荷曲线的算术平均值作为典型负荷曲线,但是该方法辨识的典型负荷曲线会因为位移变化损失关键特征。因此,本文采用BA[26]算法辨识典型负荷曲线。BA 算法以最小化典型负荷曲线与簇内样本的FDTW 距离之和为目标,其表达式为:

综上所述,基于剪枝策略和加权CFSFDP 的行业典型负荷曲线辨识流程如附录B 图B1 所示。

3 算例分析

本文以浙江省某市的金属加工机械制造行业为例,选取该行业200 个用户于2019 年4 月9 至13 日的共计1 000 条负荷曲线作为分析样本,以验证本文所提算法的有效性。

3.1 负荷曲线形态相似性量度距离

选取如图3 所示的金属加工机械制造行业3 个用户的日负荷曲线作为研究对象,分析不同负荷相似度量度距离的准确性。图3 中用户1 和用户2 具有同类型的日间双峰型负荷,用户3 则在夜间(18:00—21:00)依然有较大的用电负荷,三者的欧氏距离、DTW 距离以及Sakoe-Chiba 约束的FDTW距离如表1 所示。

图3 金属加工机械制造行业的3 条负荷曲线Fig.3 Three power load curves of metal processing and machinery manufacturing industry

从负荷分类的角度来说,用户1 和用户2 的用电习惯更加接近,两者仅在用电时间上相差约40 min;相比之下,用户1、2 和用户3 在夜间的3 h 有明显的用电差异。欧氏距离是负荷曲线各时刻功率差异的平方和,因此会将用户1 负荷和用户2 负荷在位移变化上的差异进一步放大,导致其欧氏距离值大于用户1 负荷和用户3 负荷的欧氏距离。DTW会将负荷曲线的时间轴匹配过度扭曲,造成3 个用户负荷之间的距离值均过小。FDTW 算法则通过分析相似负荷曲线之间的位移变化,辨识出用户1负荷和用户2 负荷的相似性距离值为最小,且用户2负荷和用户3 负荷之间距离值最大,这与用电习惯差异分析结果更加一致;同时FDTW 距离通过Sakoe-Chiba 约束避免了DTW 时间轴过度扭曲的问题。因此,相比欧氏距离和DTW 距离,本文所提的FDTW 距离能更加准确地衡量3 位用户之间的负荷曲线差异。

表1 负荷曲线之间的距离值Table 1 Distance values between load curves

考虑到FDTW 距离的计算复杂度较高,本文采用基于上、下界的FDTW 距离搜索剪枝策略,求解得到金属加工机械制造行业1 000 个日负荷样本两两之间剪枝后的距离d,结果如图4 所示,其中粉色点为剪枝后保留的FDTW 距离,共计28 221 个,各距离计算所需时长如表2 所示。

图4 金属加工机械制造行业负荷样本曲线的不同距离值Fig.4 Different distance values of power load sample curves of metal processing and machinery manufacturing industry

表2 不同方法计算全部样本距离值所需的时间Table 2 Time required for calculating distance values of all samples by different methods

由表2 可得,欧氏距离计算效率最快,但是由表1 可知欧氏距离无法量度位移变化后的负荷曲线相似性;FDTW 距离通过Sakoe-Chiba 约束限制了FDTW 路径的搜索空间,因此计算效率高于DTW算法。本文选取的上、下界距离严格满足DLB

从表2 可以看出:由于FDTW 上、下界距离计算复杂度远低于FDTW 距离,因此剪枝FDTW 距离集的计算时长仍明显低于未剪枝的FDTW 距离计算时长。由此可得,本文所提FDTW 距离搜索的剪枝策略可以在保留负荷曲线聚类所需FDTW 距离的前提下,避免不相似负荷的相似性距离精确量度带来的计算成本。

3.2 行业典型负荷曲线辨识及对比

金属加工机械制造行业负荷曲线样本集的日电量分布如附录B 图B2 所示,经过对数变换后可以得到接近正态分布的负荷曲线聚类权重。基于金属加工机械制造行业负荷样本集的权重和剪枝后的FDTW 距离集,对负荷样本集进行聚类分析以辨识该行业的典型负荷曲线。首先计算负荷样本的ρW和δ 分布,如图5(a)所示。由图5(a)可得,点1 至5同时具有较高ρW和δ,故选取为聚类中心;设定异常指标阈值ζc=2,则图5(a)中红色虚线左侧的样本被判定为离群点,不参与进一步的聚类;其余样本点则根据最近的聚类中心划入同一簇。为了进一步分析聚类簇的分布情况及离群点相对位置,本文采用非经典多维缩放(non-classical multi-dimensional scaling,NCMDS)[27]将聚类结果分布从原始距离空间映射至二维平面,并使映射前后各样本点在高维和二维特征空间中的分布位置及相对距离保持不变,其结果如图5(b)所示。图5(b)中,X、Y 轴为中心化的正交二维坐标轴,样本点在该坐标系中的欧氏距离可认为是原始负荷曲线之间的FDTW 距离,黑色点表示离群点,其余颜色表示不同的簇,点的大小表示样本负荷权重,簇1 至5 具体对应的5 类的典型负荷曲线如附录B 图B3 所示。

由附录B 图B3 可得,金属加工机械制造行业的负荷主要可以分为5 类,其中,第1 类为加班型日间负荷;第2 类为典型的日间双峰型负荷;第3 类为平稳型负荷;第4 类为较为平稳的日间双峰型负荷;第5 类为避峰型负荷。第1 类和第2 类的负荷类型差异较小,第3 类和第4 类的负荷类型差异也较小,这与图5(b)中簇1 和簇2 样本分布相邻、簇3 和簇4 的样本分布相邻的现象是一致的。由图B3 可得,BA算法在FDTW 距离的基础上,所辨识的典型负荷曲线中心的爬坡斜率、峰谷差等关键特征均与原始负荷簇相近;而算数平均方法由于无法处理负荷簇的位移变化,导致所辨识的典型负荷曲线峰谷差减小、爬坡斜率平缓及其他关键特征损失。

图5 金属加工机械制造行业CFSFDP 聚类结果Fig.5 CFSFDP results of metal processing and machinery manufacturing industry

分别采用本文算法、自适应k-means 算法[28]和基于密度的噪声应用空间聚类(density-based spatial clustering of application with noise,DBSCAN)算法[29]对金属加工机械制造行业负荷样本集进行聚类分析和对比,并采用DB 和Calinski-Harabas(CH)指标[4]衡量不同负荷相似性量度距离和聚类算法对负荷曲线分类的效果。DB 指数是衡量聚类性能常见指标,为分类簇内的平均距离和簇间的最小距离之比,其值越小越好;CH 指标通过簇内离差矩阵量度紧密度,簇间离差矩阵量度分离度,其值越大,表明簇内样本越紧密,簇间区别越大,则聚类效果越好。DB 和CH 指标值的表达式见附录C,其中CH 指标基于用电负荷的5 个形态特征指标,用于衡量聚类算法对不同需求响应潜力的负荷分类效果[4]。不同算法的最优聚类数(由DB 确定的)及其聚类结果的性能指标和计算时长如表3 所示,其中k-means 聚类不是密度聚类,因此采用未剪枝的FDTW 距离。

表3 不同负荷曲线聚类算法性能指标及计算时长Table 3 Indicator values and calculation time of different power load curve clustering algorithms

由表3 可得,本文所提方法聚类结果的DB 值和CH 值分别为1.385 和2 119,优于其他聚类算法的指标。基于FDTW 距离的k-means 算法的DB 和CH 指标与本文方法接近,但是k-means 算法由于迭代不稳定,需要多次聚类才可以收敛获得较优的聚类结果,且无法应用剪枝策略,因此计算效率较低。DBSCAN 算法计算效率略快于CFSFDP 算法,其聚类结果的CH 指标较低,说明该方法聚类所得负荷曲线簇的簇内形态特征相似性较低。由此可得,本文采用的加权CFSFDP 算法聚类性能优于其他算法,可以基于FDTW 距离对电力负荷曲线进行快速有效分类。基于FDTW 距离的3 种聚类分析结果的CH 指标值分别为2 119、2 039 和683,分别优于采用欧氏距离和DTW 距离的相同聚类算法结果的CH 值,说明FDTW 可以更好地辨识不同负荷类型形态上的差异,从而使分类后的负荷曲线簇在日负载率、日峰谷差率、峰平谷时段负载率等特征具有更高的簇内相似性和簇间差异性。

3.3 基于典型负荷辨识的档案错误排查应用

选取浙江省某市其他重要行业的用户样本并采用本文方法进行分析。以互联网接入及相关服务、棉纺织及印染精加工等行业为例,各行业负荷样本的ρ 和δ 分布及聚类结果分布如附录D 图D1 所示,其典型负荷曲线如附录D 图D2 至图D6 所示。为了核实CFSFDP 算法识别的离群点中是否存在行业档案错误,该市供电公司于2019 年7 月对日负荷曲线多次被识别为离群点的工商业用户进行了现场排查,具体的用户行业信息和排查统计结果如附录D表D1 和表4 所示。

表4 各行业离群点用户档案信息排查结果Table 4 Investigation results of users’profile information of outliers in various industries

由表4 排查结果可以看出,互联网接入及相关服务、棉纺织及印染精加工、金属加工机械制造这3 个行业中识别出较多的档案行业信息错误样本。互联网接入及相关服务行业的用电负荷类型比较单一,以平稳型负荷为主,当其他行业非平稳型负荷的样本误标记为互联网接入及相关服务行业时,采用本方法可有效识别出来。本文所提方法通过密度异常指标识别档案行业信息错误的工商业用户,在提高行业典型负荷曲线辨识准确性的同时,也可以作为供电公司进行工商业用户行业信息校验的参考,从而节省营销系统档案信息管理与更新所需的人力成本。

4 结语

本文提出一种基于剪枝策略和密度峰值聚类的行业典型负荷曲线辨识方法。FDTW 距离解决了常规距离量度中的负荷位移变化敏感问题,实现对不同负荷曲线形态相似性的精准量度;基于上、下界的FDTW 距离搜索的剪枝策略,在满足负荷曲线聚类精度的前提下,提高了聚类的准确性与效率;CFSFDP 算法和BA 算法可以实现对行业负荷准确分类并辨识具有共同形态特征的行业典型负荷曲线。

浙江省某市部分行业的负荷样本分析表明,本文方法可以在准确量度负荷曲线形态相似性的基础上,对营销管理系统存在的部分行业信息错误进行识别,实现对行业典型负荷曲线的准确辨识,也能为供电公司营销部门纠正工商业用户行业信息提供参考。本文所述方法的未来研究包括利用所得行业典型负荷曲线指导负荷预测、用能优化、电价设计等应用,并研究基于应用场景需求的自适应或可控聚类算法,以期满足工程差异化需求的同时提高算法准确率。

附录见本刊网络版(http://www.aeps-info.com/aeps/ch/index.aspx),扫英文摘要后二维码可以阅读网络全文。

猜你喜欢

剪枝相似性聚类
一类上三角算子矩阵的相似性与酉相似性
人到晚年宜“剪枝”
基于YOLOv4-Tiny模型剪枝算法
浅析当代中西方绘画的相似性
基于激活-熵的分层迭代剪枝策略的CNN模型压缩
基于K-means聚类的车-地无线通信场强研究
基于高斯混合聚类的阵列干涉SAR三维成像
剪枝
低渗透黏土中氯离子弥散作用离心模拟相似性
一种层次初始的聚类个数自适应的聚类方法研究