APP下载

基于二重分解的行业用户短期日电量预测建模

2023-01-06黄国权严玉婷李晖张勇军

南方电网技术 2022年11期
关键词:电量分量气温

黄国权,严玉婷,李晖,张勇军

(1.华南理工大学电力学院,广州 510641;2.深圳供电局有限公司,广东 深圳 518001;3.广东电网有限责任公司电力科学研究院,广州 510080)

0 引言

随着电力市场化改革[1-2]不断推进,电力现货交易市场建设已初具雏形,在此模式下,超短期负荷功率预测无法支撑电量交易计划[3]。同时,《电力中长期交易基本规则》[4]指出,电力中长期交易包括“年、季、月、多日”等不同时间尺度的电量交易,相较于早期的暂定版补充了月内(多日)交易,说明市场交易周期的逐渐缩短是趋势所向。对此,获悉用户日电量需求可以更加灵活指导精细时间尺度下的交易行为。

另一方面,为响应建设现代供电服务体系的新要求,近年来部分地区供电局专门设立了高端客户经理服务于高用能需求的工商业等行业大用户[5]。因而预知大用户短期电量为供电局提前向其主动服务提供支持,提升大用户的用电体验感;同时也能作为增值服务项目丰富供电局的创收手段。

此外,电量是企业生产经营状态的间接反映,能够辅助掌握企业短期内的生产动态。相比于居民等用电随机性较强的小用户,工商业企业等行业大用户等对电能的依赖性更加显著,具有用能需求大、用电规律明显、用电趋势平稳等特点,也是未来电力现货市场需求侧的主体用户。

综上所述,针对供电局重点关注的行业大用户,预测其短期电量尤为关键,且其用电特征更易于捕捉,有利于实现精准预测。

目前针对短期电力负荷预测的研究按思路区别主要分为时间序列预测[6-10]和多因素预测[11-17]。

时间序列预测模型从自身历史数据出发,结合传统时序建模法[6]或时频域分解[7-8]及周期分解[9-10]等时序分解法进行预测。文献[6]采用ARIMA模型对中国一次能源消费进行拟合分析,但精度不高。文献[7]将经验模态分解(empirical mode decomposition,EMD)直接应用于原始负荷上,解决预测面临的负荷数据随机性问题。文献[8]提出结合集合经验模态分解(ensemble empirical mode decomposition,EEMD)、多元回归和长短期记忆网络(long short-term memory networks,LSTM)对短期负荷进行预测,降低负荷复杂度后再分析处理。文献[9]采用整合移动平均自回归模型对时间序列数据进行周期分解,并基于灰色预测模型预测电量趋势。文献[10]基于局部加权回归对配网短期负荷进行周期趋势分解,并利用LSTM对各分量精准预测,提高模型的鲁棒性和泛化能力。

多因素预测模型探讨的是电力数据与其各种影响因素间的关联特性,并以此借由关联因素来对电力负荷进行回归预测。常纳入考虑的因素包括温湿度等气象因素[11-13]、GDP等经济因素[14-15]和日类型等时间因素[16-17]等等,其中在短期负荷预测更多考虑气象因素和时间因素。

针对行业用户短期电量预测问题,一方面,行业属性、生产经营行为模式、发展计划等等差异使得用户的用能特性的差异也因此日益明显,而不同于地区负荷预测能够对差异化的用能特性作为整体性看待,对单个行业用户的电量预测需要有针对性地区别处理;另一方面,其主要用能设备可能包含空调、生产设备、办公照明设备等等,因此行业用户的用电特性与气温、工作特性等息息相关,但现有分解预测模型均是采用时频域分解或是周期分解的单一分解模型,通过经验模态分解或小波分解等时频域分解可能会造成对原始特征的拆解,掩盖了原有规律,且所得分量并没有物理指代意义,而常用的周期分解仅能得到固定的周期分量,无法反映长时间的工作安排变化,也无法更多地考虑其余因素如气温的影响。

为此,本文提出一种基于特征辨识的行业用户短期日电量二重分解预测方法,针对行业用户这一细化对象,首先通过特征辨识省去定制分解框架时的人工干预判断过程;其次结合其用电特征对用户电量进行二重分解,得到与用电特征相关的分量;接着依据分量特点选用LSTM/加权最小二乘支持向量机(weighted least squares support vector machine,WLSSVM)/卷积神经网络(convolutional neural network,CNN)进行组合预测;最后对节假日电量进行调整得到最终预测值。

1 行业用户用电特征辨识

不同行业用户的工作安排、放假调休、用能设备等等差异会表现出不同的用电特征,准确辨识用户所具特征有利于精准预测。本节利用统计学知识辨识行业用户的用电特征,为后续定制分解框架时省去人工干预判断过程做准备工作。

1.1 日电量七日周期性辨识

与一般负荷不同,多数行业用户由于存在工作特性会表现出明显的工作日效应,即工作日与周末明显的电量区别,鉴别负荷是否具有此种规律有利于在分解框架中将其纳入考虑。本文采用卡诺瓦-汉森检验[18]来判断时间序列是否含确定性周期性。

假设时间序列不含确定性的周期性,利用卡方分布在90%的显著性水平下检验上述统计量,即假设成立的可能值P≤0.1则拒绝原假设,时间序列含确定性的周期性。

1.2 日电量与气温相关性辨识

行业用户用电量水平较高,而其中空调等降温负荷已成为炎热地区夏季负荷创新高的主要影响因素之一。由于电量受一周工作日效应影响存在着短期周期性波动,而气温不具有短期内的规律波动,因此为避免短期日电量周期变化的影响,计算行业负荷日电量与日均气温间的相邻7 d均值序列相关性如下。

式中:、分别为日均气温和日电量的相邻7 d均值序列;cov(·)为协方差;σ(⋅)为标准差。

取经验值r(aˉ,yˉ)>0.6时则认为行业负荷日电量受日均气温影响程度较大。

1.3 日电量节假日影响辨识

部分行业用户的日电量在法定节假日等相比于平日具有较大差异。不同节假日假期受重视程度也不尽相同,因此对日电量的影响程度也不一样。

假设正常情况下行业用户工作日和休息日等两种日类型的电量分别服从正态分布N(μ1,)和N(μ2,),即认为在一段时间内电量在某一期望值附近随机波动。以节假日所在前后各四周的非假期工作日或休息日的电量样本分别对μ1、σ1和μ2、σ2进行估计。

判断该用户受节假日影响程度可通过基于第i个节假日所处日类型在正态分布N(μ,σ2)求取正常工作情况下降到该节假日电量的概率P为:

当P<0.1时,表明行业用户受节假日影响程度较大。

2 行业用户日电量二重分解

针对不同特征耦合下的电量序列,在可参考数据量较少的情况下,对其直接预测难以达到较高精度。为此,本文提出一种二重分解模型,先利用基于回归的季节趋势分解方法(seasonal-trend decomposition procedure based on regression,STR)对行业用户电量进行一次周期性分解,在此基础上,对其余项再进行二次EEMD分解。结合周期分解和时频域分解的二重分解能够更加细致地对行业用户用电特征的相关分量进行解耦预测。

2.1 一次STR分解

传统周期分解算法仅能将序列分解为趋势项、固定的周期项和余项3部分分量,不能灵活处理行业用户的差异化用电特征。而STR[19]是目前通用的周期性数据分解框架,能够应用于含复杂季节性的实际问题。它能在周期分解过程中引入数据的复杂周期性,适应不同工作强度导致周期分量幅度存在差异的问题,同时还可以将协变量纳入分解模型中,便于考虑气温等相关因素。

利用STR算法将行业客户日电量时间序列y t分解为如下几个可选的加法分量。

式中:L t为平滑趋势项;S k(t),t为带有星期索引的一个二维的季节项;vec(·)表示矩阵拉直运算;A t为反映气温影响分量;R t为余项。

由于STR分解框架的分量选择过程需要人工干预判断,而行业用户数较多,若对每位用户特征进行一一辨识则需要大量的人工干预过程,不利于在工程中应用。因此,如表1所示,本文根据第1节的特征辨识结果决定式(3)中STR分解框架的分量数量,即周期性强则在分解框架中加入周期分量、气温相关性强则加入气温协变量,由此省去定制分解框架时的人工干预过程,实现用户特征辨识和STR分解框架定制的批量处理,据此进行短期电量二重分解预测,有助于在工程上应用。

表1 STR分解框架Tab.1 STR decomposition framework

STR基于如下约束假设。

1)R t∈N(0,);

2)L t平滑,Δ2L t∈N(0,),其中,Δ2为双差分算子,Δ2L t=L t-2L t-1+L t-2;

3)每个周期内的周期项总和为0;

4)每个周期项Sκ(t),t也随时间平滑变化,因此每个周期内的周期项有其中:

式中:m为周期长度;I m为m×m维的单位矩阵;1 m为m×m维的全一矩阵。

5)At具有时变但非周期性,A t=τt a t,其中τt为气温协变量a t的变系数;

6)L t、Sκ(t),t、A t和R t间彼此独立。

结合约束条件计算L t、Sκ(t),t、A t、y t的最大后验估计可以得到:

式中:s、l、a、y分别为Sκ(t),t、L t、A t、y t的观测值;Dtt、Dss和Dss分别为二维季节项分别沿时间、时间-季节和季节维度二阶差分的矩阵;λtt、λst、λss、λl为与σR、σS、σL相关的待选系数参数;D l为趋势项二阶差分矩阵。

进而将式(1)转化为式(6)所示线性回归模型。

其中

式中:为矩阵Sκ(t),t缺少最后一行的矩阵,并存在矩阵Q使得

在上述约束下基于余项最小目标利用最小二乘法优化求解各分量值。

2.2 二次EEMD分解

余项受其余诸多的不可知因素共同作用,表现出复杂的非线性随机波动。EEMD能自适应地将数据序列分解为有限个频率下的本征模态分量(intrinsic mode fuctions,IMF),可以处理余项分量的复杂随机性情况,且不容易出现模态混叠现象[20],利用EEMD对余项分量进行二次分解。EEMD分解步骤如下:

1)在余项原始序列上添加满足正态分布的白噪声n i(t)满足:

2)对所得含噪声的信号x i(t)分别进行常规经验模态分解,得到各自IMF和满足:

3)重复上述步骤I次,每次加入不同幅值的白噪声,将上述对应的IMF进行集合平均运算,得到EEMD分解后最终的IMF满足:

3 短期日电量组合预测模型

上述分解所得各分量特点各异,以单一模型预测各分量具有局限性,无法应对不同分量的特点进行准确预测,应采用不同预测方法与之相适应。因此本文结合各分量特点选用LSTM、WLSSVM和CNN搭建组合预测模型来配合二重分解实现短期日电量的精准预测。

3.1 趋势分量预测

行业用户日电量的趋势分量描述了用户长期的用电水平走势,具有很强的历史延续性,采用LSTM能够处理长时间序列的长期依赖问题,对趋势分量的历史变化信息捕捉学习,进而预测未来动向[21]。

LSTM主要由记忆存储单元状态、遗忘门、输入门以及输出门构成,该方法应用较广,具体过程本文不再赘述。

3.2 周期分量预测

相比于其他分量,周期分量具有极强的规律性,且在一段时间内,周期分量具有相对稳定性。图1所示为某用户2020年12月份周期分量示例。

图1 周期分量预测示意Fig.1 Diagram of seasonalcomponent prediction

图1显示,用户周期分量近4周波形较为相似,且幅值变化具有一定的趋势性。因此,可结合周期分量长期的幅度走势和短期内的波形相似性对其进行预测。由此具体说明预测过程如下。

1)计算周期分量历史值的上下包络线;

2)结合LSTM预测包络线未来两周走势;

3)对近4周周期分量曲线作K-Means聚类[22],提取近期典型周期分量,即蓝虚线;

4)将聚类结果缩放至上下包络线范围内作为下一周预测结果,如图1蓝虚线为聚类结果,将其缩放至与上下包络线相切,即黄实线结果;

5)最后重复3)—4)滚动预测下下周的周期分量结果。

3.3 气温协变量预测

气温协变量A t与日均气温具有较强的协变性。对此,结合前一天值A i-1与日均气温a i的标准化数值,并基于WLSSVM[23]对A t进行预测,WLSSVM具体过程本文不再赘述。

3.4 余项IMF预测

对于余项各部分IMF的预测,低频分量同样具有较强的历史延续性,采用LSTM进行预测;而其中的高频分量,虽然仍具有较强的随机波动性,但相较于原来的余项分量,其波动幅度大大减小,采用捕捉短期局部依赖关系的CNN算法结合近期数据进行预测[24],CNN具体过程本文不再赘述。

3.5 最终预测值

综上,上述各分量的叠加值即为总日电量的预测值。此外,预测节假日影响强相关的用户的假期电量,将预测值作为正常情况下的期望值,然后计算节假日当天用户电量在非假期出现的概率,结合两者可在叠加值基础上对节假日期间的预测值进行调整,具体为:

1)将节假日电量预测叠加值为归一化μe,结合1.3节σ1或σ2构成正态分布N(μe,);

2)计算在标准正态分布条件下满足P(y′≤)=P的值;

3)对节假日电量预测叠加值调整,即

式中:ysol为节假日电量预测调整值;y′sol为节假日电量预测值;Iun(·)为反归一化函数。

4 算例分析

本文采用某市10位行业用户2019年12月1日—2021年2月1日的日电量数据集作为算例验证本文方法的实用性。

4.1 用电特征辨识结果

4.1.1 七日周期性

七日周期性检验结果如表2所示。

表2 七日周期性检验结果Tab.2 Result of seasonaltest with a seven-day-cycle

由表2可知,在90%的显著性水平下(即P<0.1),用户1、3、5、7、8、9具有平稳的周期性。4.1.2 气温相关性

表3显示,用户1、5、6、9、10的相关系数大于0.6,其日电量与气温具有较强的相关性。

表3 气温相关性检验结果Tab.3 Temperature correlation test result

4.1.3 节假日影响

各用户节假日影响检验结果如表4所示。

表4 节假日影响检验结果Tab.4 Impact of festivalfactors result

表4可见,不同用户在不同节假日的工作调休安排差异较大,部分用户在节假日仍正常生产经营。当预测受该节假日影响较大(P<0.1)的用户电量时,在节假日电量上需对其进行3.5节所述的概率调整,降低节假日电量预测误差。

综上,10位用户的特征辨识结果如表5所示。

表5 特征辨识结果Tab.5 Characteristics identification result

4.2 电量分解结果

依据上述用户特征辨识结果,在STR分解框架中选择对应的分量。其中,以用户1为例,由于其具有周期性、气温相关性,故对其2020年1月1日—2021年1月18日的电量分解得到4个分量,绘制结果如图2(a)所示,再对余项进行EEMD分解如图2(b)所示。预测2021年1月19日至2月1日共计两周电量,各分量预测及其叠加结果如图2所示。图2(a)显示,用户趋势分量呈“先降后升”状,实际上2020年受疫情影响,前半年企业经营状态不佳,分解所得趋势分量能够反映用户的实际生产状况;周期分量幅度与一般周期分解结果不同,呈现“中间大两头小”状,能够反映一般企业年中生产较为活跃的情况;而气温协变量大致为“钟形”曲线,反映气温变化对用户空调等负荷的长期影响走势。综上,STR分解所得分量均具有现实物理意义,能够真实地反映用户在短时周期性、气温相关性等方面的实际用电行为变化。

图2 用户1电量分解及预测结果Fig.2 Electricity demand decomposition and prediction results of User 1

进一步地,为体现STR对不同特征用户的处理差异,绘制用户7在2020年1月1日—2021年1月18日的电量分解及预测结果如图3所示。

根据表5可知,用户7的日电量与用户1相比不具有气温相关性,因而在STR分解框架中去除气温协变量,仅分解得到其余3个分量,如图3所示,体现了STR对不同行业用户电量分解的差异化处理。

图3 用户7电量STR分解结果Fig.3 Electricity demand decomposition and prediction resultsof User 7

4.3 日电量预测结果分析

由于不同行业用户电量数量级有所差异,因此若采用有量纲评价指标难以直接反映预测精度。为评价本文方法预测结果的精度,采用标准化绝对平均误差(normalized mean absolute error,NMAE)和标准化相对平均误差(normalized mean absolute percentage error,NMAPE)两项指标[25]对预测结果与实际数据值进行误差估计。

式中:ytrue为真实电量值;ypred为预测电量值;ymax为电量序列最大值;n为统计天数。

计算本文所提方法预测误差结果如表6所示。

表6 本文方法预测误差Tab.6 Prediction error of the method of this paper

表6可见,除用户2预测误差较大外(实际上用户2日电量不具有周期性和气温相关性,因而STR分解过程仅有趋势项和余项,并不能体现STR的优势),本文方法的NMAE在0.6%~3%之间,平均为2.06%,NMAPE在0.8%~4%之间,平均为2.75%,说明具有较高的预测精度和普适性。

为突出本文方法的优越性,将其与LSTM预测、经典季节分解法与LSTM组合预测、EEMD与LSTM组合预测、STR与LSTM组合预测等方法对比,以用户1为例展示上述各方法预测结果如图4所示,可见本文方法预测值更为贴近真实值。进一步地,计算各方法对10位用户的预测结果平均误差如表7所示。

图4 不同方法预测结果Fig.4 Prediction results of different methods

表7 不同方法预测误差Tab.7 Prediction errors of different methods

表7可见,相比于LSTM及其与经典季节分解或EEMD的组合,采用STR根据用户特征构造分解框架的预测准确度更高,同时对比STR+LSTM与本文方法预测误差可得,基于所得分量的特性选择LSTM/WLSSVM/CNN进行组合预测效果更优。

进一步地,在节假日如元旦电量预测上,对受元旦影响程度较大的用户预测其元旦后两周(含元旦)电量时,以用户1为例,元旦3 d的原预测结果与基于表3所对应的概率P(y≤y i)调整后的预测结果对比如图5所示。

图5 元旦假期预测结果Fig.5 Prediction results of New Year's Day

进一步地,整理受元旦影响程度较大的用户预测结果误差如表8所示。对比表8调整前后的误差可见,本文的调整方法大幅降低了预测误差,明显提高了预测精度。由于部分用户节假日电量的规律并不明显,甚至与往年情况相去甚远,对于此类用户本文方法表现出不适应之处。但是,对于规律性较强的用户(如用户1、7),本文预测精度能达到较为理想的效果。

表8 元旦期间电量预测误差Tab.8 Prediction error of power consumption in New Year's Day

5 结语

针对不同行业用户具有不同用电特征的问题,本文通过辨识用户特征省去定制STR分解框架时的人工干预判断过程,并依据其用电特征对用户电量进行二重分解,得到与用电特征相关的分量,结合分量特征选用适当智能算法进行组合预测。

本文方法所采用的STR相比于传统的周期分解法分解得到的分量数量是不定的,能够依据用户实际的用电特征选择加入与之相关的分量,灵活性更强;能够批量根据用户特征定制STR周期分解框架,省去人工干预过程,便于工程应用;采用EEMD对STR分解余项进行二次分解,大大减小余项的波动幅度且特征更为明显,综合发挥了周期分解和时频域分解的优点,有助于提升预测精度;所用组合预测方法结合了各分量的特性,预测精度较单一预测模型更加理想。

在后续研究中,一方面将考虑对预测算法进行改进不断提升预测精度;另一方面在对节假日预测量的调整精度仍一定程度上受用户历史相似性的影响,未来将对节假日电量预测深入建模。

猜你喜欢

电量分量气温
储存聊天记录用掉两个半三峡水电站电量
基于FY-3D和FY-4A的气温时空融合
物联网智能燃气表电量自补给装置
深冬气温多变 蔬菜管理要随机应变
基于功率的电量智能修复算法研究
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
论《哈姆雷特》中良心的分量
与气温成反比的东西
节假日来电量预测及来电量波动应对策略