APP下载

基于联合时序场景和改进TCN的高比例新能源电网负荷预测

2024-03-05许青张龄之梁琛李亚昕

广东电力 2024年1期
关键词:风光出力时序

许青,张龄之,梁琛,李亚昕

(1.国网甘肃省电力公司,甘肃 兰州 730030;2.国网甘肃省电力公司电力科学研究院,甘肃 兰州 730070)

随着我国“双碳”目标的提出,以高比例新能源接入为典型特征的新型电力系统建设不断发展[1]。截至2023年4月底,全国非化石能源发电装机容量13.5亿kW,占总装机容量的50.8%,其中风电装机3.8亿kW,太阳能发电装机4.4亿kW[2]。风光等新能源发电具有的随机性和波动性特征,使得高比例新能源渗透率电网的短期负荷预测不仅受到天气、日期、经济等条件的影响,也需要考虑新能源的发电情况[3-5]。

精准的负荷预测对电力系统的安全、稳定、经济运行具有重要意义。当前,常见的预测方法主要有传统统计学方法和人工智能方法2类。前者包括回归分析法、马尔科夫链、时间序列法等,优点在于原理简单易懂,计算快捷,但非线性拟合能力不强,预测效果较差。后者包括支持向量机(support vector regression,SVR)、人工神经网络(artificial neural network,ANN)及其相关改进网络如卷积神经网络(convolutional neural network,CNN)、时间卷积网络(temporal convolutional network,TCN)、长短期神经网络(long short-term memory,LSTM)等[6-11]。这类算法一般将影响预测项的各种特征量和预测项分别作为输入项和输出项,通过大量训练求解,非线性拟合能力较强,但预测结果受输入项选择影响较大。此外,SVR和CNN对数据的时序特性考虑不多,而TCN针对时序问题对CNN进行了改进,有效降低了预测误差,被广泛应用在机组出力预测、负荷预测等场景中。

文献[12]提出一种CNN-SVR联合负荷预测模型,指出其预测结果准确率比SVR、CNN等方法更高;文献[13]提出基于双向LSTM的超短期负荷预测模型,指出通过筛选网络输入项有利于提高预测精度;文献[14]同样指出提取关键特征值能够提高预测模型的准确性。但上述研究都缺乏对预测结果的修正环节。文献[15]将历史光伏出力数据与天气预报相关联,提出一种考虑时序动态回归的短期光伏出力预测方法;文献[16]对风电出力预测展开研究,指出针对不同天气类型,分别建立预测模型能够改进预测结果。可以看出,现有预测研究往往集中在风、光出力和负荷等单一场景预测,很少将风光出力因素纳入负荷预测的研究范围。而在高比例新能源电力系统中,风光等新能源的随机性与间歇性大大增加了电网调度的难度,在该场景下,有必要将新能源出力纳入负荷预测研究范围。文献[17-19]对风光联合场景下的分布式电源规划等进行研究,为本文提供了参考。

综上,本文提出基于联合时序场景的改进型TCN高比例新能源电网短期负荷预测方法。首先通过相关性距离刻画风光出力和负荷的联合场景特性,将负荷预测场景进行分类;然后建立随机森林(random forest)-时间卷积网络(RF-TCN)预测模型,并通过Bootstrap对预测结果进行修正;最后,以甘肃某地实际电网为例进行仿真验证,验证本文所提方法的有效性。

1 模型框架

随着新型电力系统建设的不断推进,我国电力系统新能源渗透率将不断提高。本文所提负荷预测方法的核心在于考虑了风光等新能源出力因素,并基于风光出力与负荷关联度划分成不同预测场景。具体过程包括负荷与新能源出力相关性分析、RF-TCN短期负荷预测模型建立、未来负荷预测3个步骤,整体模型框架如图1所示。

图1 模型结构框图Fig.1 Model framework

整体模型简述如下:

步骤1:利用3σ准则剔除异常数据后,对负荷与新能源出力进行联合时序场景分析,并划分成不同的预测场景,方便后续对不同负荷预测场景进行精细化建模。

步骤2:建立改进型RF-TCN负荷预测模型,通过RF算法对负荷预测特征量进行筛选,训练模型参数,并加入预测结果修正环节。

步骤3:利用常规预测方法对预测日风光负荷进行预测,判别预测日所属天气类型,选取对应预测模型。

2 基于相关性距离的预测场景分类

3σ准则是异常数据识别的常见方法,其内涵在于将数值分布在均值3个标准差之外的数据看作异常数据并剔除。本文首先分析处理风光负荷历史数据,接着考虑各场景下新能源出力曲线和负荷曲线之间的相关性,构建联合时序场景曲线如下:

(1)

式中:α、β、χ、Q分别为光伏出力、风电出力、负荷和风光负荷联合时序场景曲线;T为数据序列中的时段数。

引入指标δ刻画联合时序场景下风光负荷相关性:

(2)

式中:αi,t、βi,t和χi,t分别为i日t时段的光伏出力、风电出力和电网负荷;δi为i日风光负荷相关性距离向量,其数值含义为负荷中风光新能源发电以外的发电量;Ji为i日风光负荷相关性距离向量。

假定A、B这2日的风光负荷相关性距离分别是δA、δB,该2日相似性用式(3)衡量,该值越大,则相似性越低:

(3)

式中λAB为A、B 2日的日间相似度指标。

综上,可通过风光负荷相关性距离划分出不同天气类型,并通过日间相似度指标评价聚类结果。

3 基于RF-TCN短期负荷预测模型

对影响负荷预测的各种因素进行筛选有利于提高TCN负荷预测的准确性。本章首先通过RF算法筛选影响负荷预测的关键特征量,然后利用TCN进行负荷预测。

3.1 RF特征量筛选

RF算法常用于对非线性数据进行回归和分类,核心结构为决策树,每颗决策树都进行预测,然后通过加权或取最大值等方法得到预测结果。图2所示为RF算法结构。

图2 随机森林算法示意图Fig.2 Diagrammatic sketch of RF algorithm

RF算法基于重要性程度进行特征量提取时,通常通过基尼指数(Gini index,GI)或袋外数据错误率2种指标来衡量。基于GI的方式介绍如下。

设定原始数据具有K个特征量,X1,X2,X3,…,XK,以及H个种类,则在决策树节点m的GI为

(4)

式中3σ为节点m的样本属于第h类的概率估计值。

特征量Xk在节点m的重要性程度VGI,km通过其分枝前后ηGI的变化量表示为

VGI,km=ηGI,m-ηGI,q-ηGI,r.

(5)

式中ηGI,q和ηGI,r为节点m分枝后2个新节点q和r的GI。

假定一共有Z棵决策树,则特征量Xk在第z棵树的重要性

(6)

式中M为特征量Xk在第z棵决策树中的节点集合。VGI,km通过式(4)、(5)求取。特征量Xk的重要性

(7)

综上,通过式(4)—式(7),实现数据原始特征量的排序和筛选。

3.2 TCN原理

TCN是在CNN基础上的改进网络,适用于处理时序问题。TCN具有一种扩张因果卷积结构,能够对上一层的输入数据进行扩张采样,提取各种时序数据的特征。因果卷积能够保证提取特征信息的因果性,t时刻的输出yt依赖t及t时刻之前的输入x0,x1,xt-2,…,xt-1。对于卷积核为2,扩张系数为别为1、2、4的TCN,扩张因果卷积结构如图3所示。

图3 TCN扩张因果卷积结构Fig.3 Dilated causal convolution structure of TCN

TCN扩张因果卷积通过跳过部分输入,将卷积核拓展到更大的区域,通过改变膨胀系数d调整输出数据所接收到的信息量。对于一维时序数据的输入x∈Rn(Rn为n维实数空间)和滤波器f能够通过滤波器系数u和膨胀系数d扩张视野,卷积运算如下[11]:

(8)

式中xs-d·i为输入序列。

3.3 网络输入与输出

考虑高比例新能源电网中风光出力对负荷预测的影响,联合时序场景法将历史日期数据归类。各个预测模型以相似日为基础进行训练。将待预测日前2日的负荷、风光出力数据和经RF提取的关键特征量作为模型输入,而模型输出为预测日的负荷预测结果。

此外,在进行网络训练时,需要对输入数据进行预处理,本文采用归一化方法,将输入量中的负荷、气温、风速等数值归一化,而对于日期、星期、节假日等输入量则另做处理[20-21]。

(9)

4 预测修正与评价

本文的负荷预测结果是1日96个时段的负荷预测值,是一个有关时间的序列,各预测点对应的负荷预测误差也构成一个时间序列。为了提升模型预测的准确性,本文引入Bootstrap算法构建预测误差修正模型。

Bootstrap是用于估计统计量的采样方法,它通过从样本中有放回地抽取(即每次抽取都从全部样本中抽取)多个子样本,得到该统计量的抽样分布,并由此计算置信区间。在Bootstrap中,通过计算每个子样本与全样本均值的差异来估计偏差。因此,利用Bootstrap对负荷预测误差的分布特性进行统计推断,并设置对应的置信度区间划分不同预测误差范围。当负荷预测误差在区间内,则不修正预测数据,当负荷预测误差在区间外,则需要修正。具体计算原理见文献[22]。

此外,常见的负荷预测评价指标有均方根误差(mean square error,MSE)和平均百分比误差(mean absolute percentage error,MAPE)2项[1,23-25],本文创新性地引入最大绝对误差(maximum absolute error,MAE)来评价负荷预测的准确度,衡量负荷预测方法的局部最大误差。

(10)

(11)

(12)

式中:ρMSE、ρMAE、ρMAPE分别为负荷预测的均方误差、最大绝对误差和平均百分比误差;3σ、3σ为负荷预测真实值和预测值。

5 算例仿真

本文使用甘肃省某地区2022年1月1日至2022年12月31日的数据对所提出的负荷预测模型进行仿真验证。截至2022年底,甘肃全省电力装机容量6 803万kW,包括风电2 076万kW、光伏1 445万kW,新能源装机占比52%。可见,利用甘肃省相关数据对高比例新能源电网的负荷预测问题进行研究具有高度适用性。

5.1 风光负荷联合场景分析

通过第2章述方法,在利用3σ准则剔除异常数据后,针对365个风光负荷的相关性开展联合分析。受制于当前数据样本数目不足,本文认为采用更多的分类意味着每类情况下样本量降低,不利于TCN网络的训练效果。因此,以1月1日为对比日,求取各日与该日的相似性距离,并据此将天气共分为5种类别,如图4所示(日期序号1对应1月2日,364对应12月31日,其他以此类推),各类别数目见表1。

表1 各日与1月1日相似性距离聚类类别数Tab.1 Clustering classification numbers of similarity distance between each day and January 1st

图4 各日与1月1日相似性距离聚类结果Fig.4 Clustering results of similarity distance between each day and January 1st

由图4可见,各个类型的天气仅有第1种和第5种相对日期而言比较集中,其余3种分布较为分散。具体而言,第1种类型主要对应冬季,第5种对应的季节主要为夏季。这是因为本文的日期相似度指标〔式(2)和式(3)〕,本质上是衡量该日期负荷中除风光出力外其余负荷曲线的相似度,在冬季/夏季时,风电和光伏发电对负荷曲线的影响更集中。

5.2 特征量提取

以气象、日期因素等构建影响负荷预测的特征集,见表2所示。然后通过RF对特征量重要性进行排序,图5所示为重要性分析结果。

表2 影响负荷预测的特征量Tab.2 Characteristic quantities affecting load prediction

图5 随机森林特征变量重要性分析结果Fig.5 Importance analysis results of RF algorithm

由图5可知在选定的11个特征量中,前6个重要性得分较高,因此选取小时、最低气温、节假日、分时电价、平均气温、月份和待预测日前2日的负荷、风光出力数据作为输入项。

5.3 预测结果

分别用本文模型和传统BP神经网络、SVM和不含预测修正的TCN方法对2022年12月31日数据进行负荷预测。其中BP神经网络、SVM这2种方法不划分天气类型,且不修正预测结果。不经分类和不经修正方法与本文方法的区别仅在于不经天气类型划分且不经预测误差修正,其余部分相同。各种方法的预测结果、预测结果MAE和预测结果评价依次如图6、图7和表3所示。需要说明的是,在本文的RF提取部分,已经考虑预测日是否为工作日等因素,并得到影响负荷预测的关键特征量作为TCN的输入项,因此预测日是否为工作日等因素对预测模型没有影响。

表3 不同预测方法结果评价Tab.3 Evaluation of the results of different prediction methods

图6 不同预测方法预测结果Fig.6 Prediction results of different prediction methods

图7 不同预测方法预测结果MAE Fig.7 Absolute errors of prediction results of different prediction methods

分析图6、图7和表3,得出如下结论:

a)本文预测方法的预测精度明显优于其他方法,MAE为2.62%,MSE为16.55 MW,而MAPE为1.65%,就MAE和MAPE这2个指标而言,相较其他方法分别提高了36%、43%、19%、11%和46%、48%、19%、10%,预测效果好。

b)BP神经网络和SVM预测精度明显劣于其他3种方法,原因在于模型较为简单,没有深层挖掘数据信息。

c)通过对比本文方法、不经天气类型分类方法和不经预测误差修正方法发现,不经预测误差修正方法的预测精度略优于不经天气类型分类方法,这说明,有必要对含大规模新能源电网进行天气类型划分,以及对负荷预测结果进行误差修正。

6 结论

针对高比例新能源并网电网,提出一种基于联合时序场景的改进型TCN短期负荷预测方法。通过算例仿真,得出结论:

a)为充分考虑新能源出力对负荷预测的影响,通过联合时序场景法划分不同负荷预测场景,分别建立预测模型,能提升预测精度。

b)利用TCN充分考虑负荷的时序特征,并通过RF算法提取影响负荷预测的关键特征量,能提高预测精度。

c)通过Bootstrap算法对预测结果进行修正能够提升预测准确性。

仿真结果表明,本文方法能够有效提高预测精度,并较好地解决高比例新能源电网的短期负荷预测问题。

猜你喜欢

风光出力时序
基于Sentinel-2时序NDVI的麦冬识别研究
风光新580
风光如画
风光ix5:当轿跑邂逅SUV
基于FPGA 的时序信号光纤传输系统
一种毫米波放大器时序直流电源的设计
各国首都风光
风电场有功出力的EEMD特性分析
要争做出力出彩的党员干部
风电场群出力的汇聚效应分析