基于LSTM网络的时间多尺度电采暖负荷预测

2021-05-11李香龙马龙飞赵向阳徐振华

电力系统及其自动化学报 2021年4期

李香龙，马龙飞，赵向阳，朱洁，徐振华

（1.国网北京市电力公司，北京 100075；2.北京航空航天大学自动化科学与电气工程学院，北京 100191）

为解决北方冬季燃煤供暖引起的空气污染问题，电采暖设备应用越来越广泛。其中，北京农村供暖建筑保温性差，相比于城镇供暖耗能更高。北京农村地区住房供暖面积近年来增长迅速，从2006年农村住宅面积1×108m2增加到2014年1.5×108m2，平均年增长率为5.2%。针对日益增长的农村供暖需求问题，北京市提出“煤改电”计划，2017年完成20.5万户“煤改电”改造任务。“煤改电”计划的大范围推广，使得冬季电力负荷峰谷差进一步增大，严重危害电网安全稳定运行。准确的电采暖负荷预测不仅能够保证电力系统的经济稳定运行，同时对电力系统的调峰及调频功能具有重要作用[1]。

负荷预测是根据历史负荷、天气等数据，分析负荷相关历史数据变化对未来负荷变化的影响规律，实现负荷准确预测[2]。传统的电力负荷预测算法包括有人工神经网络ANN（artificial neural network）[3]、支撑向量机SVM（support vector machine）[4]、小波分析[5-6]和灰色神经网络[7]等预测算法。这类算法采集历史负荷功率和气温等数据，通过数据训练和学习实现负荷预测。但是对负荷预测模型输入缺乏深入讨论，且没有考虑电力负荷数据的时间序列特性，仅仅是利用算法自身结构训练学习数据，基于统计理论的外推特性进行预测，导致模型的预测精度不够好。电力负荷是一种负荷数据之间存在较强关联的时间序列，仅将当前时刻历史数据信息作为人工智能算法的输入是不够的，这样必然会使得模型训练丢失部分信息，导致模型的预测误差较大。

对时间序列数据的学习，目前较成熟的学习算法有递归神经网络RNN（recurrent neural network）[8]和长短期记忆LSTM（long short-term memory）网络[9]等，采用RNN和LSTM网络进行负荷预测均考虑电采暖负荷序列之间的影响和其他因素的影响。RNN由于训练过程容易出现梯度消失和梯度爆炸等问题[10-11]，容易陷入局部优化的困境，因此模型训练效果较差。LSTM网络基于RNN通过改进自身网络结构，有效解决了梯度消失和爆炸问题。目前LSTM网络在图像识别[12]、声音识别[13]等诸多前沿领域已有广泛研究，并取得了一定的成果和应用。在电力负荷预测中，LSTM网络也取得了一定的研究成果。文献[14]采用收敛交叉映射方法和LSTM神经网络模型实现城市用电量预测，结合动力系统理论，采用连续导通模式CCM（continuous conduction mode）方法研究了用电量和温度、风速、相对湿度等因素之间的内在联系，建立LSTM神经网络模型，并对城市用电量进行了预测，结果具有较好的精度。文献[15]采用LSTM网络预测风力发电功率并与ANN和SVM网络预测模型比较，得出采用LSTM网络预测效果更优。同时也有学者基于LSTM网络模型对短期电力负荷进行预测，预测精度较好[16-19]。但是上述研究均采用LSTM网络建模和数据的训练学习，在搭建网络结构时，缺乏对网络结构参数的详细讨论，在选择LSTM网络训练数据的训练步长上缺少研究说明，也没有讨论不同的采样时间间隔的负荷数据下，训练步长对预测效果的影响。

本文提出一种基于LSTM网络的多时间尺度电采暖负荷预测方法。为研究电采暖负荷时间序列特征和深入挖掘电采暖负荷数据信息，针对不同采样间隔的电采暖负荷数据建立LSTM网络预测模型，通过设置不同的训练步长，比较分析得到预测效果较佳的训练步长。采用北京电力科学研究院提供的2016年度电采暖负荷实测数据进行训练。预测结果表明，不同的采样间隔下，随着训练步长的增加，LSTM网络模型预测效果更好。在合适的训练步长下，采用LSTM网络进行电采暖负荷预测较ANN、SVM负荷预测效果更优。

1 电采暖负荷

与一般电力负荷不同，电采暖负荷类似夏季的空调制冷负荷，不仅具有明显的季节气候特性，受气温变化影响显著，而且具有较强的时序特征。常见的电采暖方式包括直热式、蓄热式和空气源热泵设备供暖。电采暖负荷变化影响因素主要包括环境气温变化、用户采暖用电习惯、区域电采暖设备规模和建筑热力学状态[20-22]。用户采暖用电习惯主要指用户采暖方式和采暖设备设定温度大小。用户采暖方式为直热式、蓄热式、空气源热泵设备一种或几种的组合方式。建筑热力学状态主要包括建筑房间的等效热容、等效热阻和散热功率等。

影响电采暖负荷变化的信息是难以定量描述，但是前后时刻有一定的关联，表现出较强的时间关联特性，采用LSTM网络预测电采暖负荷具有明显的优势。当电力负荷中存在多种负荷时，由于大部分电力负荷均表现有一定的时间关联特性，以及强弱不同关联特性，因此，采用LSTM网络对存在多种负荷序列进行训练，仍能达到较优预测效果。

2 LSTM网络

LSTM网络包括输入层、输出层和隐含层，隐含层是由重复的具有独特记忆功能的LSTM单元通过链条的关系连在一起的。LSTM单元结构[15，19]如图1所示。

图1 LSTM单元结构Fig.1 Structure of LSTM unit

在图1中，每个LSTM单元结构包含了4个部分，分别为遗忘门ft、输入门it、输出门ot和记忆单元ct。具体网络数据训练过程包括：首先，在t时刻，3个门接收输入当前时刻状态xt、上一时刻LSTM隐藏状态ht-1和记忆单元状态ct的信息；然后，对该接收信息进行处理运算，逻辑函数确定其是否激活；接着，将输入门的处理结果与遗忘门的处理结果进行叠加，产生新的记忆单元状态ct；最后，通过输出门非线性运算得到最终的输出结果ht。各个过程具体运算可表示为

式中：σ为sigmoid或tanh函数；Wi、Wf、Wc、Wo分别为输入门、遗忘门、记忆单元和输出门的节点权重矩阵；bi、bf、bc、bo分别为输入门、遗忘门、记忆单元和输出门节点阈值矩阵。

3 网络预测模型

3.1 模型参数

确定电采暖负荷预测模型的网络输入，需要明确影响电采暖负荷变化的影响因素。考虑电采暖负荷特点，LSTM网络电采暖负荷预测模型的输入为室外温度和电采暖负荷，输出为电采暖负荷预测时刻的功率。

3.2 网络参数

LSTM网络参数包括训练步长、输入层节点个数、隐含层层数和输出层维数。

数据训练步长的确定既要保证所需预测信息的完备性，又要考虑模型训练的有效性。因此，对于输入层的训练步长的确定，一般采用经验和尝试比较相结合的方法，经过多次不同步长的训练效果对比，从而获得最佳的训练步长。训练步长过长会使得模型变得复杂，预测效果变差；训练步长过短则使得输入数据信息部分缺失，预测精度下降。本文对不同采样时间间隔的数据集，在不同的训练步长的条件下进行分析比较。在不同的采样时间间隔及不同的训练步长下，网络得到训练效果均不相同。

输入层节点个数为输入数据的维数。对于LSTM网络，每个隐含层即为1个LSTM单元，因此隐含层层数为LSTM层单元个数。随着LSTM单元个数的增加，理论上网络预测泛化能力随之提升，但是网络训练复杂度和训练时长等也会增大，模型成本也随之增加。根据文献[23]中对网络隐层层数的研究，电力负荷预测使用两层隐层的LSTM模型能够获得较好的网络预测效果。

输出层维数即为输出变量维数[24]，也为电采暖负荷功率，因此输出层维数为1。

4 算例分析

4.1 数据资料

使用LSTM网络首先需要确定训练数据集，采用北京某地区2016年12月15日―2017年2月16日时间段的电采暖负荷数据，数据包括日期时间、室外温度和电采暖负荷功率。该地区包含用户134户，电采暖设备额定功率2.5 kW，数据采样间隔为10 min，共计9 072组数据，将前53 d数据作为训练集，后10 d作为测试集。

4.2 预测结果

采用均方根误差RMSE（rootmeansquareerror）评估预测结果的绝对误差水平，并比较不同采样间隔及不同训练步长下的预测结果。选取其中超短期电力负荷预测中的典型采样时间间隔10 min、20 min、30 min、40 min和60 min进行预测分析。

不同采样间隔和不同训练步长下的预测结果评估指标RMSE分布见图2。

图2 RMSE分布Fig.2 Distribution of RMSE

由图2可知，当采样间隔相同时，随着网络训练步长的增加，网络预测结果误差减小；当数据采样时间间隔增大时，预测结果误差逐渐增大。例如：采样间隔为30 min，1～10步长预测结果RMSE下降3.47%，最大下降13.88%；当训练步长为7时，10～60 min采样间隔预测结果RMSE增加2.21%，最大增加3.56%。由于电采暖负荷数据具有较强时间关联性，增大网络训练步长，能够进一步增加网络输入信息量，提高网络训练效果，减小预测误差。随着采样间隔增大，数据之间关联性减弱，负荷数据之间时间关联性减弱，网络训练效果减弱，预测结果误差增大。

理论上，训练步长越大，网络训练效果越好，但是同时也会导致网络训练成本增加，模型计算量和复杂度增加。因此将模型训练时长作为模型的训练成本描述量。图3为不同训练步长及不同采样间隔下的模型训练时长分布。

图3 训练时长Fig.3 Training time

为确定在不同采样间隔条件下合适的网络训练步长，在训练步长增加情况下，将预测结果RMSE的减小量百分比与网络训练成本的增加量百分比的比值作为衡量网络预测的性能指标。即在较优的训练步长情况下，进一步增大训练步长，RMSE减小不显著，而网络训练成本增加显著，则认为此时的训练步长为较优训练步长。评价网络性能指标ε为

式中：t为网络训练时长；i为训练步长。

图4为不同训练步长及不同采样间隔下网络性能指标分布。

图4 LSTM网络性能指标Fig.4 Performance index of LSTM network

由图4可知，当采样间隔为20 min时，训练步长由9增加至10，训练时长由0.004 2 s增加至0.024 6 s，训练误差由0.005 9减小至0.002 4，网络性能指标ε由0.712 9增加至10.313 1；当训练步长小于9时，单位训练步长网络性能指标平均增加量为0.095 9，最大增加为0.292 0。可见，最优训练步长为9，此时继续增加训练步长，网络预测结果RMSE减小不显著，网络训练时长增加显著。同样可以得到，当采样间隔分别为30 min、40 min、60 min时，网络训练步长较优值分别为9、7、7。由此可以看出，在一定采样时间间隔范围内，随着采样时间间隔的增大，单纯的增加训练步长对网络性能提高并不明显，适当减小训练步长能够获得更好的网络训练效果。

在不同采样间隔下，采用LSTM网络预测结果与采用ANN、SVM网络预测结果对比见表1。其中，当采样间隔为10 min时，训练步长为10；当采样间隔为20 min和30 min时，训练步长为9；当采样间隔为40 min和60 min时，训练步长为7。

表1 LSTM与ANN、SVM结果对比Tab.1 Comparison of result among LSTM，ANN，and SVM models

根据表1可知，当采样间隔为30 min时，采用LSTM网络预测结果RMSE较ANN、SVM分别下降了36.4%和14.2%；当采样间隔为60 min时，LSTM预测结果RMSE较ANN、SVM分别下降了34%和19.6%。因此，可以认为在合适的训练步长下，采用LSTM网络进行电采暖负荷预测效果较采用ANN和SVM网络得到的误差更小，模型训练效果更优。