APP下载

基于Shapley组合模型的上海市电力需求趋势预测

2019-09-12王涛

智能计算机与应用 2019年4期
关键词:ARIMA模型BP神经网络

王涛

摘 要:现代社会中,家家户户都离不开电力的供应,稳定可靠的电力供应对于经济、社会的发展以及人民生活水平的提高起着重要作用。上海市作为中国重要的经济和贸易中心,电力需求一直保持着高速增长,对于电力供应单位而言,需要对用户的电力需求进行科学预测,以满足用户的用电需求,稳定电力供应,助力经济社会发展。本文采用ARIMA模型、BP神经网络模型和Holt指数平滑模型分别对1995~2017年上海市电力需求数据进行建模分析,并运用合作对策理论中的Shapley组合模型方法进行组合建模,求解了上述三种单一预测方法的权重,构建了组合模型,并依据组合模型预测了未来五年的上海市电力需求量趋势。根据实例结果,Shapley组合模型具备更高的预测精度,预测平均相对误差仅为2.33%,拟合效果较好,有利于电力供应单位稳定电力供应,促进经济社会发展。

关键词:ARIMA模型;BP神经网络;Holt指数平滑法;Shapley组合模型;电力需求预测

文章编号:2095-2163(2019)04-0033-07 中图分类号:TM715;F426.61;F224 文献标志码:A

0 引 言

随着现代社會的高速发展,电力资源作为必备的重要能源,对于促进社会发展、提高人民物质生活水平起着至关重要的作用。现代社会中,家家户户都离不开电力的供应,稳定可靠、价格合适的电力供应成为了人们关注的焦点。因此,电力供应单位需要准确地制定供电计划,确保对用电量的准确预测以及电力的稳定供应。上海市作为中国重要的经济和贸易中心,自改革开放以来经济一直保持着良好增长态势,人民生活水平显著提高,物质生活获得了极大的丰富,由此也带来了用电量的激增,这对供电单位而言同样也是极大的考验。因而选择科学、有效的预测模型,准确地对市场中的用电需求进行预测,有助于供电单位制定供电计划,稳定电力供应,助力社会经济的高速平稳运行,不断提高人民生活质量。

近年来,国内外学者对于预测方法的研究有很多,也取得了可观成果[1-17]。目前,常用的预测方法主要包括系统动力学方法[1]、随机森林法[2-3]、支持向量机法[4-5]、神经网络法[6-9]、灰色预测法[10-13]、回归分析法[14-17]等。文献[1]从系统动力学的角度研究了城市长期电力需求的预测方法,在经济新常态的背景下,城市支柱产业面临着由要素驱动向创新驱动的转变,因而传统的电力需求预测模型逐渐不再适用,文章结合新的影响因素进行了定量分析,提出了一种适用于经济新常态的长期电力需求预测模型的动力学方法,并取得了较好的效果。文献[9]基于BP神经网络算法,研究了北京市夏季日最大电力负荷的预测方法。文献[16]基于2009~2013年北京市电力负荷和气象资料,通过多元回归的思想构建了北京市日最大电力负荷的预测模型,并取得了较好的预测准确率,展现了良好的预报能力。文献[17]将自回归积分滑动平均模型(ARIMA模型)和支持向量机法(SVM)相结合,基于ARIMA和SVM混合模型对短期电力负荷进行了预测。然而目前大多数的预测文献中采用了单一的预测方法,往往偏重于数据的某一类特征,无法充分利用数据的各种有效信息,从而导致预测的误差较大,未能得到令人满意的预测精度和效果。但是研究可知组合预测模型可以克服单一模型的局限性,最大程度地利用数据的各种有效信息,因而组合预测模型方法更加有利于实现科学的预测,广泛适用于信息量不完备的复杂经济系统。一般而言,电力需求量数据序列为非平稳时间序列,可以通过差分的方法转换为平稳时间序列, 进而采用ARIMA模型进行建模预测分析。同时,BP神经网络也是一种常用的预测方法,具有高度的信息处理能力,在处理数据的过程中表现出良好的自学习、自适应能力,因而也尤为突显出该方法独特的优越性;指数平滑法则是一种较简单的预测方法,常适用于光滑、且显出一定趋势的数据,在计算的复杂程度和适应性上占据着优势。

在上述分析基础上,本文拟将采用组合ARIMA模型、BP神经网络模型和指数平滑模型,基于Shapley组合预测模型对上海市电力需求趋势展开预测分析,并给出未来五年上海市电力需求的预测结果。对此可得研究论述如下。

1 ARIMA模型建模

ARIMA模型,又称自回归积分滑动平均模型,是一种经典的时间序列计量模型,主要用于对时间序列的宏观趋势预测研究[18]。ARIMA模型通过把非平稳时间序列转化为平稳时间序列,将因变量对其滞后和随机误差项的当前值与滞后进行回归所建立的模型,可以有效地描述时间序列数据的动态连续特性,适用于解决非平稳时间序列趋势预测问题。在ARIMA(p, d, q)模型中,AR称为自回归,p表示自回归的阶数,MA表示移动平均,q为移动平均的阶数,d为将非平稳时间序列转化为平稳时间序列的差分阶数。ARIMA模型的基本结构如下:

对于任意非平稳时间序列,均可以通过差分运算,转化为平稳时间序列,继而进行ARMA模型的拟合。对于时间序列建立ARIMA模型的步骤可分述如下。

(1)时间序列的平稳性检验。根据获得的时间序列,进行ADF单位根检验,依据结果判断是否为平稳时间序列。

(2)将非平稳时间序列转化为平稳序列。对于非平稳时间序列,运用差分运算的方法,转化为平稳时间序列。

(3)识别模型并判断模型阶数。对于平稳时间序列,依据自相关与偏自相关图初步分析模型的阶数p,q,并依据AIC或BIC准则最终确定其数值。

(4)模型参数检验。对模型残差进行白噪声检验。

(5)模型拟合预测。依据模型,对时间序列进行预测。

根据上述步骤,对上海市电力需求量时间序列进行ARIMA模型建模。对此,可推得研发阐述如下。

1.1 时间序列的平稳性检验

根据1995~2017年上海市电力需求量历史数据(文中所用数据来自国家统计局官方数据库),绘制1995~2017年上海市电力需求量时序图如图1所示。

观察图1时序可知,上海市电力需求量呈现明显的上升趋势,分析可知这不是一个平稳序列。为了进一步确定上海市电力需求序列的平稳性, 运用ADF单位根检验的方法进行判断,运算结果见表1。

根据ADF单位根检验结果,P值为0.995 900,不能拒绝原假设,上海市电力需求量序列不是一个平稳的时间序列。因此需要将数据进行差分平稳性处理。

1.2 差分运算处理

对上海市电力需求量时间序列进行一阶差分处理。为了判断一阶差分后该序列是否平稳,绘制一阶差分后序列的自相关图和偏自相关图如图2所示。

由图2可知,初步判断一阶差分后序列为平稳序列。为了保证判断的正确性,同理,可以通过ADF单位根检验的方法对差分后的时间序列进行判断。预算结果见表2。

由ADF单位根检验结果,P值0.032 900<0.05,拒绝原假设,可以认为一阶差分之后为平稳序列。因此,可以考虑采用ARIMA(p,1,q)模型。

基于准确性原则和数据最优化考虑,对一阶差分后的时间序列再做一次差分运算。为了判断二阶差分后该序列是否平稳,绘制二阶差分后序列的自相关图和偏自相關图如图3所示。

根据图3可初步判断二阶差分后序列为平稳序列。为了保证判断的正确性,同理通过ADF单位根检验的方法对差分后的时间序列进行判断。结果见表3。

由表3分析可知,二阶差分之后序列即为平稳序列。因此,可以考虑ARIMA(p,2,q)模型。

1.3 识别模型,判断模型阶数

根据上述ADF单位根检验的结果,可以看出上海市电力需求数据在一阶差分和二阶差分下ADF检验P值均小于0.05,即差分后的时间序列均为平稳序列,参数d的选取需要考虑1与2两个值。

在ARIMA模型中除了考虑差分阶数d的选择,还需要考虑参数p与q的选择,时间序列的自相关系数(ACF)与偏自相关系数(PACF)可以提供对于参数p,q的判断方法。若自相关函数在q阶截尾和偏自相关系数在p阶截尾,则可初步判定模型为ARIMA(p,d,q)。

通过观察自相关函数与偏自相关函数图,p值可以选取0,1,2,q值可以选取1,2。根据上述结论,初步设定的模型为ARIMA(0,1,1)、ARIMA(0,2,1)、ARIMA(1,2,1)、ARIMA(2,2,1)、ARIMA(0,2,2)、ARIMA(1,2,2)、ARIMA(2,2,2)。由于上述模型的确定主要是根据自相关图和偏自相关图定性判断得出,为了精准确定最优模型参数,可以使用AIC和BIC准则进行判断。一般认为,AIC和BIC函数值较小的模型参数有着较高的准确性,更加接近真实模型的阶数。使用R语言对上述七种模型进行比较,各模型的AIC和BIC准则值见表4。

根据AIC和BIC准则对上述模型进行比较,发现模型ARIMA(2,2,1)结果较好。选取ARIMA(2,2,1)模型为最优模型,序列x1,x2,...,xn的拟合结果为:

1.4 模型参数检验

对ARIMA(2,2,1)模型残差序列进行白噪声检验,得到p值为0.959 6>0.05,表明残差序列是纯随机的,为白噪声序列,说明模型显著,拟合效果较好,ARIMA(2,2,1)模型对该时间序列拟合成功。

1.5 模型预测

应用ARIMA(2,2,1)模型对上海市2018~2022年电力需求量进行短期预测,结果见表5。

2 BP神经网络

根据1995~2017年上海市电力需求量的历史数据,选择每前三年的数据来预测第四年的数据。即在BP神经网络中,输入层选择3个神经元,输出层选择1个神经元,根据文献[9],在隐含层的节点应为输入层节点的2~3倍左右搜索,经过多次实验模拟,测试发现在输入层节点为3,输出层节点为1的情况下,隐含层节点数为10时,BP神经网络的拟合效果较好。因此可按照如下参数来训练BP神经网络建模,即:输入层节点数为3,隐含层节点数为10,输出层节点数为1,训练次数为3 000次,神经网络训练误差设为0.000 1,网络的初始权值/学习速度和阈值等由Matlab软件自动选取。

研究中,在保证训练次数和训练误差的前提下,应用BP神经网络模型对上海市2018~2022年电力需求量进行短期预测,结果见表6。

3 Holt指数平滑法

指数平滑法,是一种基于预测对象历史数据利用加权平均的方法进行数据的拟合与预测的方法[19]。根据上述关于1995~2017年上海市电力需求量的变化趋势图可以看出,上海市电力需求呈现出一定程度的线性变化趋势,具有水平截距和线性趋势斜率,无季节因素影响。基于指数平滑理论,Holt指数平滑法可以对有水平项和趋势项的时间序列实现拟合预测,本文采取Holt指数平滑的方法对上海市电力需求量变化趋势进行预测。这里,研究推得Holt指数平滑法的计算模型的数学公式可顺次表述如下。

研究可知,R语言的forecast包主要用于时间序列的拟合预测。其中,函数ets()主要用于关于指数预测模型的数据拟合,而且还会依据平均相对误差最小准则,自动选取对原始数据拟合优度最高的模型,以上海市电力需求量历史数据的指数模型拟合为例,可得拟合优度最高的Holt指数平滑模型。对应模型参数有:

应用Holt指数平滑模型对上海市2018~2022年电力需求量进行短期预测,运算结果见表7。

4.1 Shapley方法基本思路

Shapley组合法是由Shapley在1953年提出的用于解决多参与者合作对策问题的一种方法。该方法针对各个参与者在合作中的不同贡献,着眼于每个参与者对合作的平均贡献,突出了合作中每个参与者的重要性,因而易于为合作的各个参与者所接受,并获得了较好的应用[20-21]。

在Shapley組合法中,假设存在s种预测方法,集合为I=1,2,...,s,对其中任意子集p,q,E(p),E(q)分别为该预测子集的误差。则有:

4.2 基于Shapley方法的上海市电力需求量预测

使用均方误差(MAPE)准则对上述三种单一预测方法,即:ARIMA模型、BP神经网络模型和Holt指数平滑模型的预测误差进行计算分析。 根据上述三种单一预测方法的预测误差,可求得组合预测的总误差值为(2.49+2.99+2.79)/3=2.76。由Shapley方法,参与组合预测模型总误差分配的“合作关系”成员为:I=1,2,3 ,I所有子集的组合误差分别为:E1、E2、E3、E1,2、E1,3、E2,3、E1,2,3,其数值的大小为该子集所包括的向量的误差平均值,计算结果见表8。

根据Shapley组合法给出的计算公式,可以计算出组合中对应的成员1的Shapley值为:

由权重公式(10),可以计算出各个预测方法的权重为ω=0.370 0 0.301 6 0.328 4,则Shapley组合预测模型为:

由上述对于各个预测模型的权重公式,可以对ARIMA模型、BP神经网络模型和Holt指数平滑模型进行组合。利用组合预测模型对1995~2017年上海市电力需求量进行预测,该组合模型的预测值与误差详见表9。

根据表9中数据的分析比较后可知,采用Shapley组合模型预测法运算得到的1998~2017年上海市电力需求量的预测结果的平均相对误差(MAPE)为2.33%,属于最小。所以,可以认为基于Shapley组合模型预测法得到的预测结果具有较高的预测精度,拟合效果较好,相对单一的预测方法较为有效。

在此基础上,拟对2018~2022年五年内上海市电力需求量进行预测。首先采用上述单一模型进行预测,然后根据Shapley组合模型预测法,基于各单一预测方法的权重值进行组合加权,最终算出组合预测值。预测结果见表10。

5 结束语

本文首先采用ARIMA模型、BP神经网络模型和Holt指数平滑模型三种单一预测模型分别对1995~2017年上海市电力需求数据进行建模分析,接着运用合作对策理论中的Shapley组合模型方法进行组合建模,求解了上述三种单一预测方法的权重,构建了组合模型,并依据组合模型预测了未来五年的上海市电力需求量趋势。根据实例结果,相比于三种单一的预测方法的拟合效果,Shapley组合模型具备更高的预测精度,预测平均相对误差仅为2.33%,拟合效果较好。

在实际应用中,根据Shapley组合模型的预测结果,未来5年内上海市的电力需求仍将呈现较大的增长态势,预计到2022年上海市的电力需求量为1 812.28亿千瓦时,该预测运算的拟合结果较好,因此可为上海市的供电单位决策提供参考。对于上海市的供电单位而言,需要制定科学合理的供电量增长规划以及供电基础设施的建设工作,稳定上海市电力供应,服务于高速发展的经济社会活动,促进人民生活水平的提高。

此外,本文主要选取了3种预测领域应用较多、效果较好的单一预测方法用于Shapley组合模型,如何更加全面有效地选择预测方法进行Shapley组合预测,提高应用的一般性,获得更高的拟合精度,仍然是一个亟待深入探究和讨论的研究课题。

参考文献

[1]HE Yongxiu, JIAO Jie, CHEN Qian, et al. Urban long term electricity demand forecast method based on system dynamics of the new economic normal:The case of Tianjin[J]. Energy, 2017, 133(19):9-22.

[2] LAHOUAR A, BEN HADJ SLAMA J. Hour-ahead wind power forecast based on random forests[J]. Renewable Energy, 2017, 109(5):529 - 541.

[3] LAHOUAR A, BEN HADJ SLAMA J. Day-ahead load forecast using random forest and expert input selection[J]. Energy Conversion and Management, 2015, 103(4):1040 -1051.

[4] WANG Xibin, WEN Junhao, ZHANG Yihao, et al. Real estate price forecasting based on SVM optimized by PSO[J]. Optik, 2014, 125(3):1439-1443 .

[5] MALVONI M, DE GIORGI M G, CONGEDO P M. Data on support vector machines (SVM) model to forecast photovoltaic power[J]. Data in Brief, 2016, 9(9):13-16.

[6] DIMOULKAS I, MAZIDI P, HERRE L. Neural networks for GEFCom2017 probabilistic load forecasting[J]. International Journal of Forecasting, 2018(21):20-24.

[7] TEALAB A. Time series forecasting using artificial neural networks methodologies:A systematic review[J]. Future Computing and Informatics Journal, 2018, 3(2):334-340.

[8] WANG Lin, WANG Zhigang, QU Hui, et al. Optimal forecast combination based on neural networks for time series forecasting[J]. Applied Soft Computing, 2018, 66(6):1-17.

[9] 李琛,郭文利,吴进,等. 基于BP神经网络的北京夏季日最大电力负荷预测方法[J]. 气候与环境研究,2019,24(1):135-142.

[10]XIE Naiming, YUAN Chaoqing, YANG Yingjie. Forecasting China's energy demand and self-sufficiency rate by grey forecasting model and Markov model[J]. International Journal of Electrical Power & Energy Systems, 2015, 66(5):1-8.

[11]XU Ning, DANG Yaoguo, GONG Yande. Novel grey prediction model with nonlinear optimized time response method for forecasting of electricity consumption in China[J]. Energy, 2017, 118(9):473-480.

[12]LI D C, CHANG C J, CHEN C C, et al. Forecasting short-term electricity consumption using the adaptive grey-based approach—An Asian case[J]. Omega, 2012, 40(6):767-773.

[13]JIN Min, ZHOU Xiang, ZHANG Z M, et al. Short-term power load forecasting using grey correlation contest modeling[J]. Expert Systems With Applications, 2012, 39(1):773-779.

[14]YUAN Chaoqing, LIU Sifeng, FANG Zhigeng. Comparison of China's primary energy consumption forecasting by using ARIMA (the autoregressive integrated moving average) model and GM(1,1) model[J]. Energy, 2016, 100(11):384-390.

[15]BARAK S, SADEGH S S. Forecasting energy consumption using ensemble ARIMA-ANFIS hybrid algorithm[J]. International Journal of Electrical Power & Energy Systems, 2016, 82(8):92-104.

[16]石玉恒,赵娜,王凌,等. 北京地区日最大电力负荷预测模型初探[J/OL]. 中国电力:1-5[2019-01-30].http://kns.cnki.net/kcms/detail/11.3265.TM.20190129.2238.004.html.

[17]NIE Hongzhan, LIU Guohui, LIU Xiaoman, et al. Hybrid of ARIMA and SVMS for Short-Term load forecasting[J]. Energy Procedia, 2012, 16(15):1455-1460.

[18]王燕. 应用时间序列分析[M]. 4版. 北京:中国人民大学出版社,2015.

[19]滑瑶,张辉,刘悦悦,等. 基于Holt-Winters无季节指数平滑模型的国内电影票房预测[J]. 中国传媒大学学报(自然科学版),2017,24(4):1-7.

[20]王翀. 基于模型组合法的我国能源消费需求趋势預测[J]. 统计与决策,2018(20):86-89.

[21]崔杨,曲钰,仲悟之,等. 基于改进shapley值的风电汇聚趋势性分状态量化方法[J/OL]. 电网技术:1-10[2018-11-26]. https://doi.org/10.13335/j.1000-3673.pst.2018.1451.

猜你喜欢

ARIMA模型BP神经网络
基于时间序列模型的中国出口总额分析及预测
基于R软件的金融时间序列的预测分析
就bp神经网络银行选址模型的相关研究
基于Eviews上证综合指数预测
基于DEA—GA—BP的建设工程评标方法研究
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 
基于ARIMA模型的沪铜期货价格预测研究
BP神经网络算法在数值预报产品释用中的应用
组合预测法在我国粮食产量预测中的应用