APP下载

基于偏最小二乘回归的吉林省电力需求预测分析

2017-12-15郭晓丹李鹏

中国市场 2017年36期

郭晓丹 李鹏

[摘要]文章结合偏最小二乘回归和模糊时间序列对吉林省电力需求进行中长期预测分析。偏最小二乘法较好地克服了电力需求影响因素间严重的多重共线性问题,拟合效果较好,预测精度较高。分析发现,国内生产总值,第一产业、第二产业、第三产业、城镇居民人均可支配收入、城镇人口、总人口和居民消费水平对吉林省电力需求影响较大,同时节能减排政策会减缓吉林省电力需求的增长。

[关键词]偏最小二乘法;模糊时间序列;电力需求;交叉有效性

[DOI]1013939/jcnkizgsc201736220

1引言

当前我国经济发展进入新常态,经济增长放缓,产业结构处于升级阶段,要素和投资驱动转变为创新和效率驱动,环境成本上升。同时,在低碳经济背景下,企业会努力提高清洁能源尤其是电力的使用,降低传统能源煤炭的使用;而企业能源利用效率的提高又会降低电力消耗。这些都会直接影响到全社会的电力需求。

尽管我国电力事业在改革开放以来已经得到了长足发展,但季节性的、时段性的、区域性的电力短缺和电力供需不平衡依然存在。科学预测电力需求是保证电力供给的基本前提。电力需求预测也一直受到学术界和企业界关注。常用的预测方法包括回归分析[1]、最小二乘向量机[2]、电力弹性系数法[3]、灰色预测法[4]、时间序列法[5]、系统动力学[6]、面板数据模型[7]、协整理论[8]、神经网络和组合神经网络[9]等。然而,电力需求的影响因素繁多且常存在严重的多重共线性,样本数量也往往达不到一般多元回归分析的要求。偏最小二乘回归方法能有效克服这些困难。[10]本文采用这一方法预测吉林省电力需求。

2吉林省电力需求的偏最小二乘回归分析模型

综合考虑到社会经济发展、产业结构比重的调整、城镇化进程、居民消费价格以及低碳经济等影响因素,在对影响因素指标进行属性约简的基础上,选取国内生产总值(x1,亿元)、第一产业(x2,亿元)、第二产业(x3,亿元)、第三产业(x4,亿元)、城镇人均可支配收入(x5,亿元)、城镇人口数量(x6,万人)、总人口(x7,萬人)、居民消费水平(x8,元)、单位GDP能耗(x9,吨标准煤/万元)、CO2排放强度(x10,万吨)为自变量,电力总需求(y,亿千瓦时)为因变量,建立偏最小二乘回归分析模型,并结合模糊时间序列对电力需求进行预测分析。

21方差膨胀因子

一种多重相关性诊断的正规方法是使用方差膨胀因子,自变量xi的方差膨胀因子计算公式为:VIFj=(1-R2j)-1。其中,R2j是以xj为自变量时对其他自变量回归的复测定系数。一般认为如果有变量的VIF值大于10,则表示多重共线性影响到最小二乘的估计值。

22偏最小二乘回归模型

设电力需求为因变量y,p个自变量集合为{x1,x2,…,xp}。当样本容量为n时,因变量和自变量所对应的样本观测值矩阵分别为Y=(y1,y2,…,yn)T和X=(xij)n×p。首先,将Y和X中的观测值根据进行标准化处理,即

[JB({][HL(1]X0=((xij-[AKx-]j)/sxj)n×p

Y0=((yi-[AKy-])/sy)n×1[HL)][JB)](1)

在此基础上求X0和Y0关于t1回归方程:

[JY]X0=t1p1+X1,Y0=t1r1+Y1(2)

其中X1=X0-t1p1和Y1=Y0-t1r1分别为两个回归方程的残差矩阵。对其收敛性进行检验。若回归方程已达满意的精度,则进行下一步。若没有达到满意的精度,则令X0=X1,Y0=Y1,按照式(2)的方法,对其进一步提取主成分,并进行回归分析。

若在第m次提取主成分和进行回归分析完成后,通过了收敛性的检验,则说明我们提取的相关主成分已经达到了要求。将回归结果汇总起来,可以得到Y0关于m个主成分t1,t2,…,tm的回归:

[JY]Y0=r1t1+r2t2+…+rmtm(3)

因为t1,t2,…,tm均为X0的线性组合,所以式(3)可表示成如下形式:

[JY]Y0=r1X0w*1+r2X0w*2+…+rmX0w*m(4)

这里w*h=[DD(]h-1[]j=1[DD)](I-wjpj)wh,I为单位阵。最后有

[JY]Y*=[DD(X]j[DD)]ajx*j,a*j=[DD(X]h[DD)]rhw*hj(5)

这里,w*hj为w*h的第j个分量。最后,将标准化的过程还原,即把Y*乘以标准差,加上均值。即可得到Y对X的回归方程。这样,原始的变量y关于因素x1,x2,…,xk的回归方程即可得到。

23变量投影重要性指标

为了测量每个自变量对因变量的解释作用,这里用变量投影重要性指标来度量每一个自变量对因变量集合的解释能力。这里,第j个自变量的变量投影重要性指标的定义如式(6)所示:

VIPj=[KF(](k[DD(X]h[DD)]Rd(y,th)w2hj)/[DD(X]h[DD)]Rd(y,th)[KF)],j=1,2,…,k(6)

其中Rd(y,th)=r2(y,th)反映y由主成分th解释时的变异精度,代表th对y的解释能力,[DD(X]h[DD)]Rd(y,th)则代表t1,t2,…,tm对y的累计解释能力,r(y,th)为y与th的相关系数。

24数据来源

本文选取吉林省2000—2014年的电力需求量及其10个影响因素的数据,利用基于偏最小二乘回归和模糊时间序列的预测分析方法进行实证研究,数据来源于中国统计年鉴和吉林省统计年鉴。

3结果分析

31影响因素的多重共线性诊断endprint

对电力需求与其相关影响因素中的数据进行相关性分析,得到吉林省电力需求和10个影响因素之间的相关系数如下表:根据相关系数的绝对值大于07的原则,存在显著的相关关系的包括吉林省的电力需求量与其影响因素之间,另外,也包含各影响因素之间。

由表2可以看出,根据相关系数的绝对值大于07的原则,存在显著的相关关系的包括吉林省的电力需求量与其影响因素之间,另外,也包含各影响因素之间。由表3可知,自变量的方差膨胀因子均大于10,可以看出,各影响因素指标之间存在严重的多重共线性,所以需要通过偏最小二乘的方式构建回归模型。

32偏最小二乘回归主成分和回归方程的确定

利用SIMCA-P软件,对表1中的数据进行偏最小二乘回归分析,得到第一主成分对电力需求的解释能力达到了0983017,达到了较高的精度。另外,也得到吉林省电力需求与10个自变量的标准化偏最小二乘回归模型:

[AKy^]=01027[AKx^]1+01036[AKx^]2+01024[AKx^]3+01026[AKx^]4+01033[AKx^]5+00968[AKx^]6+01014[AKx^]7+01027[AKx^]8-01040[AKx^]9-00952[AKx^]10

按照标准化的逆过程,将y*和x*分别乘以其标准差,加上均值。便可将偏最小二乘回归方程进行还原,得:

y=-15473+000335x1+003533x2+000596x3+000971x4+00023x5+02512x6+05838x7+00039x8-336138x9-552265x10

从回归结果来看,国内生产总值(x1)、第一产业(x2)、第二产业(x3)、第三产业(x4)、城镇居民人均可支配收入(x5)、城镇人口(x6)、总人口(x7)和居民消费水平(x8)这八个因素都对吉林省电力总需求有正向影响,这说明吉林省的经济发展、产业结构的改变、人口的增加都增加了电力的需求。城镇人口数量(x6)的系数为正值,说明了农业人口转变为城镇人口增加了对电力的需求,即吉林省的城镇化进程促进了吉林省的电力消耗。单位GDP能耗(x9)和二氧化碳排放量(x10)两个指标与电力需求负相关,说明了节能减排和经济结构转型,可以适当减轻全社会对电力的需求。

图1t[1]/u[1]平面分布

另外,绘制t[1]/u[1]的平面圖,如图1所示,可见t[1]与u[1]之间存在明显的线性关系。为了进一步分析原始数据有无特异点,我们在提取两个主成分的情况下,画t[1]/t[2]的成分椭圆图,如图2所示,可见无数据点在椭圆外,因此原始数据无特异点。

图2T2椭圆分布

33变量投影重要性指标分析

计算变量投影重要性指标得表4,将其表示成直方图得图3。可以看出,由表4和图3可以看出,变量的投影重要性指标值均大于1的变量包括x9、x2、x5、x8、x1、x4和x3共7个。说明在本模型中,这7个指标是构成吉林省电力需求变化的最重要影响因素。而变量投影重要性指标值皆小于1的包含城镇人口和二氧化碳排放强度这两个变量的。从图中可以看出,变量的投影重要性指标值均大于1的这七个变量的VIP值相差不大,说明吉林省电力需求受这七个因素的综合影响。

图3VIP直方分布

城镇人口数量(x6)的变量投影重要性指标值也超过1,且对电力需求的拉动为正效应,说明了吉林省的城镇化进程,农业人口转为城镇人口,拉动了对电力的需求。二氧化碳排放强度(x10)也对吉林省电力需求有一定的解释作用,对电力需求的拉动作用为负效应。

34回归方程预测效果分析

利用回归方程对2000—2014年吉林省电力需求的数据进行拟合,与电力需求的实际值做比较分析,计算拟合结果的平均绝对百分比误差(MAPE)和均方百分比误差(MSPE),计算结果见表5,实际值与拟合值的比较如图4所示。从预测误差指标可以看出,回归方程预测结果的平均绝对百分比误差和均方百分比误差都在5%以下,效果显著,达到了较高的预测精度。

35吉林省中长期电力需求预测

基于模糊时间序列的影响因素指标预测值如表6所示。在此基础上,根据基于偏最小二乘回归和模糊时间序列的预测方法对吉林省“十三五”期间以及未来更长时间的用电量进行预测分析,结果见表7。

4结论

本文结合最小偏二乘法和模糊时间序列法对吉林省中长期的电力需求进行了预测分析。分析发现,从2015年到2030年,吉林省电力需求上升293%,上升较为平缓。电力需求增长主要受GDP、产业结构和城市化推进的影响,同时,节能减排政策对电力需求影响较大。在我国推进产业结构升级和发展低碳经济的背景下,吉林省应结合自身风力资源丰富和煤炭短缺的特点,大力发展清洁能源。

参考文献:

[1] 李艳梅,孙薇多元线性回归分析在用电量预测中的应用[J].华北电力技术,2003(11):40-41

[2] 耿艳,韩学山,韩力基于最小二乘支持向量机的短期负荷预测[J].电网技术,2008,32(18):72-76

[3] 罗国东基于改进电力弹性系数法的负荷预测[J].陕西电力,2013,41(6):46-48

[4] Akay D,Atak MGrey Prediction with Rolling Mechanism for Electricity Demand Forecasting of Turkey[J].Energy,2007,32(9):1670-1675

[5] 雷绍兰,孙才新,周湶,等电力短期负荷的多变量时间序列线性回归预测方法研究[J].中国电机工程学报,2006,26(2):25-29

[6] 谭忠富,张金良,吴良器,等中长期负荷预测的计量经济学与系统动力学组合模型[J].电网技术,2011(1):186-190

[7] 何晓萍,刘希颖,林艳苹中国城市化进程中的电力需求预测[J].经济研究,2009(1):118-130

[8] 王庆露,葛虹基于协整理论和干预分析的中国电力需求预测[J].数理统计与管理,2007,26(5):753-758

[9] 汪克亮,杨力电力需求的非线性回归组合神经网络预测研究[J].计算机工程与应用,2010,46(28):225-227

[10] 于松青,林盛基于偏最小二乘回归的山东省电力需求预测分析[J].干旱区资源与环境,2015,29(2):14-20endprint