APP下载

电力企业售电量预测比较分析

2017-07-01高迪

海峡科技与产业 2017年6期
关键词:售电量电力数据挖掘

高迪

摘 要:随着产业结构调整、国企深化改革等政策措施的逐步深入,我国经济进入新常态。2015年,我国经济下行压力持续加大,售电市场形势较为严峻,因此售电量预测具有重要意义。本文应用数据挖掘分析方法,充分收集内部、外部数据信息,挖掘分析影响售电量的主要因素。同时,在售电量相关性分析基础上,尝试应用时间序列和神经网络多种分析工具,构建预测模型,预测年度售电量情况,并综合评估各方法优劣。

关键词:电力;售电量;数据挖掘;预测

0 引言

随着产业结构调整、国企深化改革等政策措施的逐步深入,我国经济进入新常态。2015年,我国经济下行压力持续加大,售电市场形势较为严峻,因此售电量预测具有重要意义。

长期以来,诸多学者对月售电量预测的理论和方法做了大量研究,提出了多种各具特点的预测方法。其中,以基于神经网络模型和基于时间序列的回归模型的预测研究最为常见。

神经网络模型通过寻找电量与各影响因素(如经济、人口等)之间的非线性回归关系来进行分析预测,其优点是在不构建确定函数的情况下便可实现回归过程,具有一定的推广能力且预测精度较高。时间序列回归模型是根据电量过去的变化规律建模,预测未来变化的可能性及变化趋势,其优点是简单易行、便于掌握、样本需求量不大且预测精度较高。

本文应用数据挖掘分析方法,充分收集内部、外部数据信息,挖掘分析影响售电量的主要因素。同时,在售电量相关性分析基础上,尝试应用时间序列和神经网络多种分析工具,构建预测模型,预测年度售电量情况,并综合评估各方法优劣。

1 方法

1.1 分析思路

綜合宏观经济政策、产业行业发展、气象等外部数据,以及分类别、分产业用电量、业扩报装等内部数据,应用数据挖掘分析方法,找出影响售电量的内外部因素以及趋势规律特征,采用多种方法构建售电量预测模型,预测2015年售电量完成情况,为运营决策提供参考。

1.2 方法及评估

影响售电量的因素很多且部分因素存在共线性,售电量自身也存在一定的发展波动规律,因此本次研究分别采用时间序列方法、RBF神经网络方法建立售电量模型,并从模型拟合优度、显著性检验、共线性、异方差、相对误差等多个角度出发对模型进行综合评估。

(1)方法一:时间序列

售电量呈现出明显的季节波动性,因此可以选用传统的时间序列模型预测售电量。

(2)方法二:RBF神经网络

RBF网络是以函数逼近理论为基础而构造的一类前向网络,分析速度快,拟合效果优,尤其适合拟合因变量及自变量之间复杂的非线性问题,采用RBF神经网络对售电量与其影响因素的非线性复杂关系进行拟合,以期实现更小的预测误差。

2 数据挖掘分析

2.1 指标选取

本文研究外部数据涵盖宏观经济、景气指数、对外贸易、金融、财政、气温等方面,内部数据涵盖售电量、业扩报装、重点企业用电量等方面,数据时间跨度为2003年12月至2015年6月,共16,532条数据项。

其中,宏观经济数据包括:国内生产总值(GDP)、分行业总产值、分产业增加值、社会消费品零售总额、城镇居民人均可支配收入、固定资产投资额、城镇化率等。

景气指数数据包括:居民消费价格指数(CPI)、采购经理指数(PMI)、工业品出厂价格指数(PPI)、商品零售价格指数、分行业出厂价格、重要生产资料价格(含煤炭、螺纹钢、铝、铜、燃料油、铅、线材、锌)等。

对外贸易数据包括:进出口总额、出口总值等。

金融数据包括:货币供应量(含M2、M1)、国内信贷、金融存款(含存款金额、新增金额、存款余额)、境内上市总市值及总资本、股票成交金额及数量、上证所及深交所开户交易信息(含上市、上市证券、股票股本、股票市值、投资开户、市盈率、成交金额信息等)、保险收入、赔付金额、保险资金运用余额、保险营业费用等。

财政数据包括:财政收支差额、公共财政支出、中央本级财政支出、地方财政支出、分类别公共财政支出、公共财政收入、税收收入等。

气候数据包括:经营区各省会城市平均温度等。

2.2 指标与售电量相关系数

通过分类的Pearson相关性分析,根据相关性判断原则,可以发现: GDP、城镇化率与售电量及各分类售电量均强相关,相关系数均高于0.9;除共性影响因素外,工业售电量与可支配收入、第二产业增加值、进出口总值强相关;非居民售电量及居民售电量与可支配收入强相关;农业售电量与固定资产投资、新装增容农业户数相关程度较高;商业售电量与可支配收入强相关,与新装增容户数容量相关程度较高。

3 模型构建及评估

基于相关性分析结果,确定因变量及自变量的时间维度、指标维度如下:

(1)数据时间跨度

本次建模数据包括月度、季度和年度三个时间维度。其中,月度数据包括2005年1月至2015年6月共126个月;季度数据包括2005年1季度至2015年2季度共42个季度;年度数据包括2003年至2014年共12年。

(2)数据指标选取

月度、季度数据包括:售电量及分类别售电量、高耗能行业用电量及占工业用电量比重、化学原料及化学制品制造业用电量、非金属矿物制品业用电量、黑色金属冶炼及压延加工业用电量、有色金属冶炼及压延加工业用电量、国内生产总值、社会消费品零售总额、商品零售价格指数、全国居民消费价格指数、工业出产者出厂价格指数、城镇居民可支配收入、平均温度等。

年度数据包括:售电量、四大高耗能用电量、四大高耗能用电量占工业用电量比重、GDP、分产业增加值占比、城镇化率、城镇人口数、固定资产投资、平均温度等。

3.1 时间序列法

首先对售电量进行平稳性处理,通过自相关和偏自相关图来决定ARIMA模型的参数,最终模型为ARIMA(1,1,2)(1,1,2)。

模型R方为0.988,说明拟合模型可以解释原序列98.8%的信息量;标准化BIC值为8.613,较小。按照时间序列法预测模型预测,预计2015年售电量完成34,899亿千瓦时,同比增长0.75%。

从2005年1月至2015年7月各月售电量实际值与估值对比情况看,模型较好的拟合了售電量的波动趋势,实际值与预测值之间的误差基本控制在3%以内,2005年以来的误差控制在1%左右,平均相对误差仅为1.31%,最高相对误差为3.81%,最低相对误差为0.16%。模型拟合效果图详见图1。

3.2 RBF神经网络法

(1)自变量选取

RBF神经网络需要设置隐含中心层数,历史数据只有12条记录,因此自变量不宜选择过多,根据前文分析,经过反复训练模型,最终选取自变量GDP、高耗能用电量、气温、城镇化率。

按照RBF神经网络预测模型预测,2015年售电量预计完成35,279亿千瓦时,同比增长1.6%。

(2)拟合效果

从历史上12年售电量实际完成值与模型估值对比情况看,预测平均误差仅为0.78%,模型较好的拟合了售电量的波动趋势,实际值与预测值之间的误差基本控制在1%左右,2015年以来的误差控制在1%以内。平均相对误差为0.77%,最高相对误差为1.38%,最低相对误差为0.03%,预测准确度高(拟合效果详见图2)。

3.3 模型评估

按照时间序列法、RBF神经网络法预测模型,预测2015年售电量分别为34,899亿千瓦时和35,279亿千瓦时,同比增速分别为0.75%、1.6%,两类预测方法预测结果差异较大。

为了对2015年售电量两种方法的预测结果进行客观评估,首先对售电量、经营区用电量、全国用电量、GDP进行对比分析:

(1)售电量、经营区用电量、全国用电量、GDP发展趋势一致,呈现正向强相关关系;

(2)2004—2014年,售电量、经营区用电量、全国用电量三者历年同比增速波动规律非常相似,且与GDP增速波动一致;但近3年全国用电量增速明显放缓,由高速转为中速发展,电力消费弹性系数由2004年的1.1降为2014年的0.4;

(3)经营区全社会用电量与全国全社会用电量发展趋势一致,但占比呈现下降趋势,已由2004年的0.798降为2014年的0.790。

综合分析,我国2015年GDP增长目标设为7%,较2014年下调0.5个百分点,2014年电力消费弹性系数为0.4,全社会用电量增速将在3%左右,由于经营区用电占比下降,2015年经营区全社会用电量增速将低于3%。

同时,由于售电量与经营区用电量强相关,且售电量增速下滑速度较快,因此售电量增速将远低于3%。

4 结论

4.1 售电量与GDP、城镇化率呈强相关关系

经分析发现,GDP、城镇化率与售电量呈强相关关系,相关系数高于0.94。除GDP、城镇化率等共性影响因素外,工业售电量与可支配收入、第二产业增加值、进出口总值强相关,相关系数分别为0.94、0.94、0.91;非居民售电量及居民售电量与可支配收入强相关,相关系数分别为0.95、0.96;农业售电量与固定资产投资、新装增容农业户数相关程度较高。其中,与固定资产投资相关系数为0.81,与滞后1个月的新装增容农业户数变化趋势基本一致,相关系数为0.8;商业售电量与可支配收入强相关,相关系数为0.9;与滞后8个月的新装增容户数变化趋势基本一致,相关系数为0.82。

4.2 RBF神经网络模型预测售电量效果更佳

相较于已有预测方式,本次售电量预测充分收集售电量内外部影响因素数据信息,应用数据挖掘分析方法,通过售电量相关性分析,选取与售电量相关性高的因素作为预测模型的输入变量;基于相关性分析结果,在模型中纳入GDP、可支配收入、高耗能用电占比、城镇化率、温度、第二产业增加值占比等自变量,考虑了经济增速放缓、人民生活水平提高、产业结构调整、高耗能转移、温度等多方面影响因素;引入季节虚拟变量,剔除了季节因素影响,分析因变量与自变量发展的长期趋势;分别采用时间序列、回归预测、神经网络等多种方法构建预测模型,密切结合经济现状和业务现状,以电力弹性系数等指标进行校核,综合评估不同预测方法的预测结果。

经模型评估发现,采用偏最小二乘回归法和时间序列法,预测结果偏差较大,平均相对误差为2.32%和1.31%;采用RBF神经网络法,预测值与实际值平均相对误差仅为0.77%,预测结果偏差较小。RBF神经网络法能有效避免售电量中季节周期分量和随机分量对趋势分量预测的干扰,相对于时间序列法和偏最小二乘回归法对售电量序列直接建模预测的方法,RBF神经网络法具有更高的预测精度。

猜你喜欢

售电量电力数据挖掘
探讨人工智能与数据挖掘发展趋势
气温及抄表时间对售电量的影响
基于并行计算的大数据挖掘在电网中的应用
结合X12乘法模型和ARIMA模型的月售电量预测方法
电力变压器高压试验探讨
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究
电网月度统计线损率波动的原因分析及对策
家电下乡农村用电增长16.99%