APP下载

一种快速自适应的用电量数据深度挖掘和决策方法

2016-05-24赖蔚蔚

现代经济信息 2016年9期
关键词:时间序列数据挖掘灰度

摘要:本文针对现有电力网络中数据挖掘处理速度慢、平台兼容性差的问题,提出了一种快速自适应的用电量数据深度挖掘和决策方法,通过判决门限,实现对三种数据挖掘模型的快速选取和使用。实际测试结果表明,新方法有效提升用电量数据挖掘效率,降低决策时延8.6%。

关键词:数据清洗;数据挖掘;灰度;时间序列

中图分类号:TM7 文献识别码:A 文章编号:1001-828X(2016)009-0000-02

一、引言

海量用电数据的实时处理和快速分析是电网与客户能量流、信息流、业务流实时互动的新型供用电关系的基础,为实现市场响应迅速、收费方式多样、服务高效便捷提供重要保障。

灰度模型通过多数据关联分析特定目标的变化趋势,但依赖样本数据,导致预测误差变大;时间序列模型是观测值按照时间次序排列解释与变量的相互关系,其需要采集大量的数据进行验证;回归模型是对统计关系进行定量描述的一种数学模型,其通过采集数据返回对模型修正,准确度高但处理时延大。数据挖掘模型的综合处理性能仍有待提高,电力网络用电量预测的错误率达到30.53%。

针对现有电力网络中数据挖掘处理速度慢、平台兼容性差的问题,本文提出了一种快速自适应的用电量数据深度挖掘和决策方法,通过判决门限,实现对三种数据挖掘模型的快速选取和使用。实际测试结果表明,新方法有效提升用电量数据挖掘效率。

二、用电量数据深度挖掘和决策模型

1.灰度数据挖掘与决策模型

灰色系统将无规律的历史数据累加后,使其变为具有指数增长规律的上升形状数列。常用GM(1,1)模型理论如下:

在用电量分析上,首先采集企业用电量的原始数据,各时刻数列值的逐次累加获得总值,预测该企业下一时间段的用电总量。

灰度模型以多数据关联分析特定目标的变化趋势,只需要较少的数据即可预测目标值,不需收集其他相关数据,处理速度快。但依赖样本数据,以历史来推测未来,不适应外部环境突变容易导致预测误差变大。

2.时间序列数据挖掘与决策模型

时间序列模型是某一个观测值按照时间次序排列解释与变量的相互关系。实际分析企业用电量时,将电量分为两部分,一部分是自然增长(使用时间序列预测),另一部分是容量变更对电量的影响,总体电量基准部分采用holt-winters 乘法模型,则上述公式变换为:

f(t+m)=(Ut+mbt)Ft-L+m+AB(2)

时间序列模型其需要采集大量的数据进行验证,可以预测到较细的数据颗粒度,准确解释电量的周期和季节波动情况,引入了容量的调整。但忽略了当年容量变更的影响,模型比较复杂。

3.回归分析挖掘与决策模型

回归模型是对统计关系进行定量描述的一种数学模型。在实际用电量分析时,根据变量的预测力,其模型分析如下:设因变量为y,k个自变量分别为x1,x2,…,xk,描述因变量y如何依赖于自变量x1,x2,…,xk和误差项ε的方程称为多元回归模型。其一般形式可表示为:

B0,B1,B2,…,Bk是模型的参数。

回归模型需要较多的数据,从业务上比较好理解,能估计出各个主要影响因素对其的影响强度。

三、用电量数据深度挖掘和决策模型

针对现有电力网络中数据挖掘处理速度慢、平台兼容性差的问题,提出了一种快速自适应的用电量数据深度挖掘和决策方法,通过判决门限,实现对三种数据挖掘模型的快速选取和使用。

1.神经网络数据处理架构

由于电网数据中心的用电量预测模型具有不同的数据挖掘和预测能力,为了综合三种模型的优点,提升用电量预测模型的预测效率,本文采用神经网络作为模型选择的处理架构。

不同层的神经元之间通过权值进行连接,数据处理架构如图1所示。

2.多模型处理学习过程

其具体步骤如下:

步骤一:从处理决策的三种模型中选定其中一种模型,将用电量数据输入进网络中。

步骤二:计算预测模型的用电量输出和实际测试用电量的误差。

步骤三:从输出层开始进行反向计算,直到第一个隐含层,按照一定原则向着减小误差的方向调整网络中的联接权值。

步奏四:选择其他模型重复以上的步骤,直到总体的训练样本集误差达到给定的要求为止。

3.输出数据决策

假设不同的模型处理下输出值的相关值与预期条件有关,则有预期输出值

y=a1Y1+a2Y2+a3Y3(4)

式中,Y1, Y2, Y3为三种模型的预测值,a1,a2,a3分别为预测模型中所占据的权重值,可由神经网络训练得出。

四、智能用电量决策实例分析

1.测试环境

实验数据选择南方电网惠州供电局2009年至2014年电子等多个行业的用电量预测数据和实际数据。

2.用电量预测偏差分析

选取新模型下,对比三种现有模型南方电网惠州供电局的玻璃行业用电量预测数据如表1所示。

如表1所示,新模型的预测准确率高于现有的三种模型。

3.模型预测时延分析

本模型综合了其他三个模型的优点,在分析数据和预测用电量时,根据学习的行业特征选择最合适和快速的模型,各模型的预测时延分析如图2所示。

如图2所示,随着用电监测项目增加,新模型的预测时延低于现有的三种模型,降低决策时延8.6%。

五、总结

本文针对现有电力网络中数据挖掘处理速度慢、平台兼容性差的问题,提出了一种快速自适应的用电量数据深度挖掘和决策方法,通过判决门限,实现对三种数据挖掘模型的快速选取和使用。实际测试结果表明,新方法有效提升用电量数据挖掘效率,降低决策时延8.6%。

参考文献:

[1]聂倩雯,高玮.基于关联规则数据挖掘技术的电网故障诊断[J].电力系统保护与控制,2009,09:8-14+19.

[2]杨懿,杨洁,聂恬.基于数据挖掘的电网数据智能分析的研究[J].电子技术与软件工程,2014,23:218+224.

[3]谭小野.数据挖掘在电网安全中的应用[J].东北电力技术,2005,08:40-44.

作者简介:赖蔚蔚(1978-),男,广东河源人,硕士研究生,高级工程师,研究方向:电力信息化。

猜你喜欢

时间序列数据挖掘灰度
采用改进导重法的拓扑结构灰度单元过滤技术
基于灰度拉伸的图像水位识别方法研究
基于最大加权投影求解的彩色图像灰度化对比度保留算法
基于并行计算的大数据挖掘在电网中的应用
基于灰度线性建模的亚像素图像抖动量计算
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究