一种快速自适应的用电量数据深度挖掘和决策方法

2016-05-24赖蔚蔚

现代经济信息 2016年9期

摘要：本文针对现有电力网络中数据挖掘处理速度慢、平台兼容性差的问题，提出了一种快速自适应的用电量数据深度挖掘和决策方法，通过判决门限，实现对三种数据挖掘模型的快速选取和使用。实际测试结果表明，新方法有效提升用电量数据挖掘效率，降低决策时延8.6%。

关键词：数据清洗；数据挖掘；灰度；时间序列

中图分类号：TM7 文献识别码：A 文章编号：1001-828X（2016）009-0000-02

一、引言

海量用电数据的实时处理和快速分析是电网与客户能量流、信息流、业务流实时互动的新型供用电关系的基础，为实现市场响应迅速、收费方式多样、服务高效便捷提供重要保障。

灰度模型通过多数据关联分析特定目标的变化趋势，但依赖样本数据，导致预测误差变大；时间序列模型是观测值按照时间次序排列解释与变量的相互关系，其需要采集大量的数据进行验证；回归模型是对统计关系进行定量描述的一种数学模型，其通过采集数据返回对模型修正，准确度高但处理时延大。数据挖掘模型的综合处理性能仍有待提高，电力网络用电量预测的错误率达到30.53%。

针对现有电力网络中数据挖掘处理速度慢、平台兼容性差的问题，本文提出了一种快速自适应的用电量数据深度挖掘和决策方法，通过判决门限，实现对三种数据挖掘模型的快速选取和使用。实际测试结果表明，新方法有效提升用电量数据挖掘效率。

二、用电量数据深度挖掘和决策模型

1.灰度数据挖掘与决策模型

灰色系统将无规律的历史数据累加后，使其变为具有指数增长规律的上升形状数列。常用GM（1，1）模型理论如下：

在用电量分析上，首先采集企业用电量的原始数据，各时刻数列值的逐次累加获得总值，预测该企业下一时间段的用电总量。

灰度模型以多数据关联分析特定目标的变化趋势，只需要较少的数据即可预测目标值，不需收集其他相关数据，处理速度快。但依赖样本数据，以历史来推测未来，不适应外部环境突变容易导致预测误差变大。

2.时间序列数据挖掘与决策模型

时间序列模型是某一个观测值按照时间次序排列解释与变量的相互关系。实际分析企业用电量时，将电量分为两部分，一部分是自然增长（使用时间序列预测），另一部分是容量变更对电量的影响，总体电量基准部分采用holt-winters 乘法模型，则上述公式变换为：

f（t+m）=（Ut+mbt）Ft-L+m+AB（2）

时间序列模型其需要采集大量的数据进行验证，可以预测到较细的数据颗粒度，准确解释电量的周期和季节波动情况，引入了容量的调整。但忽略了当年容量变更的影响，模型比较复杂。

3.回归分析挖掘与决策模型

回归模型是对统计关系进行定量描述的一种数学模型。在实际用电量分析时，根据变量的预测力，其模型分析如下：设因变量为y，k个自变量分别为x1，x2，…，xk，描述因变量y如何依赖于自变量x1，x2，…，xk和误差项ε的方程称为多元回归模型。其一般形式可表示为：