APP下载

数据降维和特征分析的GOA-LSSVM短期负荷预测

2019-12-20邹仕富李嘉周毛启均宋明军

实验室研究与探索 2019年11期
关键词:蝗虫维和精度

邹仕富,李嘉周,毛启均,宋明军

(1.国网四川省电力公司,成都 610041; 2.国网四川省电力公司 信息通信公司,成都 610041;3.四川中电启明星信息技术有限公司,成都 610041)

0 引 言

随着智能电网和物联网技术的快速发展,电力负荷数据呈指数级增加,数据规模和维度日益复杂,形成海量电力负荷。针对短时电力负荷预测,很多学者进行了广泛研究和探索,提出了很多预测方法,主要包括线性预测方法和非线性预测方法。前者包括多元线性回归和时间序列方法[1-2],这些方法只能刻画描述交通流量的基本变化趋势,难以对交通流量进行精确预测;后者包括灰色模型、神经网络、小波模型和支持向量机等[3-7],尤其最小二乘支持向量机(Least Squares Support Vector Machine,LSSVM)实现SVM的改进,克服神经网络的小样本、过度拟合和“维数灾难”等缺点,具有很强的泛化预测能力,因此被广泛地应用于电力负荷预测领域。

由于影响电力负荷的气象因子较多,导致输入空间维数过高以及影响因素之间的相关性,影响负荷预测的计算效率和预测精度。蝗虫优化算法[8](Grasshopper Optimization Algorithm,GOA)具有收敛速度快、精度高和计算简单等优点,目前应用于参数优化[9]、特征选择[10]以及振动故障识别[11]等。目前,GOA算法尚未发现应用于短期电力负荷预测的文献。为了提高负荷预测精度,消除多气象因素之间的相关性和剔除冗余,本文提出一种数据降维和特征分析的GOA-LSSVM的负荷预测方法。研究结果表明,与GOA-LSSVM和LSSVM相比,本文算法可以有效提高负荷预测精度。

1 蝗虫优化算法

蝗虫个体位置的更新由种群交互力、重力和风力影响综合决定,其位置更新公式为[12]:

Xi=Si+Gi+Ai

(1)

式中:Xi表示蝗虫群体中第i个蝗虫的位置;Si表示第i个蝗虫受到的与其他蝗虫的交互力的影响;Gi表示第i个蝗虫受到的重力影响;Ai表示第i个蝗虫受到的风力影响。考虑环境因素的随机影响,式(1)可修正为

Xi=r1Si+r2Gi+r3Ai

(2)

式中:r1、r2、r3分别为处于[0 1]之间的随机数;交互力影响

(3)

s(r)=fe-r/l-e-r

(4)

f表示吸引强度;l表示吸引尺度;r表示舒适距离。

(5)

为实现优化问题的求解,Saremi等提出如下数学模型:

(6)

(7)

cmax=1,cmin=10-5;t、Tmax分别表示当前迭代次数和最大迭代次数。

2 最小二乘支持向量机

(8)

式中:ω为权重;C为LSSVM的惩罚参数;ξi为LSSVM的松弛变量;φ(x)为空间映射函数;b为LSSVM的偏差。因此,LSSVM的Lagrange函数L可表示为[14]:

(9)

式中,ai表示Lagrange乘子。对式(9)求偏导:

(10)

消去ω和ξi,可得:

(11)

式中,Q=(1,…,1)T;A=(a1,a2,…,am)T;Y=(y1,y2,…,ym)T,通过求解式(11),LSSVM模型的估计公式为:

(12)

式中:

K(x,xi)=exp{-||x-xi||2/(2g2)}

3 数据降维和特征分析

数据降维和特征表示的主要目的是剔除冗余,提取数据的主要特征信息,尽量用最少的信息反映原始数据的主要信息,从而提高数据挖掘效率。一般地,数据特征越多,数据包含的信息越多越丰富,然而在某些情况下,这些特征之间可能存在潜在的冗余,因此进行数据降维和特征表示具有重要意义。目前数据约简和降维的方法有很多[15-17],如主成分分析(Principle Components Analysis,PCA)、离散小波变换(Discrete Wavelet Transform,DWT)、奇异值分解(Singular Value Decomposition,SVD)、流形学习(Manifold Learning,ML)等,本文选择PCA进行负荷影响因素数据降维和特征表示。

假设m×n维数据样本:

当n较大时,所研究问题的复杂程度和计算难度会随着n的增加而增大,PCA具体过程描述如下:

(1)数据标准化。数据标准化公式为

(13)

(2)建立协方差矩阵R。计算特征值L和特征向量A,

(3)确定主元数。主成分贡献率和累计贡献率分别为:

(16)

(17)

4 基于PCA和GOA-LSSVM的负荷预测

4.1 GOA-LSSVM目标函数

针对LSSVM预测效果受参数组合C和g的选择影响,运用GOA算法优化选取LSSVM模型的最优参数组合,GOA-LSSVM的目标函数表示为:

(18)

4.2 算法流程

基于PCA和GOA-LSSVM算法的负荷预测算法流程具体描述如下:

Step1输入负荷影响因素数据和负荷数据,运用PCA提取对负荷影响因素数据进行数据降维和特征表示,剔除冗余;

Step2GOA算法参数初始化:蝗群的种群规模N、最大迭代次数T、变量维数d=2以及优化变量的取值范围[LBUB],C和g的取值范围分别为[10 100]和[0.01 10.00];

Step3随机初始化生成蝗群位置;

Step4根据目标函数式(18)计算蝗群个体的适应度,同时找出当前全局最优解的位置将其作为目标位置;

Step5根据式(1)更新搜索个体位置;

Step6判断算法是否达到终止条件。判断算法是否达到最大迭代次数T,若满足,则输出LSSVM最优参数进行预测;反之,返回Step 4。

基于PCA和GOA-LSSVM算法的负荷预测流程如图1所示。

图1 基于PCA和GOA-LSSVM的负荷预测流程图

5 实例分析

5.1 评价指标

为综合比较不同模型的负荷预测性能,选择平均绝对百分误差(MAPE)和均方根误差(RMSE)作为评价指标。

5.2 数据来源

为了验证本算法进行负荷预测的有效性,选择欧洲智能技术网络(European Network on Intelligent Technologies,EUNITE)组织的2018-07-15~2018-07-25的短时负荷数据为研究对象[18-19],其中1 d间隔1 h采集1点电力负荷数据,电力负荷数据如图2所示。

图2 电力负荷图

5.3 结果分析

影响负荷的影响因素分别为温度、湿度、风速、降水量、气压和SO2浓度,运用PCA确定主元数和特征表示,PCA处理结果如图3和图4所示。

图4 累计贡献率

由图3和4可知,SO2浓度、降水量和温度3个主元贡献率分别为42%、23%和21%,3个主元的累计贡献率超过85%,因此本文选择SO2浓度、降水量和温度作为负荷预测输入。为了证明本文算法GOA-LSSVM进行负荷预测的优越性,将其与GOA-LSSVM和LSSVM进行对比,结果如图5、6和表1所示。

结合图5、6和表1不同算法进行负荷预测结果可知,在RMSE和MAPE 2个评价指标上,与GOA-LSSVM和LSSVM相比较,PCA+GOA-LSSVM的预测精度最高;GOA-LSSVM的预测精度其次;LSSVM的预测精度最差。通过对比可知,本文提出的算法PCA+GOA-LSSVM可以有效提高短时负荷预测的精度,效果较好,为短时负荷预测提供新的方法。

表1 不同算法结果对比

6 结 语

为了提高负荷预测精度,消除多气象因素之间的相关性和剔除冗余,提出一种基于数据降维和特征分析的GOA-LSSVM的负荷预测方法。通过PCA数据降维和特征表示可以消除数据冗余和影响因素之间的相关性,简化了负荷预测模型的复杂程度,提高了预测模型的速度。研究结果表明,与GOA-LSSVM和LSSVM相比,本文算法可以有效提高负荷预测精度,有效确定影响负荷的主要影响因素,效果较好。

猜你喜欢

蝗虫维和精度
你真的认识蝗虫吗
热连轧机组粗轧机精度控制
维和亲历记
都2020年了,人类为啥还拿蝗虫没辙?
超高精度计时器——原子钟
人多势众的蝗虫
分析误差提精度
基于DSPIC33F微处理器的采集精度的提高
维和女兵
蝗虫