APP下载

基于LMD 与GA-BP 神经网络组合的短期风速滚动预测方法

2019-12-11张廷忠张庆辉马晓伟

山东电力技术 2019年11期
关键词:乘积分量风速

张廷忠,张庆辉,邢 强,马晓伟

(1.国网山东省电力公司潍坊供电公司,山东 潍坊 261000;2.东南大学 电气工程学院,江苏 南京 210000;3.国网山东省电力公司烟台供电公司,山东 烟台 264000)

0 引言

风能因其具有经济竞争力和环境友好的特性,目前已成为增长最为迅速的可再生能源。随着我国风电规模化和集群化的发展,风电并网对电网安全稳定运行、调度规划等产生重要影响[1-2]。

然而,风速受纬度、海拔、地形、气压、温度等因素影响,具有很强的随机性和波动性,风速的间歇性和不确定性容易造成风力发电“有风无电、无风无电”现象,给风力发电的发展带来了挑战。研究表明,采用预测的手段对风电场风速进行预测,继而由风电功率曲线得到风力发电输出功率是一种较为常见的方法[3]。国内外对于短期预测方法的研究主要分为传统方法和现代智能方法[4]。传统的方法主要是基于数理统计的时间序列分析方式,如回归分析法[5]、Kalman 滤波方法[6]、自回归滑动平均(ARIMA)方法[7]、指数平滑预测方法[8]等。而风速数据具有非平稳和非线性的特征,上述方法都是基于线性分析,虽然具有算法简单的优点,但不适用于非线性和非平稳序列的预测处理。现代智能方法包括专家系统法[9]、基于模糊逻辑法[10]以及人 工神经网络方法[11],然而这些单一方法在分析预测问题时无法达到理想的预测精度。因此,为了提高预测性能和消除单一模型预测的局限性,提出了采取组合模型的预测方法[12]。其中,经验模态分解(Empirical Mode Decomposition,EMD)[13]因其简单高效且分解过程具有自适应性被引入到预测领域。基于EMD 的组合预测法可以根据信号自身局部特征,将非线性和非稳态的原始信号自适应分解成一系列平稳化的固有模态函数(Intrinsic Mode Function,IMF),然后对IMF 分量运用(Supp ort Vector Machine,SVM)、BP 神经网络(Back Pro pagation Neural Network,BPNN)以及极限学习机(Extreme Learning Machine,ELM)等机器学习方法进行建模,可以大幅提高预测效果。

但在大量的工程运用中发现分解过程中的EMD 方法存在一定的模态混叠效应,且通过反复迭代方式筛选IMF 分量计算耗时较长。为了抑制模态混叠对特征参数提取造成的影响[13],文献[14]提出了集总平均经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)算法,通过对原始信号加入辅助的高斯白噪声再进行EMD 分解,虽然缓解了EMD 分解过程中的模态混叠效应,但该方法存在端点效应,在分量筛选过程中容易对数据造成“污染”。文献[15]提出了局部均值分解(Local Mean Decomposition,LMD)方法,对端点效应带来的影响进行分析,采用滑动平均方式取代原始EMD 方法中的三次样条插值筛选均值曲线的方法,避免出现端点现象且迭代过程更快,提高了算法运算效率。

针对上述问题,自适应信号处理部分采用LMD方法进行分解,建模部分采用遗传算法(Genetic Algorithm,GA)优化BP 神经网络的模型,提出LMD 与GA-BP 组合预测模型对风速进行滚动预测。首先,对原始风速数据进行LMD 分解,得到一系列乘积函数,其次对乘积函数分量提取瞬时幅值和瞬时频率的特征参数,通过频率门限阈值对乘积函数进行筛选,分成高、中、低3 个频段,然后采用GA 进行优化确定BP 神经网络的连接权值和阈值参数,将3 个频段分量输入到确定的GA-BP 模型中,最后建立LMD-GA-BP 滚动预测模型。

1 基本原理

1.1 LMD 原理

LMD 根据信号局部极值特征将非线性、非平稳信号从高频到低频自适应分解成一系列乘积函数之和,其筛选过程类似于二进制高通滤波,具体分解过程如下:

1)计算信号x(t)局部极值点ni,通过式(1)计算相邻极值点的局部均值mi和包络估计值ai。

对局部均值mi与包络估计值ai分别进行滑动平均处理,将相邻的值通过折线相连求得局部均值函数m11(t)与包络估计函数a11(t)。

2)通过式(2)计算调频信号s11(t)。

式中:h11(t)表示第一次迭代筛选的差分量。

3)将s11(t)看作新的信号反复迭代上述步骤,直至s1n(t)在-1 和1 之间时停止循环,可得:

4)将循环迭代中产生的全部局部包络函数相乘,可得包络信号a1(t)。

5)将包络信号a1(t)和纯调频信号s1n(t)相乘,得到第1 个乘积函数分量PF1(t)。

式中:a1(t)为其瞬时幅值;f1(t)为瞬时频率,按照式(7)对纯调频信号s1n(t)求微分得出。

6)将PF1(t)作为新的信号循环步骤1)—步骤5)k 次,求得全部k 个乘积函数分量,则x(t)便分解成k 个乘积函数分量和1 个残余分量uk(t)的和。

1.2 GA-BP 神经网络基本原理

BP 神经网络具有良好的自组织学习能力,它可以实现从输入到输出的任意非线性映射[16]。其原理是按照误差逆传播算法训练的多层前馈网络,传播过程中仅以一个隐含层就可以实现任意的n 维到m维的映射,图1 给出了模型结构。

图1 BP 神经网络模型

如图1 给定的模型所示,x 为输入值,共有n 个输入节点数,y 为输出值,共有m 个输出节点数,连接权值j 表示对第i 个输入层与第j 个隐含层两者神经元之间的连接。同样连接权值k 表示对第j 个隐含层与第k 个输出层两者神经元之间的连接。aj与bk表示阈值,分别对应为隐含层第j 个神经元的阈值与输出层第k 个神经元的阈值。

输入值从输入层、隐含层、输出层逐层传播,用各层连接权值和阈值和激励函数来计算,得到输出层的输出向量。BP 神经网络的输出值与期望值之间的误差自输出层、隐含层、输入层逐层反向传播,沿着误差减小的方向修正各层连接的权值、阈值直至算法收敛,得到满意的误差精度。

由于BP 神经网络需要通过训练建立模型,在训练过程中权值和阈值是建立模型的关键参数。而遗传算法(Genetic Algorithm,GA)具有很强的宏观搜索能力,良好的全局优化性能,用来优化BP 神经网络模型各层之间的连接权值和阈值,解决传统的BP 神经网络算法预测模型容易陷入局部最优、收敛速度较慢的缺点[17]。

GA-BP 神经网络主要包括种群初始化、适应度函数、选择、交叉和变异操作,其基本流程如图2所示。

图2 GA 优化BP 流程

文献[17]对GA-BP 算法进行了分析,限于篇幅,依据图2 对GA-BP 算法步骤简要介绍如下:

1)根据BP 神经网络确定各层之间的初始连接权值和各层的阈值总数;

2)对GA 算法的初始化种群进行编码,以BP 神经网络训练误差作为适应度函数;

3)通过选择、交叉和变异操作得到种群最佳适应度值,作为神经网络最佳权值与阈值;

4)以最佳权值与阈值进行BP 神经网络训练、预测仿真,直到满足预测误差要求或者达到最大迭代次数结束。

2 LMD 与GA-BP 神经网络的风速预测方法

基于上述分析,建立的LMD 与GA-BP 神经网络的风速预测模型如下:

1)首先对原始风速数据进行LMD 分解,得到一系列乘积函数;

2)对乘积函数分量进行特征提取,计算出各个分量的瞬时幅值A 和瞬时频率f;

3)依据提取的瞬时分量特征,通过给定的阈值门限重构成高频、中频、低频分量以及余项;

4)对重构的分量分别进行GA-BP 神经网络建模预测;

5)最后将预测结果叠加输出最终的预测值,完成整个的预测过程。

图3 为LMD 与GA-BP 神经网络预测模型的具体流程。

图3 基于LMD 与GA-BP 神经网络风速预测流程

3 仿真验证

为了验证所提方法的分解效果,采用式(9)复合扰动仿真信号进行仿真验证,仿真信号y(t)由间断干扰信号y1(t)、调幅调频信号y2(t)和调频信号y3(t)构成。

采样频率fs=500 Hz,采样时长t 为1 s,各分量时域波形如图4 所示。

图4 仿真信号时域波形

首先,将图4 中的仿真信号y(t)进行LMD 分解,同时为了对比分析,图5 同时给出了EMD 与EEMD 方法去除剩余分量的分解结果,其中EEMD的加噪幅值为0.2 SD,集总次数为150 次。

图5 仿真信号EMD、EEMD 和LMD 分解结果

对比分析图5 可知,各个方法都能依据信号自身特点筛选出各个分量,但在间断信号的干扰下,EMD 筛选得到4 条IMF 分量,其中C4为没有意义的剩余分量,对间断分量和调频信号的分解效果较逊,存在一定模态混叠效应;而EEMD 与LMD 方法能够分解得到各自对应的分量,且对高频间断分量y1都存在一定的端点效应,但LMD 方法较于EEMD在调频调幅信号y2的模态混叠效应的抑制上较为理想。

为了进一步量化各个方法的实际分解效果,采用式(10)相关系数CC与式(11)正交系数IO去检验分解性能。

式中:y(t)表示原始信号;Ik(t)为分解得到的分量成分;Ij(t)为剩余分量。

相关系数测试原始信号与分解分量之间的相关性,CC值越高,分量关联度越明显表明分解成分越精确,正交系数用于检测各分量之间的正交性;IO越低表明分解结果频率混叠越小,各分解方法分量的具体评价值如图6 所示。

综合图5 和图6 分析可得,由于LMD 方法在均值曲线拟合时采用滑动平均方式进行筛选,包络均值更接近理想均值,而EMD 与EEMD 都是基于三次样条插值的方式,包络拟合容易造成“欠冲”和“过冲”现象,使得均值拟合误差较大。因此在间断信号干扰下,LMD 具有较好的抗噪性能且分解性能更加稳定,各个分量获得了较高的CC值和较低的IO值,且对低频分量分解效果要优于高频间断分量。

图6 EMD、EEMD 和LMD 方法分解性能对比

其次,为了分析瞬时特征分量的提取效果,图7(a)给出了EMD 方法分解的C3分量经Hilbert 变化结果,图7(b)为LMD 方法PF3分量特征提取结果。

图7 EMD 变换与LMD 方法特征参数提取对比

由图7(a)和图7(b)可以看出,EMD 的C3分量的瞬时幅值和瞬时频率存在较大抖动,且两端发生端点飞翼现象,提取精度较差,而LMD 方法提取的PF3分量抖动现象较弱,与真实的特征值较为接近,因此采用LMD 方法进行特征参数提取,可以提高实测风速分量分辨精确度,为后续GA-BP 神经网络的训练和预测提供前期支撑。

表1 为3 种分解方法的具体性能指标参数,其中,运算耗时指标为上述方法在配置为8 G 内存、3.2 GHz 的i5 处理器及Matlab2014a 运行环境中重复进行100 次试验所消耗时间的平均值。筛选出全部 分 量,EMD 平 均 迭 代25 次,EEMD 迭 代48 次,LMD 迭代21 次。可以得出,EEMD 采用加入高斯白噪声再进行EMD 分解的方式,集总平均消耗了大量的计算时间,而LMD 方法采用的滑动平均方式计算效率最高。

表1 不同分解方法性能评价指标值

4 实测风速数据预测分析

以内蒙古某风电场的实测风速数据对本文所提方法进行验证。考虑到风电出力数据整体趋势大致是相同的,2011-01-04—2011-01-08 数据为公开对比数据,文献[9]、[10]和[18]等也多采用该数据进行实验验证。因此,选取验证数据采集时间为2011-01-04T06∶00∶00—2011-01-08T06∶00∶00,采样间隔为10 min,共采集672 个数据点,实测风速序列如图8 所示。

首先,将图8 中的原始风速进行LMD 分解,分解结果如图9 所示。分析图9 可知,不同的乘积函数分量变换情况反映出风速的不同特征,直观上PF1~PF3存在较大波动性且频率较高,反映出原始风速信号的随机波动信息;PF4~PF6分量频率相对较低且波动较平稳,反映出风速的周期性;PF7分量与剩余分量r 反映了风速的变换趋势。

图8 实测风速时间序列

图9 实测风速LMD 分解结果

其次,将PF1~PF7分量进行特征提取,瞬时幅值A和瞬时频率f 如表2 所示。

结合图9 和表2 分析,依据风速的瞬时频率特征将分解的乘积函数分量划分为高、中、低频3 个频段[18],其中高频段频率大于100 Hz、中频段10~100 Hz 以及低频段低于10 Hz。因此,根据频段划分规则对乘积函数分量进行重构,PF1~PF2为高频段、PF3~PF5为中频段以及PF6~PF7为低频段,各频段重构波形如图10 所示。

表2 各乘积函数分量的瞬时特征值

图10 LMD 分解分量重构结果

最后,分别对不同频段以及剩余分量,分别通过GA-BP 进行建模,其中672 个风速数据点,前372作为训练数据,后300 点作为测试数据,采用提前6步的滚动预测方式,即前6 个数据点预测第7 个数据点,第2~7 个数据点预测第8 个数据点,依次类推。GA-BP 模型主要参数:种群规模100、输入层数为6 层、隐藏层为10 层以及输出层为1 层。将各频段的预测值叠加输出即为预测结果,如图11 所示。

分析图11 可知,将原始无规律波动性较大的非线性非稳态风速数据进行LMD 分解成具有固定频率和周期的乘积函数分量,可以检测出原始风速的周期性和趋势性,再通过建模方式进行预测,预测点对原始数据点具有较强的跟踪性,拟合度较高可以准确有效地输出预测值。为了检测所提方法的预测性能,图12 给出了与其他预测模型的对比结果,其中EEMD 加噪幅值为0.15 SD,集总次数为150 次,GA-BP 参数保持不变。

图11 LMD 与GA-BP 神经网络方法风速预测结果

图12 不同方法风速预测结果对比

最后,为了综合评价各个预测方法的预测性能,引入均方根误差ERMS与平均绝对百分误差EMAP作为性能评价指标。

式中:y(t)为实测数据点,x(t)为建模得到的预测数据点,N 为采样数据点。

表3 给出了各个方法的具体评价值,其中运行时间t 包括分解、训练以及预测的总时间。

综合图12 和表3 可知,总体上,采用先分解后建模的组合预测方法相对于传统的GA-BP 直接预测方式,可以获得较高的预测精度,进一步验证平稳化信号数据分解处理方式的有效性,且各个方法总体运算时间都低于5 min,符合超短期和短期风速预测的要求。同时,LMD 分解获得乘积函数分量模态混叠和端点效应更小,因此通过GA-BP 建模获得最小的EMAP和ERMS,获得较高的预测精度,而由于EEMD 方法辅助加噪方式的存在,因此运算时间较长。

表3 各模型预测性能对比

5 结语

提出LMD 方法与GA-BP 神经网络相结合的短时风速预测模型,可以解决EMD 组合预测方法中分解性能不足的缺点。

通过对组合预测模型分解部分各方法的对比,确定以LMD 方法对原始风速数据进行分解,有效缓解了原始EMD 方法存在的模态混叠和端点效应,且LMD 采用滑动平均方式进行迭代筛选,提高了算法的运算效率。

针对机器学习部分原始BP 神经网络存在容易陷入局部最优、收敛速度较慢的缺点,采用GA 进行优化确定神经网络的连接权值和阈值参数。

建立了LMD-GA-BP 的风速预测滚动模型,通过仿真数据和实测风速数据验证了所提方法能够对风速进行有效预测,预测精度和运算时间达到短时风速预测的效果。

尽管如此,所建立的模型仍有不足之处,LMD 方法在信号分解过程中,对模态混叠和端点效应也只是起到抑制作用,由于原理上仍旧沿用迭代筛选的思路,并未从根源上消除上述问题带来的弊端,而GA-BP 模型存在计算量偏大的缺点。因此,将在下一步研究中进行分析与改进。

猜你喜欢

乘积分量风速
邯郸市近46年风向风速特征分析
乘积最大
基于最优TS评分和频率匹配的江苏近海风速订正
基于时间相关性的风速威布尔分布优化方法
最强大脑
最强大脑
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
论《哈姆雷特》中良心的分量
快速评估风电场50年一遇最大风速的算法