APP下载

基于CEEMD和机器学习算法的短期风速组合预测

2021-12-14常雨芳段群龙李金榜

实验室研究与探索 2021年10期
关键词:分量风速神经网络

常雨芳,段群龙,陈 润,李金榜,吴 锋

(湖北工业大学太阳能高效利用及储能运行控制湖北省重点实验室,武汉 430068)

0 引言

全球经济与社会的快速发展,使石油等一次性能源供应与环境保护之间的矛盾日益突出,同时也加速了传统能源危机的爆发[1]。风能作为一种清洁环保的可再生能源,越来越受到世界各国青睐[2-3]。随着科学技术的提高,国家能源战略也越来越多地向水能、风能等清洁能源方向调整,“三型两网,世界一流”建设战略的提出,将大力推动我国能源产业的高质量和可持续发展。伴随风电并网规模的不断增加,风速的不确定性及非线性等特征对电力系统的稳定运行造成很大压力,风速的提前准确预测是解决这一问题的重要手段,可为风电场的运行、自动发电控制(AGC)和智能电网控制(AVC)提供必要信息,提高风电竞价上网能力[4-5]。

国内外学者为提高风速预测的准确性和有效性,进行了大量研究。按照预测模型的不同,风电场的风速预测方法可大致分为物理方法、统计方法和智能学习方法[6-8]。物理方法需要依靠详细的天气预报、环境因素信息,如温度、湿度、压强等数据进行预测,需要大量且复杂的计算过程;统计方法基于历史风速时间序列建立统计数学模型进行外推预测,以获得较好预测效果;智能学习方法是近年来在风速预测上应用较多的技术,如人工神经网络及优化算法在内的先进方法在许多领域引起广泛关注[9]。

为进一步提高预测精度,优化预测模型,常常辅助数据分解技术降低风速序列复杂度与非平稳性。常见的数据分解方法,如小波变换(Wavelet Transform,WT)、经验模态分解(Empirical Mode Decomposition,EMD)、集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD)等,都可以从原始数据中获取信息趋势。Zhang等[11]运用WT对风速时间序列进行分解,使用布谷鸟搜索算法优化小波神经网络对各子序列进行拟合,通过重构数据获得不错的预测结果。朱亚等[12]将风速数据经EMD 分解获得基本模态分量,利用广义回归神经网络进行预测,对各分量预测数据进行概率统计,输出最佳预测结果。章国勇等[13]运用EEMD技术对风速数据分解,并用细菌觅食算法优化最小二乘支持向量机模型建立预测模型,得到较高的风速预测结果。但WT分解技术对小波基函数的选择较为困难,EMD存在端点效应和模态混淆现象,EEMD通过向序列中加入多组高斯白噪声,消减模态混叠问题,也会残留噪声,使序列存在虚假成分信息[14-16]。完备总体经验模态分解(Complementary Ensemble Empirical Mode Decomposition,CEEMD)由Yeh等[17]在EMD和EEMD的基础上得到的一种改进型数据预处理方式,该方法在待分解信号中加入若干组成对的正负白噪声信号,具有良好自适应性,有效抑制EMD 方法中模态混叠现象,同时也降低了EEMD方法中辅助噪声残余,对于非线性和非平稳性风速数据,是一种较好的预处理方式。

基于风速数据的特征出发,提出一种适用于短期风速预测的先进组合模型(CEEMD-ANNs-LSSVM)。通过CEEMD数据分解技术把原始风速数据分解成几个本征分量(Intrinsic Mode Function,IMF);针对IMF1分量频率高、非线性强的特点,利用组合神经网络(BPNN、GRNN、ENN、WNN)处理非线性数据、进行自适应调整,建立预测模型,其他分量(IMF2~IMFn 和Res)使用LSSVM进行预测;使用灰狼优化算法对组合模型的权系数进行优化,使组合模型输出高精度、高稳定性的仿真结果。

1 原始风速时间序列分解

采用时频域分析方法对原始数据进行预处理,较好地解决非线性、非平稳性数据对预测结果的影响,但对原始信号数据进行时频域分析时,往往会出现方法不稳定、结果不完备等问题。通过对EMD 和EEMD信号分解方法的改进,使CEEMD 技术在原始数据预处理阶段得到优秀表现。CEEMD 方法的结构图如图1 所示。

图1 CEEMD结构图

CEEMD的基本步骤:

步骤1在原始时间序列Y(t)中加入正辅助噪声信号(t),得到正噪声的合成信号:

步骤2在原始时间序列Y(t)中加入负辅助噪声信号(t),得到负噪声的合成信号:

步骤3对式(1)、(2)处理后得到的合成信号通过EMD进行分解,得:

步骤4重复步骤1~3,得到n组IMF分量和和。其中,要求每次加入的辅助白噪声序列不同。

步骤5计算每次分解结果的平均值,得到最终的重组分量和残余分量:

2 短期风速预测模型构建

原始风速数据的预处理包括剔除异常数据和修正错误数据等,摈除数据采集时产生的误差。对经预处理后的数据进行CEEMD分解,得到IMF1~IMFn及剩余分量Res,有效避免端点效应和残留噪声对实验结果的影响。分解得到的高频分量使用非线性神经网络预测,其余分量则采用灰狼算法优化的最小二乘支持向量机进行预测。为使实验结果更加准确,引用交叉验证、灰狼优化算法,提高预测精度。本文中,采用10次实验取平均值的方法验证模型的性能。组合预测模型的流程如图2 所示。

图2 组合预测模型流程图

2.1 非线性组合神经网络

人工神经网络(Artificial Neural Network,ANN)是一种模拟人脑神经网络而建立的一种信息处理系统,以期望实现类人工智能的机器学习技术。在ANN中,神经元是ANN的基本组成单元,各神经元之间的连接称为权重,通过调节权重的方法,达到处理信息的目的。ANN广泛应用风速数据预测、功率预测等领域,善于执行数据的非线性特性[18]。

因单一的神经网络预测模型存在各种固有缺点,难以捕捉非线性较强,波动较大的信号趋势,为能达到更高的精度和更广的预测范围,组合单一预测模型的优点,使用4 种非线性神经网络对IMF1进行组合预测。各神经网络的输入层和输出层节点个数都设置为5和1,隐藏层数经多次试验确定,其他试验参数如表1 所示。

表1 不同神经网络的试验参数

反向传播神经网络(Back Propagation Neural Network,BPNN)是一种多层前馈神经网络,也是最基础的全局逼近网络。BPNN使用梯度下降算法对网络中的各权值进行更新,实现输入、输出的非线性映射。BPNN由图3(a)所示的输入层、隐含层和输出层构成。

广义回归神经网络(General Regression Neural Network,GRNN)是一种前向传播且不需要反向传播求模型参数的新型网络,具有良好的非线性逼近性能。网络结构与RBF 神经网络相似,是RBF 神经网络的一种变形形式。GRNN由图3(b)所示的输入层、模式层、求和层和输出层构成。

Elman神经网络(Elman Neural Network,ENN)是一种动态反馈神经网络,连接值权可以进行学习修正。ENN结构的主要特点是有一个上下文层响应隐藏层的输出,称为承接层或关联层。作用是通过连接记忆,将上一个时刻的隐藏层状态连同当前时刻的网络输入一起作为隐藏层的输入,增强了网络的全局稳定性。ENN由图3(c)所示的输入层、隐藏层、承接层和输出层构成。

图3 4种神经网络的基本结构

小波神经网络(Wavelet Neural Network,WNN)是由小波变换和神经网络相结合的松散型神经网络。激活函数是一个神经元及网络的核心,WNN将神经网络中隐藏层的激活函数(Sigmod函数),替换成小波基函数,使WNN中输入层到隐藏层的权值及激活阈值,相应地由小波函数中尺度伸缩因子和时间平移因子代替,使WNN 收敛速度快、不易陷入局部最优。WNN的基本结构如图3(d)所示。

2.2 最小二乘支持向量机

最小二乘支持向量机(Least Squares Support Vector Machines,LSSVM)以二次损失函数为经验风险,代替了支持向量机(Support Vector Machine,SVM)中采用的二次规划方法,把SVM中非等式约束条件转化为等式约束。与SVM 相比,LSSVM 简化了模型复杂性,提高了计算效率与预测精度。

式中:ω为特征空间中权系数向量;b为偏差。依据结构风险最小化原则,LSSVM 用于回归任务时,优化目标表示为:

式中:ξ≥0 为正则化参数;ei为误差变量。

利用Lagrange 乘子法和KKT 条件求解上述优化问题:

式中:αi为对应xi的Lagrange 乘子,对式(7)中ω,b,ei,αi变量别分进行求偏导,并使导数为零:

通过如下等式求解α和b:

式中:E=[1,1,…,1]T为单位矩阵;y=[y1,y2,…,yN]T为样本的输出向量;Kij=K(xi,yi)为LSSVM核函数对称矩阵。

对于新样本x,可得LSSVM最终的回归函数:

2.3 非等权叠加综合优化

传统的叠加方式是以相等的权重进行计算,获得叠加信号,称为等权叠加。

式中:ki(j)为第i个信号;Y1(j)为等权叠加信号;j=1,2,…,m为采样总数。

为获得更精确的叠加结果,提高叠加的信噪比,在每个输入信号中添加各自的权值,称为非等权叠加或加权叠加[19]。

式中,βi为权值系数,

本文利用灰狼优化算法(Grey Wolf Optimizer,GWO)寻找组合预测模型的最优权系数,建立基于GWO的风速预测变权组合预测模型。灰狼优化算法相比传统粒子群优化算法(Particle Swarm Optimization,PSO)、遗传算法(Genetic Algorithm,GA)等智能优化算法,具有收敛速度快、参数少且寻优精度高等优点。

3 算例分析

3.1 数据处理与预测

以山西某风电场的工业数据为研究案例。以每10 min为一个测量单元,收集了2016-07-01~2016-07-10 该风电场的实时风速,共1 440 组数据。原始风速时间序列如图4 所示。

图4 原始风速时间序列

由图4 中可知,收集的风速变化范围较大,最大风速达到11.48 m/s,最小风速仅为1.01 m/s,原始风速数据存在较强的波动性,序列可预测性比较低。对采样得到的前9 天(共1 296 组)历史风速数据作为训练集,第10 天(共144 组)风速数据作为预测集,并与当天实测风速数据作对比,检测预测效果。为验证本文所提模型的可行性,单一模型和组合模型分别进行10次运算,最后取平均值对预测结果作对比分析。

本文CEEMD 中辅助噪声的偏差值设置为0.2,LSSVM中的正则化参数和核参数的取值范围分别为1~1 000 和0.01~100,设置各优化算法中迭代次数均为500。

图5 为CEEMD 分解图,由图可观察到子序列IMFn波动明显低于原始序列,其中,IMF1频率波动最大,IMF2和IMF3次之,随着序号的升高波动频率逐步降低。对于其余序列的预测,LSSVM 选用不同的核函数,IMF2和IMF3序列波动较大且非线性较高,LSSVM的核函数采用径向基(RBF)核函数。IMF4~IMF10序列和剩余分量Res 波动较缓、频率较低,LSSVM 的核函数采用多项式(PK)核函数。

图5 原始风速时间序列的CEEMD分解

径向基(RBF)函数具有较好的泛化能力和较宽的收敛域,核函数的具体表达式为:

式中,σ为一个自由参数,表示核宽度。

多项式(PK)函数内核适合数据规范化问题,核函数的具体表达式为:

式中:ɑ为可调参斜率;c为常数项;d为多项式指数。

在使用LSSVM进行预测过程中,正则化参数和核函数参数的大小对算法的性能起到非常大的影响,本文使用灰狼优化算法对LSSVM 中的这两个参数进行选择,以避免其参数选择的盲目性与不确定性。

如图6 所示为几种单一预测模型的预测结果。由图6 可见,单一模型容易存在延迟滞后现象,虽然能大致表达风速变化,但预测效果不够理想。

图6 单一模型预测图

如图7 所示为不同分解法的组合模型预测结果图。由图可知,组合模型预测结果明显优于单一模型的预测,ANNs-LSSVM 能够很好地跟踪风速的变化趋势,具有很高的拟合度。

图7 组合模型预测图

3.2 评估标准

为更加全面分析模型的预测效果,利用均方根误差(RMSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)为评估标准对各模型预测精度进行评价:

其中:RMSE为样本的离散程度;MAE 为误差的实际情况;MAPE为误差的总体水平,即预测数据整体上与实际数据较接近。式中:Acti为实际风速值;Prdi为预测风速值,本文中l=144。

7.46、9.13、10.04 和19.38 s。单一BPNN模型运算时间最短,本文所提组合模型计算时间最长,但每个模型的计算时间都在可接受的范围内,可进行项目应用。

表2 为每个模型在进行风速预测时的仿真时间,由表中可知,BPNN、GRNN、ENN、WNN、SVM、LSSVM和ANNs-LSSVM的运算时间分别为6.77、8.10、7.79、

表2 各模型的运算时间

表3、4 为预测模型的预测误差,由对比结果可见,单一预测模型的误差值高于组合预测模型。基于EMD、EEMD和CEEMD分解的模型误差值逐渐减小,说明不同分解方式、对预测结果有影响,EEMD分解优于EMD分解,CEEMD分解更好,有助于预测精度的提高。图8 表示本文所提CEEMD-ANNs-LSSVM 模型预测结果的相对误差图,由图8 可见,在风速突变点上误差值有所增加,但整体上在每一个预测点上的误差值相对较小。结合上文分析可得,CEEMD-ANNs-LSSVM误差值最小,在风速预测中具有更高的精度,预测结果更贴近实际值。

表3 单一模型的预测误差

表4 组合模型的预测误差

图8 CEEMD-ANNS-LSSVM模型相对误差

4 结语

本文利用CEEMD分解技术处理风速时间序列的非平稳性,并给出一种基于非线性组合神经网络与灰狼优化LSSVM相结合的预测模型,对各子序列的预测值进行叠加重构,得到最终的风功率预测结果。通过对模型的仿真分析,结果表明:

(1)CEEMD能够较好地解决EMD具有的模态混叠现象和消除EEMD的重构误差,使非线性和非平稳性原始时间序列分解成几个平稳性相对较好的本征分量。

(2)预测模型中,波动较大且非线性比较高的IMF1分量经几种非线性神经网络组合预测后,预测精度明显提高。灰狼优化算法对LSSVM 中参数具有比较好的寻优效果。单一预测模型预测精度较差,在拐点及峰值尤其突出。

(3)通过与几种模型比较,预测模型能够得到较准确的值,是一种比较好的短期风速预测方法,可提高风速预测精度。风速数据所固有的不稳定性及波动性,目前还没有一种预测模型能完美无误地对风功率进行预测,有待学者和研究人员不断探索,继续研究。

坚持传授知识、培养能力、提高素质协调发展、注重对学生探索精神、科学思维、实践能力和创新能力的培养。

——摘自教高[2005]8 号文件

猜你喜欢

分量风速神经网络
基于递归模糊神经网络的风电平滑控制策略
邯郸市近46年风向风速特征分析
基于最优TS评分和频率匹配的江苏近海风速订正
基于时间相关性的风速威布尔分布优化方法
神经网络抑制无线通信干扰探究
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
基于神经网络的中小学生情感分析
论《哈姆雷特》中良心的分量
快速评估风电场50年一遇最大风速的算法