APP下载

基于CEEMDAN-WD-PSO-LSSVM模型的月径流预测研究

2021-09-02徐冬梅庄文涛王文川

中国农村水利水电 2021年8期
关键词:径流分量模态

徐冬梅,庄文涛,王文川

(华北水利水电大学水资源学院,郑州450046)

0 引 言

径流量是河川的重要水文变量之一,其准确预测可以为水资源系统特性分析和高效利用提供可靠依据[1]。由于水文系统复杂,河川径流受气候变化、下垫面和人类活动等众多外界因素的影响,其序列常常表现出多时间尺度变化特征和非平稳特征,这给月径流的精确预测带来很大困难[2]。

根据国内外研究现状,传统的中长期径流预测方法主要是应用数理统计理论和方法。近年来,随着人工智能和计算机技术的不断发展,基于数据驱动的现代智能算法正在逐步代替传统的数理统计方法[3],为径流预报提供新的研究途径,如回归分析模型[4]、人工神经网络模型[5]、灰色系统分析模型[6]、支持向量机模型[7]等被用来进行水文时间序列预测。其中支持向量机实现了结构风险最小化原理,理论上可以得到回归或者分类问题的全局最优解,是水文预报领域研究的重点。如李文莉等[8]将粒子群算法优化的LSSVM 模型成功应用于月径流预测,在一定程度上改善了径流预测效果。

当前径流预测的研究大多注重引入新的预测模型方法。然而,在实际预测过程中,由于径流时间序列具有复杂性,单一预测模型很难反映径流的形成过程和变化规律,难以对整个径流过程进行有效的拟合[9]。近年来,预测模型耦合越来越受到水文研究者的关注,混合模型在实际中是采用各种分解方法与不同预测模型进行组合,以分解算法为基础,对数据进行预处理降低序列非平稳性来达到提高模型预测精度的目的。张敬平等[10]提出了经验模态分解与径向基函数神经网络混合径流预测模型,利用经验模态分解处理原始径流序列,充分发挥了径向基函数神经网络的优势,在减小径流预测误差方面有明显改善。周婷等[11]将WD 方法和支持向量机组合应用于径流预测,WD 分解算法的引入可以显著提高预测可靠性和预测精度。张金萍等[12]建立CEEMDAN-ARMA 组合模型预测年径流量,改善了EMD分解存在的模态混叠问题,能更好地提取径流序列中的信息,同时也验证了分解-预测较单一ARMA 模型能有效减少预测误差,得到更准确的预测结果。这表明采用分解技术对数据进行预处理,对径流预测精度的提高是有效的。但是,一次分解技术不能很好地处理强非平稳性和非线性序列,如CEEMDAN 分解产生的高频分量仍具有很强的波动性,会增加建模难度,从而对预测精度产生影响。

针对上述存在的问题,为进一步提高月径流预测精度,本文提出利用WD 技术进一步处理CEEMDAN 分解的高频序列,使得分解后的序列更加平稳,减少混合建模的预测误差,提高PSO-LSSVM模型对中长期月径流的预测能力。

1 研究方法

1.1 自适应噪声完整集成经验模态分解

CEEMDAN 是Torres M E 等[13]2011年提出的一种新型噪声辅助数据分析方法。它弥补了EMD[14]和EEMD[15]两种方法存在的模态混淆以及重构序列中噪声残留缺点,还提高了计算效率。其具体算法如下:

(1)对原始序列x(t)中添加有限数量的自适应白噪声φ0ωi(t)(i=1,2…I),I为试验次数。得到:

(2)使用EMD 对每一个xi(t)=x(t)+φ0ωi(t),i=1,2…I进行分解,得到第一个模态分量IMF1和余量r1(t):

(3)在余量r1(t)中添加白噪声φ1E1[ωi(t)],其中E为EMD分解运算符,再进行EMD 分解得到第二个模态分量IMF2及余量r2(t):

式中:Ek(∙)为EMD分解产生的第k阶模态分量。

(4)计算第k个余量:

(5)对每一个添加白噪声余量分解,得到CEEMDAN 的第k+1阶模态分量:

重复(4)、(5),直到找出所有IMF分量。

1.2 小波分解

WD 分解是近年来被应用广泛的分解方法,通过小波基的伸缩和平移分解非平稳信号,根据局部变换时间和频率,有效地从研究序列中提取信息,得到低频分量和高频分量。小波分解将每层低频分量通过低通滤波器和高通滤波器得到下一层的低频部分和高频部分,实现了低频趋势序列和高频细节序列的有效分离。原时间序列与各子序列关系可以表示成:

式中:ak为低频分量;di为高频分量;k为分解层数。

小波分解过程最重要的是小波基函数和小波的层数选择[16],本文采用db4小波基函数和3层小波分解。如图1所示。

图1 小波3层分解Fig.1 Wavelet three level decomposition

1.3 LSSVM 模型

由Suykens 等[17]提出的LSSVM 是SVM 的一种改进模型,采用最小二乘线性系统,将不等式约束转化为等式约束。把求解二次规划问题转变为求解线性方程组,简化计算复杂度,收敛速度更快,预测精度更高。其具体步骤如下:

(1)设N个数据点的训练集,其中xi∈Rn为输入向量,yi∈Rn为输出值。则样本线性回归函数为:

式中:ω为权向量;ψ(x)为非线性映射函数;b为偏置量。

(2)依据结构风险最小化原则,构造LSSVM优化问题:

约束条件为:

式中:β为惩罚因子;ξ为误差。

(3)采用拉格朗日法求解目标函数得到:

式中:α为拉格朗日乘子。

(4)根据KKT 优化条件,分别对ω、b、ξ、α求偏导,得到LSSVM模型函数为:

式中:K(x,xi)为核函数。

本文核函数采用径向基RBF函数:

式中:σ2为核函数参数。

1.4 PSO算法

粒子群算法是基于模拟鸟群的觅食行为全局优化算法,通过个体间信息传递与合作来寻找最优解[18]。粒子迭代搜索,收敛速度快,设置参数少,具有很强的全局寻优能力。

核函数参数σ和惩罚因子β会直接影响LSSVM 模型预测精度,本文通过PSO 算法迭代寻找LSSVM 模型一组最优参数σ和β。算法原理如下:

首先随机初始化生成一群粒子,迭代时,每个粒子根据适应度值跟踪自己的个体历史最优解和群体历史最优解。根据式(14)和(15)来更新自己的速度和位置。

式中:xi、vi分别为粒子的速度和位置;c1、c2为学习因子;ω为惯性因子;rand()为(0,1)之间随机数。

1.5 CEEMDAN-WD-PSO-LSSVM 模型构建

CEEMDAN 可以将非平稳复杂序列分解为若干个复杂度低的子序列,对各个分量建立预测模型可有效提高预测精度。但是,以往对CEEMDAN分解建模时,没有考虑高频子序列复杂性较高,会降低预测精度。由于小波分解可以对CEEMDAN 得到高频子序列进一步分解,降低高频子序列复杂性。因此,本文提出二次分解技术,即采用CEEMDAN分解原始径流序列,小波分解算法对其复杂度高的子序列进行二次分解,结合PSO 优化的LSSVM 预测模型,提高月径流预测精度。组合模型建模流程如图2所示。

图2 CEEMDAN-WD-PSO-LSSVM 组合模型流程图Fig.2 Hybrid CEEMDAN-WD-PSO-LSSVM model flow chart

2 实例应用

洛河是洛宁县境内最大最主要的河流,同时也是黄河右岸的重要支流,黄河的主要洪水来源之一。河道全长447 km,河南境内长366 km。流域面积达18 881 km2。长水水文站建于1951年,位于河南洛宁县长水镇,有着搜集洛河流域水文基本信息和及时向防汛应急部门提供实时水情信息的重要任务。受季风气候影响,降水量随季节变化有很大差异,径流变化剧烈。该站1956-2016年实测月径流序列如图3所示。其序列足够长,资料精度高,该资料的代表性能够得到保证。

图3 长水站月径流序列Fig.3 Monthly runoff series in Changshui station

2.1 CEEMDAN分解月径流时序数据

通过CEEMDAN 方法对长水站1956-2016年月径流样本数据进行分解,降低原始径流时间序列的波动性。设定CEEM⁃DAN 算法参数Nstd为0.2,NR为100,Maxlter为5 000,原始径流序列最终分解为9 个IMF分量和1 个余量r,共10 个分量。r分量反映出长水站径流总体呈下降趋势,分解结果如图4所示。其子序列表现出该径流序列的频率变化和振幅变化。频率由高到低、振幅从大到小进行排列,从图4中可以看出IMF1、IMF2和IMF3 波动最大,复杂度较高,依然具有很强的非线性和非平稳性特征,不利于预测的准确性。

图4 CEEMDAN分解月径流序列结果Fig.4 Decomposition results of monthly runoff series using CEEMDAN

2.2 WD二次分解

针对利用高频分量建模预测效果不理想的问题,在建模时利用WD 对其进行二次分解,以进一步降低高频子序列的复杂性。本文采用db4 小波基函数通过Matlab2018b 软件的小波工具箱对IMF1、IMF2 以及IMF3 进行3 层小波分解获取其趋势序列和细节序列。WD 分解IMF1 的结果如图5所示。对IMF2、IMF3等高频序列分别进行WD 分解,原始径流序列经过CEEM⁃DAN-WD二次分解之后共有19个子序列。

图5 小波分解IMF1结果Fig.5 Results of wavelet decomposition of IMF1

2.3 模型构建及预测

利用PSO 优化算法,对LSSVM 的两个参数β和σ进行寻优,建立PSO-LSSVM 模型。初始化粒子群的种群大小、学习因子、位置、速度、搜索范围和迭代次数。PSO算法基本参数为:学习因子c1和c2都设为2,最大迭代次数K设为100,种群数量m设为20,ω∈[0.4,0.99]。将经CEEMDAN 分解的复杂性较低分量和IMF1、IMF2 和IMF3 经WD 方法二次分解的各分量作为PSO-LSSVM 模型的输入,分别预测各分量的结果,最后将每个子序列预测结果叠加得到最终月径流量预测值。本文基于Matlab2018b软件和LSSVM 工具箱预测研究,利用长水站1956-2016年共61年月径流观测数据,共计732 个月径流数据,利用前672 个径流数据为训练样本,训练模型,后60 个数据为测试样本用于验证模型。

选取单一PSO-LSSVM 预测模型、组合模型CEEMDANPSO-LSSVM 模型、WD-PSO-LSSVM 模型以及CEEMDAN-WDPSO-LSSVM 四种方法分别进行预测,用来比较模型预测效果。各模型预测结果如图6所示。

图6 不同模型预测结果Fig.6 Prediction results of different models

2.4 预测结果评价准则

为评价CEEMDAN-WD-PSO-LSSVM 混合模型的预测精度,选取均方根误差RMSE、纳什效率系数NSEC、平均绝对百分比误差MAPE、相关系数R四种评价指标来评价模型的预测结果的优劣,4种评价准则计算公式为:

式中:yi为第i个样本的真实值;为第i个样本的预测值;yavg为所有实测值的平均值;为所有预测值的平均值。

利用组合模型拟合训练期的数据,并对训练期和验证期的数据进行模拟及预测,不同模型的预测结果评价统计如表1所列。表1的结果分别比较了4 类模型训练期月径流量和验证期月径流量的R、NSEC、RMSE、MAPE。

表1 各种模型预测误差对比Tab.1 Comparison of prediction errors of various models

2.5 预测结果分析

从图6中可以看出单一PSO-LSSVM 模型预测值与实测值误差较大,拟合效果最差,采用CEEMDAN-PSO-LSSVM 单一分解方法得到的预测结果与实测径流之间也存在较大偏差,对实测径流序列峰值,偏差更为明显。利用CEEMDAN-WD 二次分解和PSO-LSSVM 组合模型拟合效果最好,预测结果更接近实际径流,验证了本文所提模型的准确性和优越性。

从表1中评价准则统计结果可以看出,组合模型CEEM⁃DAN-PSO-LSSVM、WD-PSO-LSSVM 和CEEMDAN-WD-PSOLSSVM 的预测效果远优于单一的PSO-LSSVM 预测模型,在验证期R、NSEC、RMSE、MAPE四项准确性评价指标上都有较大的提高。

(1)CEEMDAN-WD-PSO-LSSVM 组合模型与PSO-LSSVM模型相比,相关系数R和纳什效率系数NSEC分别提高了200.00%、479.17%;均方根误差RMSE和平均绝对百分比误差MAPE分别减少73.68%、84.86%。

(2)CEEMDAN-WD-PSO-LSSVM 组合模型与CEEMDANPSO-LSSVM 模型相比,相关系数R和纳什效率系数NSEC分别提高了15.66%、37.88%;均方根误差RMSE和平均绝对百分比误差MAPE分别减少了50.02%、48.86%。

(3)CEEMDAN-WD-PSO-LSSVM 组合模型与WD-PSOLSSVM 模型相比,相关系数R和纳什效率系数NSEC分别提高了2.13%、4.60%;均方根误差RMSE、平均绝对百分比误差MAPE分别减少了17.96%、28.72%。

3 结 论

为提高中长期径流预报的精度,本文研究了CEEMDANWD 二次分解在径流时间序列中的实用性和可行性,构建了PSO-LSSVM、CEEMDAN-PSO-LSSVM、WD-PSO-LSSVM 和CEEMDAN-WD-PSO-LSSVM 4 种预测模型,并以洛河长水水文站月径流资料来验证对比了不同模型的预测效果。主要结论如下:

(1)相比于单一的PSO-LSSVM 预测模型,CEEMDAN 分解能有效地降低原始数据的复杂性,使得径流序列平稳,能够与预测模型进行更好的耦合,得到更准确的预测结果。

(2)WD 分解技术可以将序列分解成高频部分和低频部分,得到较为稳定的序列,对CEEMDAN无法解决 高频序列的非平稳性特征有显著的处理能力。

(3)CEEMDAN-WD 二次分解能最大限度对数据进行再处理,其组合模型优势明显,预测能力优于单一分解预测,能较大提高模型预测精度和可靠性。为中长期月径流预报研究提供一种新途径,其他流域的月径流预测及相关预测研究提供参考。□

猜你喜欢

径流分量模态
格陵兰岛积雪区地表径流增加研究
流域径流指标的构造与应用
联合仿真在某车型LGF/PP尾门模态仿真上的应用
多模态超声监测DBD移植肾的临床应用
基于SWAT模型的布尔哈通河流域径流模拟研究
跨模态通信理论及关键技术初探
画里有话
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
论《哈姆雷特》中良心的分量