APP下载

基于PCA-RBF神经网络的水面蒸发预测研究

2018-11-22

山西水土保持科技 2018年3期
关键词:蒸发量分析法水面

丁 薇

(山西省水文水资源勘测局)

1 研究目的及意义

水面蒸发既是江河湖库渠塘等水体水量损失的主要形式之一,同时也是自然水循环的一个重要环节。研究预测水面蒸发,能够提高我们对水文循环模拟的精度,为水资源的合理利用提供基础依据,对于合理制定农田灌溉制度及对水文循环的深入研究等均有重要意义[1]。

在现阶段,对大水体的水面蒸发量预测可通过计算或估算获得,但由于受到其相关资料及方法的不确定性限制,会影响到预测精度。对小水体的蒸发量预测,由于资料更为短缺,预测困难较大。近年来,我国对水面蒸发量的预测研究越来越受到重视[2]。但随着气候变化及天然降水量时空分布的影响,水面蒸发量的变化也相应较大。总体来讲,目前对水面蒸发量预测的相关研究仍然较少,且与现阶段气候变化条件下的水文循环不相适应[3-5],远不能满足实际需求。由此可见,对于水面蒸发量预测研究,仍是现阶段有待深入研究解决的重要课题[6-7]。本文以太原地区的水面蒸发量预测为例,应用主成分分析法(PCA)[8]与RBF神经网络相结合的方法—PCA-RBF神经网络法,建立数学模型,进行预测演算,并对预测模型的合理性进行分析,以验证该模型对水面蒸发量的预测精度,可为水面蒸发量的预测提供参考。

2 PCA-RBF神经网络法简介

2.1 主成分分析法

主成分分析法能够将多个研究对象标准化后,缩减为几个综合指标,且不丢失原有信息,简化了统计分析系统结构,被广泛应用于水文学、经济学等领域。本文通过主成分分析法,筛选出影响水面蒸发量的主要气象因子,并作为RBF神经网络的输入层。具体步骤如下:

(1)构造样本矩阵X。

式中:xij为第i个样本中第j个指标的值。

(2)对样本矩阵X进行标准化,变为标准化矩阵Y。

(3)标准矩阵Y的相关系数计算。

(4)计算主成分贡献率及累计贡献率。主成分Fi的贡献率计算公式:

累计贡献率计算公式:

其中λi(i=1,2,…,m)为指标序列的特征值,可通过方程=0求出,并对其进行排序,即λ1≥λ2≥…λm≥0,Im为特征值λ对应的特征向量。当λk对应的累计贡献率大于或等于85%时,则其有k(k≤m)个与λ1,λ2,…,λk对应的主成分。

2.2 RBF神经网络

径向基函数(RBF)神经网络现已在气象、水文等方面具有广泛的应用。已有研究通过RBF神经网络,对降雨、径流进行预测,并且通过RBF神经网络还可以进行模型参数的预报。RBF神经网络在处理多因子对单因子拓扑关系时运算简单,功能强大。RBF神经网络通常有3层网络结构,包括输入层、隐含层和输出层。网络模型的拓扑关系如图1所示。

图1 RBF神经网络结构

3 PCA-RBF神经网络法应用实例

本项研究选取太原地区为研究区域。众所周知,水面蒸发量受到气候条件影响较大,如风速与温度的增加可使蒸发量变大,而相对湿度与气压的升高则会影响蒸发。目前,对于各气象因子在水面蒸发过程中所占据的重要程度,尚未有明确的定论。为此,在研究过程中,收集了2010年1月1日至2010年1月28日太原站气压(PRS)、相对湿度(RHU)、气温(TEM)、风向风速(WIN)、日照时数(SSD)和0 cm地温(GST)作为海选气象预测因子,水面蒸发量作为被预测因子。首先,通过采用主成分分析法提取影响水面蒸发量的主要因子,并对提取到的主要气象因子通过相关性识别检验,确定所选气象因子的合理性;然后,将提取出的主要气象因子作为RBF神经网络的输入层,对水面蒸发量进行预测。分别以2010-1-1至2010-1-25的数据及2010-1-25至2010-1-31的数据作为RBF神经网络的训练与检验样本,根据检验样本的合格率对PCA-RBF神经网络的预测精度进行检验。

3.1 预测因子提取

运用SPSS软件对标准化的气象因子的样本数据进行主成分分析,得到表1。

表1 解释的总方差

由表1可知,日照时数和相对湿度成分的特征累积方差贡献率达到75.359%。因此,这两个主成分在评价体系中起主要作用。

3.2 相关性识别

为进一步检验并确定主成分分析法所提取指标的合理性,对各气象因子与蒸发量的相关性与显著性进行分析。分析结果见表2及图2至图7。由表2及图2至图7可知,日照时数(SSD)与水面蒸发EVP为正相关,相关系数最大为0.665,且满足P=0.05的显著性水平检验;相对湿度(RHU)与水面蒸发量为负相关,相关系数最大为-0.408,且满足P=0.05的显著性水平检验。研究认为,本次主成分分析提取的主要气象因子合理,满足相关性及显著性检验。

表2 气象要素间相关性分析

3.3 蒸发量预测结果与分析

图2 SSD与EVP变化趋势图

图3 RHU与EVP变化趋势图

图4 PRS与EVP变化趋势图

图5 TEM与EVP变化趋势图

图6 WIN与EVP变化趋势图

图7 GST与EVP变化趋势图

由主成分分析及相关性检验可知,日照时数(SSD)与相对湿度是影响蒸发量EVP的主要因素。因此选择2010-1-1至2010-1-25的数据作为训练指标,而2010-1-25至2010-1-31日的数据作为检验指标。使用Matlab R2013a编程实现模型算法,得到当所构建的RBF神经网络模型的中心化方法为Cluster、硬汉节点数为10、加权种子数为2、sigma参数为0.1、迭代最大次数为100时,模型误差最小,为4.555。模型检验结果见表3。

表3 模型检查结果表

由模拟结果可知,模型最大相对误差为72.32%,最小相对误差为2%。从26日到31日预测值与实际值偏差较小,最大误差出现在30日,究其原因,可能与仅选取了一个月的气象数据作为研究样本有关。由于研究样本较少,而RBF神经网络要求数据量越大其精度越高,因此,应在今后的研究中加大数据量的输入,作为神经网络的训练样本,则本文提出的方法所预测的蒸发量数据精度将会大大提高。总体来看,如果相对误差绝对值小于20%算作合格的话,合格率等于(5/6)×100%=83%。

4 结论与建议

本文以太原地区为例,从多个影响因子分析出发,应用主成分分析法提取了主要的气象因子,并对所提取的气象因子进行了相关性检验,证明了主成分分析法对RBF神经网络预测因子(即输入层)识别的合理性。在此基础上进行的水面蒸发量预测,大大减少了实际运用数据中的工作量,且PCA-RBF神经网络预测精度较高,达到了83%的合格率。

本项研究所提出的水面蒸发量预测模型,简便实用,对于气象数据缺失的地区,可有效进行水面蒸发量预测,克服了计算公式需要太多资料和经验系数的缺陷,具有一定的实用意义。但本文建模数据量较少,不能充分体现该模型的优越性,因此,在今后的研究中,需要借助大量资料进一步验证该方法的实用性。

猜你喜欢

蒸发量分析法水面
异步机传统分析法之困难及其克服
贵州清镇蒸发量变化特征及其影响因素分析*
水黾是怎样浮在水面的
1958—2013年沽源县蒸发量变化特征分析
层次分析法在生态系统健康评价指标体系中的应用
基于时间重叠分析法的同车倒卡逃费探析
1981—2010年菏泽市定陶区蒸发量变化特征分析
为什么木头可以浮在水面上?
AHP和SWOT分析法在规划编制中的应用
一块水面