APP下载

新安江模型参数自动优化率定的SCE-UA算法应用研究

2020-11-23姜景山

三峡大学学报(自然科学版) 2020年6期
关键词:新安江径流流域

张 超 姜景山

(南京工程学院 建筑工程学院, 南京 211167)

流域水文模型是由描述流域降雨径流形成过程的各函数构成的一种物理结构或概念性结构,或者说是通过一组耦合函数关系及相应参数来模拟流域降雨径流形成过程的一种结构,模型结构的合理性和参数的优化和选择一定程度上决定了模型模拟和预报的精度[1-2].然而,水文模型一般是比较复杂的高维、非线性模型,模型参数存在自相关,互相关,模型的响应面是多峰的,目标函数在参数空间内往往不连续,且是非凸的,因此,概念性流域水文模型参数优选一直是水文界的重点和难点问题[3-4].

目前流域水文模型参数优选的方法主要有两类:人工率定(如试错法)和计算机自动优选[5].由于人工率定方法缺乏客观性且需足够的经验,近年来,伴随计算机技术的迅速发展,计算机自动优选方法因其弥补了人工率定方法过程中工作人员缺乏经验、费时费力等不足,得到了广泛应用,例如下降单纯形法[6]、模式搜索法[7]等局部优化算法,遗传算法[8-9]、粒子群优化算法[10-12]等全局优化算法.另外,郭俊,周建中,周超,等[13]针对传统单一目标水文模型参数优化率定中存在的挖掘不充分缺陷,提出了一种多目标文化混合差分进化算法,用于解决水文模型参数多目标优化的问题.Duan等[14-15]于1992年提出SCE(Shuffled Complex Evolution)方法,并于1993年对其进行了修正,称为SCE-UA方法.该方法结合了单纯形法、随机搜索和生物竞争进化等方法的优点,使其在解决全局优化问题方面更加有效、灵活、稳健,被认为是非线性复杂模型参数优选最有效的方法之一,在国内外连续型水文模型参数优选中应用广泛[16-18].因此,为了进一步探索概念性流域水文模型参数自动优化率定和预报精度问题,本文基于三水源新安江模型,在给定理想径流资料定义的基础上,采用应用SCE-UA算法分别就理想径流资料和实际径流资料的情况下,资料长度选择对新安江模型参数自动化率定优选的影响进行研究.

1 算法简介

1.1 算法原理

SCE-UA算法就是将全局搜索看作为一个自然界中生物不断进化的过程.随机生成s个点构成一个群体,将这个群体分成几个部落,然后各个部落单独进化.部落里的每个个体都有可能成为繁殖下一代的父代个体,从部落里选取几个父代个体构成一个父辈群体,这些父辈群体就像一对父母,唯一与父母不同的就是父辈群体里的成员个数可能多于两个.为了保证繁殖进化过程的竞争性,在选取父辈群体时采用了概率分布的方法,使得较好的父代个体更容易加入到繁殖下一代的过程.之后用生成的较好的子代个体代替父辈群体中的最差的父代个体构成新的父辈群体,完成一次进化.每个部落在经过几次进化后,就重新混合构成新的群体.定时地将各个部落重新混合在一起,保证了各个部落间的信息共享及信息的不退化性,加强了群体的生存延续性.

1.2 算法流程

1)初始化.假定待优化问题是n维问题,选取参与进化的复合型个数p和每个复合型所包含的顶点数m,计算样本点数目s.

2)生成样本点.在可行的参数空间区域随机产生s个样本点x1,x2,…,xs,并分别计算每一点xi的函数值fi=f(xi),其中i=1,…,s.在未知全局最优点的大体位置先验信息的情况下,可采用均匀概率分布随机产生样本点.

3)样本点排序.把s个样本点(xi,fi)按函数值升序排列,排序后仍记为(xi,fi),其中,f1≤f2≤…≤fs,记D={(xi,fi),i=1,…,s}.

5)进化每个复合型.按照竞争的复合型进化算法(CCE)分别进化各个复合型Ak,k=1,…,p.

6)混合复合型.把进化后的每个复合型A1,…,Ap依序放入D中,表示为D={Ak,k=1,2,…,p},并将D中所有点按函数值升序排列,排序后仍记为D.

7)收敛性判断.如果满足收敛准则则停止,否则返回第(4)步.

在参数的可行域空间内随机生成样本点,保证了样本点选择的全局性,同时也保证了优化结果的全局性.由前述可知,优化问题之所以复杂,原因之一就是“收敛区域”可能不止一个,而将所有样本点划分为多个组合,就恰好保证了在可行域空间的多个方向都可以进行自由搜索;将所有的组合重新混合使得各组合之间可以共享搜索路径的信息,确保算法继续生存.

2 研究区域

选用长江三峡区间沿渡河流域作为研究区域,集水面积为601 km2.流域坡度较大,平均坡度为2.87‰,高程垂直落差达2 800 m,山高坡陡,人类活动影响较小.流域内降水丰沛,流域多年平降雨量为1 337 mm,全年雨量以5-9月最多,约占全年68%.流域内最大年降雨量为2 448.2 mm,最小年降雨量为808.4 mm.流域内径流主要来自于降雨,每年4-10月为汛期,年最大洪峰流量多出现在5-7月,且频率较高.流域内山高坡陡,谷深河窄,洪水汇流迅速,洪水陡涨陡落,为典型的山区性河流.水文气象资料选用1981-1987年的历史资料,基本情况见表1~2.

表1 流域1981-1987年基本情况

表2 流域1981-1987年各年资料统计

3 研究分析

根据流域水文模型参数的物理意义及研究流域的特征,在参数搜索空间内(见表3)随机生成参数组,将其作为沿渡河流域新安江模型的参数“真值”,然后利用该组真值及该流域的实测降雨、蒸发资料,采用新安江模型计算得出相应的径流资料,即称为该流域的理想资料,以此进行新安江模型参数优化率定研究,可以排除输入、输出观测误差和模型结构误差对参数优化率定的影响.

表3 新安江模型参数物理意义及参数搜索区间

3.1 算法参数取值

SCE-UA算法参量包括单个复合型包含的点数m、子复合型包含的点数q、每个子复合型产生的可执行的后代个数α、单个复合型进化次数β、复合型个数p共5个.SCE-UA算法的有效性受到算法参数取值的影响,根据Duan[7]的研究,算法的4个参数均采用缺省值(Default values),即m=2n+1、q=n+1、α=1、β=2n+1(n为待优化参数的个数),可以满足算法高效全局性搜索的条件.

理想资料情况下,对SCE-UA算法参数p分别取值1、2、4和10进行新安江模型参数优化率定的研究,结果见表4.

表4 算法参量p不同取值时的新安江模型参数优选结果

由表4可以看出SCE-UA算法参量p的取值依赖于待优化问题的维数.应用该算法,当p=1或p=2时,基本上搜索不到参数真值.随着p取值的增大,如当p=4或p=10时,除个别不敏感参数如C外,大部分参数可以搜索到真值.说明在所需优化问题的维数较高的情况下,复合型的个数p的取值应适当加大.当采用理想资料进行参数优化时,取p>4就基本可以满足需要.

3.2 理想资料年限长度对寻优结果的影响

在参数搜索空间内随机生成1组新安江模型参数,然后用这组参数及沿渡河流域1981-1985年连续5年的逐日面雨量生成连续5年的理想资料,以此分析理想资料情况下,资料长度对参数优化率定的影响,结果见表5.

表5 采用1年、3年、5年理想资料的参数寻优结果

从表5可以看出,除参数C外,对于多数参数,无论采用1年、连续3年还是连续5年的理想资料,优化率定的结果都与真值相符.说明在算法参量取值合理的情况下,若不存在模型结构及实测资料误差的影响,则SCE-UA算法基本可以搜索到模型参数的真值,并且在理想资料情况下,SCE-UA算法的寻优结果与资料长度无关.此处参数C难以搜索到真值,可能因为深层蒸散发系数C决定于深根植物的覆盖面积,对于湿润地区很少用到深层蒸发,所以C值不敏感,反应迟钝,难以搜索到参数真值,这说明不敏感参数会干扰参数的优化率定.

为更清晰地展现各参数的寻优过程,根据表5中1年、3年、5年理想资料的寻优结果,作出部分参数的寻优过程图,如图1所示.

图1 SCE-UA算法理想资料情况模型部分参数寻优过程图

图中参数值均进行如公式(x-xmin)/(xmax-xmin)=xnew的归一化处理,使得参数均处于[0,1]区间,便于多参数统一显示.

由图1可以看出,采用SCE-UA算法率定新安江模型参数时,对于理想资料,不论资料年限长短,参数最终基本都能收敛,即排除资料的输入、输出观测误差和模型结构误差的理想资料情况的参数寻优结果与资料的长度无关.同时可看出,部分参数在目标函数的收敛过程中仍有较长时间的波动,较不容易达到稳定,如WUM,WLM等.参数KI虽在中间一段较长时期内一直趋于平稳,但到后期有波动迹象.参数C在寻优过程中呈现不规则震荡,始终未能收敛.再次说明,不敏感参数及参数间的相关性将是影响参数优化率定的重要原因.

3.3 实际资料年限长度对寻优结果的影响

将SCE-UA算法结合实测资料优化率定新安江日模参数,采用沿渡河流域1981-1987年共7年实测水文气象资料作为优化率定所用资料系列,设定计算均循环10次,若10次均收敛至同组参数,则认为算法收敛至最优值,结果见表6.

不同长度的实测资料部分参数不及机率累积分布曲线如图2所示,图中纵坐标CDF(Cumulative Distribution Function)表示各参数不及机率累积值,横坐标表示的是参数的取值.垂直的点线表示的是采用1981-1987年实际资料率定的最优参数取值,“1年”表示采用1年资料率定的最优参数,“2年”、“3年”依次类推.

由表6可以看出,实际资料不同年限长度(如1年、2年或3年)的参数优化率定结果各不相同,即使同样年限长度资料的所有可能情况,如1年实际资料的7种情况、连续2年实际资料的6种情况或连续3年实际资料的5种情况所优化率定的参数结果也各不相同.由图2可以看出,部分参数不及机率累积分布曲线随研究资料长度的增加有逐步趋向由7年资料率定的最优参数值靠拢的趋势,即实际资料情况下的参数优化率定随资料长度的增加逐渐趋于稳定.

表6 采用1年、2年、3年实测资料的参数寻优结果

图2 对应于计算资料不同年限的部分参数不及机率累积分布曲线

4 结 论

概念性流域水文模型由于结构复杂参数众多,在实际应用中的一个很大的问题就是模型参数的率定识别和预报精度的要求.本次将SCE-UA算法结合沿渡河流域三水源新安江模型,分析径流资料的长度对新安江模型参数优选的影响.发现理想径流资料情况下,资料的长度对模型参数优选没有影响,不论径流资料年限长短,除个别不敏感参数外,参数最终基本都能收敛;在实际径流资料的情况下,参数优化率定随径流资料长度的增加有向最优值靠拢的趋势,认为输入、输出观测误差和模型结构误差是导致模型参数优选不确定性的重要原因.

猜你喜欢

新安江径流流域
格陵兰岛积雪区地表径流增加研究
流域径流指标的构造与应用
基于SWAT模型的布尔哈通河流域径流模拟研究
昌江流域9次致洪大暴雨的空间分布与天气系统分析
新安江
河南省小流域综合治理调查
浙江省数学高考考法剖析
人工降雨下三种屋面径流过程环境质量比较
称“子流域”,还是称“亚流域”?
加强水生生物资源养护促进新安江水环境生态平衡