APP下载

指标权重算法对Fisher最优分割在水库汛期分期中的影响研究

2021-01-27刘星根吴晓彬王永文彭圣军

中国农村水利水电 2021年1期
关键词:雨量分析法暴雨

虞 慧,刘星根,吴晓彬,王永文,王 姣,彭圣军

(1.江西省水利科学研究院,南昌 330029;2.江西省水工程安全工程技术中心,南昌 330029;3.中国科学院南京地理与湖泊研究所,南京 210008;4.中国科学院大学,北京 100049;5.南昌工程学院,南昌 330099)

0 引 言

水库是人类利用水资源的重要方式,具有灌溉、防洪、供水、发电、航运等功能。截至2019年8月底,江西省已注册登记水库大坝共10 672 座,其中大型30 座,中型258 座,小(Ⅰ)型1 468 座,小(Ⅱ)型8 921 座。由于流域降雨和径流的季节性变化,流域的水资源供需矛盾越来越显著,水库管理面临着越来越突出的防洪和兴利的矛盾。水库汛期分期针对两者的矛盾,以期在不增加防洪风险的前提下[1],缓解旱涝急转的风险,最大化地利用汛后期的洪水资源。汛期分期的方法从定性分析、定量计算方法,逐步发展至精细化定量的新方法上。高波等[2]和谈亚琦[3]通过引入系统聚类方法,在分析水库多个影响因子的基础上,构建模糊相似矩阵进行水库汛期分期;刘攀等[4,5]通过采用基于超定量取样的概率变点分期模型的变点分析方法对隔河岩水库进行分期分析;陈守煜等[6,7]和莫崇勋等[8]采用统计多指标下隶属于汛期的隶属度的模糊集分析法进行分析;谢飞和王文圣[9]采用基于联系度的概念进行集对分析法分析。刘克琳等[10]采用对有序样本进行分类的Fisher最优分割法进行分割,取得了较好的效果。每种方法均有其固有的特性和适用性,系统聚类法具有较强的理论意义,但无法给出最优的结果;变点分析法需要进行数学假定,具有一定的主观性;模糊集分析法采用单个指标进行分析,具有一定的局限性;集对分析在指标阈值确定上存在主观性。

Fisher最优分割在汛期分期研究中应用广泛[10-12],如汾河张家庄水库、海河密云水库、渭河石头河水库、黄河太平水库、珠江澄碧河水库等的研究结果均表明该方法的分期结果能较好地反映水库流域的气象水文背景和暴雨径流特征,为水库优化运行管理、提高水库运行效益提供科学依据[10,13-16]。Fisher最优分割法考虑了降雨、径流等多指标的综合作用和时序性,确定最优分类数及时段[15]。许多研究者提出了Fisher最优分割中指标权重的确定方法,以期减少指标权重的主观性及其对分割结果的影响[13-16],比如相关系数法、主成分分析法、模糊层次分析法等。然而,不同方法确定的指标权重可能存在一定差异,这种差异对Fisher最优分割结果的影响尚未充分探讨。为进一步理清指标权重对Fisher最优分割结果的影响,本文以七一水库为例,比较分析了主成分分析法、变异系数法、熵权法等三种方法在确定指标权重的差异,并在此基础之上分析了指标权重差异对Fisher最优分割结果的影响,以期为今后汛期分期研究和实践提供参考。

1 方法理论

1.1 Fisher最优分割

1.1.1 基本原理

Fisher最优分割是针对有序样品进行最优化分段的一种数学聚类方法[17]。它根据样本段内差异最小、样本分段之间差异最大的原则划分样本最优分段,采用离差平方和量化样本内部、样本分段之间的差异[10,13]。

1.1.2 计算步骤

Fisher最优分割在水库汛期分期中的一般步骤为[10]:

(1)选取指标。对水库所处流域的水文、气象资料进行分析,根据需求综合分析并筛选出能反映汛期分期的各种指标参数。

(2)构建初始分类样本。选取汛期分期的指标值Xij(i=1 ~n,j=1 ~m),其中i代表样本,j代表指标,构建样本与指标之间的关系矩阵X,对指标数据进行最大最小值标准化得到标准化矩阵X′:

(1)

按照各指标对样本分类的重要程度赋予权重系数w1,w2,…,wn,加权平均后将多指标值矩阵转化为初始分类样本Y:

(2)

(3)

(4)

式中:yr为样本值。

(4)确定目标函数。通过将n个有序样本分割为k段,从而定义出目标函数,{yj1,yj1+1,…,yj2-1},{yj2,yj2+1,…,yj3-1},…,{yjk,yjk+1,…,yjk+1-1},其中j1,j2,…,jk为k个分点,最优分割的实质就是寻找某一组分点,使得所有分类的直径总和最小,即:

(5)

(5)求解最优分割。有序样本的最优k类分割一定是在其某一个截尾子段最优k-1类分割之后再添加一类形成的。使用以下递推公式求解最优分割。

B(n,2)=min{D(1,j-1)+D(j,n)}

(6)

B(n,k)=min{B(j-1,k-1)+D(j,n)}

(7)

(7)最优分类结果的F检验。对分类结果进行F检验,构建F统计量[18]:

(8)

1.2 权重因子的计算

根据上述计算步骤,增加权重因子计算部分,详见图1。

Fisher最优分割根据各指标对样本分类的重要性赋予权重系数w1,w2,…,wn,权重系数的大小可能影响最优分割结果。基于前人研究结果[13-16,19],本文选择主成分分析法、熵权法和变异系数法确定权重系数,比较3种方法对Fisher最优分割结果的影响程度。

1.2.1 主成分分析法

主成分分析法(Principal Component Analysis, PCA)由Karl和Pearson提出,利用变量的线性变换,寻找一组新的不相关的变量,原则是保持变量的总方差不变,根据变量的方差大小确定主成分的顺序,从而减少变量的冗余信息,最大程度的挖掘变量包含的信息[19]。根据主成分的贡献率以及与各指标的相关程度确定综合得分模型,其中综合得分模型的系数反映各指标变量在主成分中的综合重要度,据此可以确定指标变量的权重[16,19]。主成分分析法确定权重的具体步骤较为常见[19],在此不再详述。

1.2.2 熵权法

(9)

由信息熵与指标权重的关系定义指标的熵权:

(10)

1.2.3 变异系数法

变异系数法认为当某一指标值的变异程度越大,反映系统特征的差异越大,指标的区别程度越好,应该赋予较大的权重,反之亦然[23],例如李俊应用变异系数法和模糊集理论确定黄河流域吴城水库的汛期分期[24]。设x的取值为X={x1,x2,…,xi-1,xi},则该指标的变异系数为:

(11)

指标权重为:

(12)

2 实 例

2.1 研究区概况和数据

江西省七一水库位于信江支流金沙溪中游,坝址以上控制流域面积324 km2,水库的总库容22 800 万m3,正常蓄水位160.40 m(黄海高程,下同),是一座以灌溉为主,兼有防洪、发电、供水等综合效益的大(Ⅱ)型水库。七一水库现行防洪运行方式为:主汛期为4月1日-6月30日,主汛期汛限水位为159.00 m;后汛期为7月1日-9月30日,后汛期汛限水位为160.00 m。

本次所使用的基础数据为七一水库、土城、童家坊3个雨量站的逐日降雨资料,七一水库逐日入库流量资料。分期使用降雨资料为七一水库站和土城站的逐日降雨的算术平均值,1993年后的土城站的资料,移用童家坊的降雨资料进行延长,因童家坊和土城的同时期的(1970-1992年)的年降雨相关性达0.96。根据水库所处流域的气象水文背景和相关文献调研[4-8],本文汛期分期指标采用以下6个指标,包括旬最大日流量,旬平均日流量,旬暴雨日数,旬最大日雨量,旬最大3日雨量和旬雨量和。

2.2 分期计算

2.2.1 权重计算结果

3种方法计算的指标权重如表1。权重差异最大的指标为旬暴雨日数,变异系数法和熵权法确定的旬暴雨日数权重较大(分别为0.34,0.43),而主成分分析法对应的该指标权重小于0.2。暴雨事件的随机性较大,旬暴雨日数的变化范围为0~4 d。在全部指标的变异程度上,旬暴雨日数的变异系数最大。因此前两种方法确定的旬暴雨日数指标权重为最大值,反映该指标的不确定性程度最大。除旬暴雨日数,变异系数法和熵权法确定的旬最大日流量等5个指标的权重基本一致。主成分分析法确定的6个指标权重中仅有2个指标(旬最大日流量、旬平均日流量)的权重与前两种方法的结果一致,其他指标与前两种方法的结果差异较大。

就不同指标的差异而言,旬暴雨日数的变异性最大(变异系数为3.24),其次为流量指标(旬最大日流量、旬平均日流量),变异系数为1.50~1.63,而雨量指标(旬最大日雨量、旬最大3日雨量、旬雨量)的变异性最小,变异系数在1.03~1.13。变异性越大反映指标的不确定性程度越强,指标提供的系统的信息越多。因此暴雨日数对汛期分期可能存在较大影响,其次为流量相关的指标,而雨量相关的指标对汛期分期的影响可能较小。同时,由于旬最大日雨量和旬最大3日雨量两个指标的变异系数非常接近,且两者存在较好的相关性,意味着两个指标存在一定同一性,今后的汛期分期中则可以适当减少雨量指标的数量。

表1 3种方法计算成果Tab.1 Calculation results of three methods

2.2.2 Fisher最优分割结果

各方法计算所得权重系数与各指标值代入公式(2)得到初始样本分类向量(图2),应用最优分割递推算法[公式(5)~(7)]可得不同分类数对应的最小目标函数值和分割位置(图3和表2,表2以变异系数法权重的计算结果为例,其他方法计算结果省略)。由计算结果可知,k=3时曲线存在明显拐点,相应的分期为{1,10},{11,12},{13,21},即3月上旬-6月上旬为前汛期,6月中旬-6月下旬为主汛期,7月上旬-9月下旬为后汛期。

表2 目标函数计算结果(变异系数法)Tab2. Calculation result of objective function (variation coefficient method)

为进一步精细化分析汛期时段区间,同时根据水库实际调度的需求进行分析,当k=3时前汛期长达3个月,不利于水库动态汛限水位调控,而且在后汛期中7月上旬与7月下旬-9月下旬的样本值存在明显的差异(图2),体现其过渡性特征,另外,4月中旬-5月的样本值与3月也存在一定的差异,反映主汛期与前汛期、后汛期之间的过渡性,综合以上考虑,水库汛期可划分为5期,根据Fisher最优分割法对k=5进行分期,其相应分期为{1,4},{5,10},{11,12},{13},{14,21},即3月上旬-4月上旬为前汛期,4月中旬-6月上旬为前汛过渡期,6月中旬-6月下旬为主汛期,7月上旬为后汛过渡期,7月中旬-9月下旬为后汛期。从分期结果上看,七一水库汛期分5期是在3期的结果上进一步的细化,整体结果隶属于3期的分期结果。

进一步对分类数为5类时的分期结果进行F检验发现,自由度分别为4和16,F=48>Fα=4.07,即在0.01的显著性水平上分期结果之间存在显著差异。应用熵权法和主成分分析法权重的Fisher最优分割结果与变异系数法权重的Fisher最优分割结果一致,此处不再赘述。

2.3 分期结果比较

2.3.1 成因分析

金沙溪流域位于赣东北暴雨中心边缘,以亚热带锋面气旋雨为主,常出现在5-7月份。因孟加拉湾和南海暖湿气流与北方冷空气团相遇时切交线的南北徘徊,容易形成暴雨过程。暴雨移动方向大多由西至东,或西北向东南移动,有时出现静止锋,形成暴雨中心稳定少动现象[25]。实测资料表明,每年暴雨次数约为3~7次,雨量占全年的15%~25%。一次暴雨持续时间大多为1~2 d,持续时间在3~4 d以上的很少。7-9月则以不稳定的热气流上升形成的雷阵雨为主,雨区较小,历时短,强度较大,但日雨量不大。期间偶有西太平洋入侵大陆的台风影响,形成历时较短、风强、雨量较大的降雨过程。10月-次年2月,主要受西伯利亚和蒙古干冷气流影响,一般降雨量较小,仅占全年的32%[25]。

金沙溪为雨源性补给河流,流域调蓄能力较差。径流、水位随降雨情况而变化,年内分配不均匀。根据1960-2017年七一水库站统计资料,10月-次年1月为枯水期,来水量占全年的16%。3-6月为丰水期(汛期),来水量占全年的57%,其余各月为平水期。洪水出现季节多在5-6月。因此,从流域所处的水文气候背景来看,水库的主汛期宜为5-6月,汛前期可能在3-4月,而汛后期宜为7-9月,这一划分与本文的汛期分期结果基本一致。

2.3.2 数理统计

图4是各旬暴雨日数、雨量、最大日流量和入库水量的统计特征。总体而言,不同期间的水文气象指标存在较大差异。主汛期(6月中旬-下旬)的各项指标均为最大值,因此6月中旬-下旬划分为主汛期符合水库流域的暴雨径流特征。汛后过渡期(7月上旬)的各项指标位于主汛期和汛后期的过渡状态。尽管汛前过渡期(4月中旬-6月上旬)与汛前期(3月上旬-4月上旬)的旬雨量和入库水量差异较小,但汛前过渡期的暴雨日数和最大日流量与汛前期存在较大差异,说明汛前过渡期与汛前期的总降雨和径流量差异不大,但汛前过渡期存在较多的暴雨事件,形成的最大日流量明显大于汛前期,反映其水文气象特征的过渡特性,因此4月中旬-6月上旬划分为汛前的过渡期也较为合理。汛前(3月上旬-4月上旬)和汛后期(7月中旬-9月下旬)的各项水文气象指标均为最小值,因此各划分为单独的一期。因此,数理统计分析结果与本文使用Fisher最优分割结果是一致的,反映本文分期结果的合理性。

2.3.3 系统聚类

本文采用系统聚类法[2,3]对七一水库的汛期进行聚类分析,基于旬最大日流量、旬平均日流量、旬暴雨日数、旬最大日雨量、旬最大3日雨量和旬雨量和等6个指标的层次聚类结果如图5。图示可知,研究样本可划分为4类,分别为{11,12},{5,7~10,13},{1~4,6},{14~21},对应时期为{6月中下旬}、{4月中旬,5月-6月上旬,7月上旬}、{3月-4月上旬,4月下旬}、{7月中旬-9月}。基于系统聚类的结果与基于Fisher最优分割的分期结果基本上是一致的,其中第一类{6月中下旬}为主汛期,第二类{4月中旬,5月-6月上旬,7月上旬}以主汛期为界,划分为汛前过渡期{4月中旬-6月上旬}和汛后过渡期{7月上旬},第三类{3月-4月上旬,4月下旬}中的{3月-4月上旬}为汛前期,{4月下旬}划分至汛前过渡期,第四类{7月中旬-9月}为汛后期。

3 结论与建议

(1)通过对七一水库汛期分期计算及分析,认为主成分分析法、熵权法和变异系数法确定指标的权重均适用于Fisher最优分割在水库汛期分期。计算结果表明,3种方法计算的权重存在一定的差异,但这种差异对最终的分期结果的影响较小。

(2)就3种方法确定指标权重而言,变异系数法和熵权法更适用于指标权重的确定。变异系数法和熵权法量化了指标的不确定性程度,两者计算的指标权重较为一致,较好的区分出暴雨日数、流量、雨量等不同指标的差异;主成分分析方法计算的各指标之间的权重差异较小,难以揭示不同水文气象指标的差异性。

(3)不同算法所得的指标权重结果应用于七一水库汛期分期计算,其采用Fisher最优分割法的结果与数理统计、系统聚类等方法的分析结果一致,可为水库汛期优化调度提供参考。

(4)通过对确定指标权重的3种方法计算表明,今后汛期分期工作中可以对权重算法所得的指标变异系数进行分析,从而为后期优选适宜于该流域汛期分期的关键指标提供参考。

猜你喜欢

雨量分析法暴雨
异步机传统分析法之困难及其克服
“80年未遇暴雨”袭首尔
基于DEA分析法的全国公路运输效率分析
当暴雨突临
雷州市早稻稻纵卷叶螟迁入发生情况
基于层次分析法的智慧城市得分比较
基于层次分析法的智慧城市得分比较
信息化雨量、水位站在水文工作的应用探讨
农业气象谚语在汛期降水气候预测的应用
电化学发光分析法测定糖尿病相关二肽