APP下载

基于熵权法的改进Fisher最优分割法在水库汛期分期中的应用

2019-07-30夏青青李英海郭家力汪利林伟

人民珠江 2019年7期
关键词:权法三峡水库信息熵

夏青青,李英海,郭家力,汪利,林伟

(三峡大学水利与环境学院,湖北宜昌443002)

水库汛限水位分期控制是在确保水库大坝及其下游防洪安全的前提下,合理利用洪水资源、缓解汛期防洪与兴利之间矛盾的有效手段。但是如何根据流域气象、水文等信息科学、准确地对汛期进行划分,是进行分期汛限水位控制首要解决的关键问题。

传统的汛期分期方法主要有成因分析法、数理统计法、模糊集合分析法和基于分形理论的方法等[1]。然而,这些分期方法各有优缺点:成因分析法建立在对研究流域的水文、气象的成因分析基础之上,分期结果因有较高的可靠性而被普遍采用,但在分析暴雨天气的成因上存在一定的主观性,也难以将汛期细分到天;数理统计法根据水文要素的统计规律进行分期,具有原理简单、实用性强、可操作性强等优点,但是指标阈值的选取具有较强的主观性;模糊集合分析法考虑了汛期指标在时间上的模糊性,但存在分期指标单一、阈值的选取上具有主观性的问题;基于分形理论的方法物理背景强,但只能考虑单因子指标且需样本容量较大、计算繁琐。

Fisher最优分割法是一种对有序样本系列进行最优分段的数学统计方法,将Fisher最优分割法应用于汛期分期,为解决分期多指标选取、分期数目以及相邻分期分界点难确定等问题提供了有效手段[2]。当运用Fisher最优分割法在进行汛期分期时,选取的各个指标的权重如何确定将直接影响分期的准确性。目前的赋权方式主要有赋均权重[3]、专家评分法[2]、模糊层次分析法(FAHP)[4]、主成分分析法(PCA)[5]等。其中赋均权重将各个指标的权重均值化,忽略了不同指标的重要程度的差异;而专家评分法、模糊层次分析法和主成分分析法需要借助主观经验确定指标权重,忽略了对各个指标中隐含有用信息的挖掘。针对这一问题,本文借助熵权法计算指标权重的客观性,提出基于熵权法的改进Fisher最优分割方法,并将其应用于三峡水库汛期分期问题。

1 Fisher最优分割法原理与步骤

Fisher 最优分割法属于有序聚类方法的一种,能保证样本序列的时序性,这与汛期的天然时序性相吻合。该方法以各个分段总离差平方和最小为依据,以各段内样本间差异最小、各分段间差异最大为基本原则[2]。

1.1 数据处理

xij′=

(1)

式中xij——第i行第j列数据;xmax,j、xmin,j——第j列的最大、最小值。

然后,根据各个指标所占比重大小加权平均后得到向量Y:

(2)

式中ωj——第j个指标的权重。

1.2 定义类直径

(3)

式中yt——第t个分类中的样本值,1≤t≤k。

若用D(it,it+1-1)来表示某一类Pt的类直径,则可记为:

(4)

1.3 定义目标函数

定义目标函数为k类类直径之和:

(5)

使目标函数值最小的分割即为Fisher最优分割,记为:

(6)

1.4 最优分割的推求

有序样本{y1,y2,…,yn}的最优k分割是在其某一截断末尾子段的最优分割B*(n,k-1)之后再添加一段形成的,因此最优k分割的递推公式为:

B*(n,k)=

(7)

若分类k(1

先找到分割点,使B*(n,k)达到最小,即:

B*(n,k)=B*(ik-1,k-1)+D(ik,n)

(8)

于是得第k类为Pk={yik,yik + 1,…,yik + 1 -1};然后找分割点ik-1,使其满足:

Bk(ik-1,k-1)=B*(ik-1-1,k-2)+D(ik-1,ik-1)

(9)

得到第k-1类Pk-1={yik-1,yik-1 + 1,…,yik -1}。依照同样的方法,可求出所有分类P1,P2,…,Pk,由此得到最优k分类的分类结果。

1.5 最优分段数k的确定

2 基于熵权法的Fisher最优分割法改进

采用Fisher最优分割法进行汛期分期时,需要对选取的各个指标进行赋权。熵权法以变量隐含的信息熵为基础,是一种客观的权重赋值方法[7-8]。在汛期分期中,根据指标的信息熵计算其对应的权重,尽量消除权重计算的人为干扰,使指标权重的确定更符合客观实际。本文引入熵权法对Fisher最优分割法中指标进行赋权,其基本过程如下。

a) 根据信息熵的定义以及Fisher最优分割法在数据处理中得到的标准化矩阵X′,采用下式计算指标j的熵值Hj。

(10)

b) 根据指标j熵值Hj计算其熵权ωj′。

(11)

c) 将Fisher最优分割法中向量Y的计算权重由熵权ωj′确定,得到向量Y′,见公式(12),并按照后续过程对向量Y′进行分期计算,再运用Fisher最优分割法对向量Y′进行分期计算。

(12)

3 实例计算与分析

三峡水库是长江上游干流的控制性水库工程,汛期防洪是其主要功能,防洪库容221.5亿m3。根据三峡水库正常运行期防洪调度规则,每年6月10日水库水位降至汛限水位145 m,并从6月10日至9月30日都维持单一汛限水位运行[8]。由于未考虑汛期洪水变化规律,未进行分期汛限水位控制,导致每年三峡水库在汛期会产生大量弃水,而在汛末可能出现无水可蓄的问题。因此,分期汛限水位是提高三峡水库汛期水资源利用效率的有效手段。而要实现汛限水位分期控制,首先要解决的就是汛期分期问题。

3.1 基于改进Fisher最优分割法的三峡水库汛期划分

表1 旬多年指标特征值

利用式(1)对指标特征值进行标准化处理,然后采用熵权法计算5个指标信息熵及其熵权结果,利用式(10)、(11)计算得其信息熵和熵权,见表2。

表2 旬多年分期指标信息熵和熵权确定

将标准化处理后的数据按式(12)赋予相应的权重,得到向量Y′。用it表示该类分割的起点,it+1-1表示该类分割的终点,由于本研究中将汛期划分为11旬,所以it={1,2,…,10},it+1-1={2,3,…,11},D(it,it+1-1)表示Pt={yit,yit + 1,…,yit + 1 -1}的类直径。进一步的,采用式(3)、(4)计算各种组合的类直径D(it,it+1-1),见表3。

利用式(5)—(9)计算出最优k分割的最优值B*(n,k)(其中n=11,k=2,…,10),再计算出f(k),见表4。

利用表4中的数据绘制B*(n,k)-k曲线和斜率差值f(k)-k曲线,见图1。

由图1可以看出,最优值B*(n,k)在k=2和k=3时相对较大,斜率差值f(k)在k=3时取得最大值,因此综合判断,取k=3为最优分段数。由表3可知k=3时对应的分类为1~2、3~7、8~11,故与之相应汛期划分结果为:6月10至30日为前汛期,7月1日至8月20日为主汛期,8月21日至9月30日为后汛期。

表3 类直径D(it,it+1-1)计算

表4 最优k分割结果

3.2 结果分析

从气候成因[9-10]来看,长江流域具有明显的季风气候,上游主要支流有金沙江、岷江、沱江、嘉陵江和乌江。根据西太平洋副热带高压脊线位置移动对降水影响可知:在6月中旬至下旬,暴雨主要出现在乌江流域、嘉陵江东部和三峡区间,若三者不同时遭受暴雨,则宜昌站不会出现大量级洪水;7月上旬至8月中旬,雨带位于长江上游,且易形成川西暴雨,随着副高脊线周期性地东退西进,暴雨逐渐东移,易造成上游各个支流产生大量级洪水,在这个时期宜昌站易出现峰高量大的洪水。8月下旬,金沙江流域降水较多,而岷江、沱江和嘉陵江降水较少,因此宜昌出现量级较大洪水的概率较小。从9月初开始,长江上游受西风带偏北气流影响,整个流域降水量减少。10月以后,副热带高压脊线南退到北纬20°以南,长江汛期随之结束。因此,根据成因分析确定三峡水库汛期分期结果为6月中旬至下旬为前汛期、7月初至8月中旬为主汛期、8月下旬至9月底为后汛期。这与基于熵权法的改进Fisher最优分割法的分期结果基本一致,说明改进方法对汛期的划分符合洪水季节变化规律。

进一步,为检验本文的改进方法是否合理,选取旬信息熵的相对平均离差RMAD[7]作为分期评判标准,RAMD值越小表明分期方案越合理,其计算公式见式(13)、(14)。在计算得到的汛期分期的标准上将相应的分割点向后挪1个或2个位得到新分期方案,比较各方案RAMD大小。文献[7]给出了详细的计算步骤,计算结果见表5。

(13)

(14)

式中Si——旬信息熵;RMADk——第t类的相对平均离差。

表5 分期方案相对平均离差RMAD值

由表5得方案1的相对平均离差为0.040,较其他方案小。进一步,采用基于赋均权重和主成分分析(PCA)[5]的Fisher最优分割法对三峡水库汛期进行划分,5个指标的权重分别为(0.200,0.200,0.200,0.200,0.200)、(0.203,0.207,0.207,0.200,0.183),2种方法最后计算得到三峡水库汛期分期结果均为前汛期为6月10至30日,主汛期为7月1日至9月10日,后汛期为9月11至30日,即与表5中的方案3对应。而方案3相对平均离差为0.041相比方案1略大。因此,对比3种方法可知,本文改进方法所得分期更加合理。

4 结论

为解决Fisher最优分割法中各指标赋权重主观性强的问题,更加科学准确地进行水库汛期分期,本文提出一种基于熵权法的改进Fisher最优分割方法,并将其应用于三峡水库进行汛期分期,在确定分3期为最优的基础上,将三峡汛期划分为前汛期(6月10日至30日)、主汛期(7月1日至8月20日)、后汛期(8月21日至9月30日)。通过气候成因分析和旬信息熵的相对平均离差RMAD计算对分期结果进行评价,结果表明,通过熵权法计算Fisher最优分割法中各指标的权重能够尽量消除权重计算的人为干扰,分期结果相比基于主成分分析和赋均权重的Fisher最优分割法更为准确。

猜你喜欢

权法三峡水库信息熵
基于熵权法的BDS钟差组合预测模型的建立
熵权法在水资源与水环境评价中的研究进展
基于信息熵可信度的测试点选择方法研究
基于熵权法的城市轨道交通系统运营效率
近似边界精度信息熵的属性约简
基于信息熵的承运船舶短重风险度量与检验监管策略研究
信息熵及其在中医“证症”关联中的应用研究