APP下载

基于Copula函数的水文变量条件组合分析

2014-10-21刘和昌梁忠民唐甜甜

水力发电 2014年5期
关键词:洪量富春江洪峰

刘和昌,梁忠民,姚 轶,唐甜甜

(河海大学水文与水资源学院,江苏 南京 210098)

0 引 言

目前,在水文计算中采用的多是特定组合的分析方法,如最不利组合、同频率组合等。理论上,进行多变量的组合分析计算,必须给出变量间的联合概率分布函数。目前,应用最广泛的是多元正态联合分布;但其针对的是各变量边际分布为正态分布的情形。非正态分布,原则上需要对变量进行正态化变换,变换过程复杂且会使一些信息失真,限制了其使用范围。

近年来兴起的基于Copula函数的多维联合分布理论[1],将变量间的联合分布分解为变量间的相关性结构和变量的边缘分布,为构建多变量联合分布提供了有力的数学分析工具。由于Copula函数对变量的边际分布线型没有任何限制,而且联合分布函数可以解析表达,所以在水文领域中得到了较广泛的研究和应用。Favre等[2]首次利用Copula函数研究了洪水地区组成及峰量组成的计算问题;Poulin等[3]针对多变量频率分析中的尾部相关,研究了Copula函数的选型问题;肖义等[4]应用Copula计算洪水峰、量联合分布,以并集联合分布概率为设计标准作为控制,由此对典型洪水过程线进行放大,获得设计洪水过程线;郭生练等[5]对copula函数在水文中研究与应用的进展进行了评述和总结;张娜等[6]通过Copula函数分别构建最大日雨量与最大时段雨量的联合分布,以推求设计暴雨过程;闫宝伟等[7]根据Copula联合分布的条件期望组合概念,研究了设计洪水的地区组成计算方法;梁忠民等[8]采用三变量Copula函数,分析了三峡水库预泄对鄱阳湖防洪的影响。

本文基于Copula函数推导了条件最可能组合的计算公式,并对钱塘江水系的4个站点洪水频率进行了分析计算,提供了不同设计标准条件下最可能组合的峰、量设计值及其90%的置信区间,并与同频率组合及条件期望组合的结果进行了对比分析。

1 Copula函数和条件组合

1.1 Copula函数

Copula函数是定义域为[0,1]均匀分布的多维联合分布函数,二维Copula函数为[1]

式中,C为Copula函数;θ为Copula的参数;u=FX(x),v=FY(y)分别为随机变量X和Y的边缘分布。相应的联合概率密度函数为

式中,c(u,v)为Copula函数的密度函数;fX(x)和fY(y)分别为随机变量X和Y的概率密度函数。

在水文领域,两个变量单参数Archimedean Copula函数簇应用最为广泛,Gumbel-Hougaard Copula函数即为其中一种。Gumbel-Hougaard Copula函数适于变量间存在正相关的情形,并且能描述变量间的上尾相关性[3],故本文选用Gumbel-Hougaard Copula作为联合分布函数,其表达式为

其密度函数为

函数参数θ与Kendall秩相关τ系数间关系如下

采用离差平方和准则 (OLS)来评价Copula方法的拟合度

式中,Pei和Pi分别为经验频率和理论频率。

1.2 边缘分布

随机变量X和随机变量Y均采用P-III分布,则其概率密度函数

式中,Γ(α)为伽玛函数;α、β和a0分别为形状、尺度和位置参数。

随机变量X和随机变量Y的分布函数

式中,x0和y0为大于0的任一值;fX(x)和fY(x)分别变量X和变量Y的概率密度函数。

1.3 条件组合

1.3.1 条件最可能组合

当变量X取设计值xp时,变量Y所对应的值并非唯一,可大可小,只是出现不同值的概率不一样,即存在一个条件概率分布

此时,FY|X(y)的密度函数fY|X(y)=c(u,v)fY(y),而当fY|X(y)取最大值时对应的yM值所形成组合(xp,yM),即为条件最可能组合。fY|X(y)为y的一元函数,将密度函数fY|X(y)对y求导,得

式中,c1=∂c(u,v)/∂v,c、u、v定义同上。 再令dfY|Xdy=0,整理得:

求解式(12),可得x取xp时,y的最可能取值yM。

1.3.2 条件期望组合

本节中,在给定变量X的值为xp时,y的期望值E(y|xp)对应的组合(xp,E(y|xp))即为条件期望组合[7]。其中,E(y|xp)的计算如下:

式中,fY|X(y)=c(u,v)fY(y),为FY|X(y)的密度函数;(v)为v=FY(y)的反函数。

变量X取值为xp时,若令FY|X(y)分别等于α/2和1-α/2,求得的Y值分别为yl和yu;则已知xp时y的1-α的置信区间为[yl,yu]。

2 实例分析

以钱塘江湖南镇、黄坛口、新安江和富春江4个站点40年的洪水资料为例,对本文所提方法进行应用分析,其中湖南镇、黄坛口、新安江位于钱塘江支流上,富春江位于干流上。洪峰和时段洪量均按服从P-III型曲线分布,采用线性矩法估计分布参数,各站点年最大洪峰 (m3/s)和时段洪量 (亿m3)统计参数估计结果见表1;洪峰和时段洪量间的Kendall秩相关系数τ由式(5)计算,其结果及对应的OLS值见表2。

表1 各站点统计

表2 各站点τ值和OLS值

以富春江站为例,通过给定不同洪峰值,由式(12)和式 (10)可分别求得对应的7天洪量条件最可能值和90%的置信区间。为了对比分析,也提供了条件期望值及同频率值的估计结果 (见图1,2及表3,4)。

图1 富春江站以洪峰为条件的7天洪量估计结果

图2 富春江站以7天洪量为条件的洪峰估计结果

表3 富春江站以洪峰为条件的7天洪量的各种估计值

表4 富春江站以7天洪量为条件的洪峰的各种估计值

考虑洪峰与7天洪量之间的相关性,条件最可能组合是给定洪峰值 (或7天洪量)时,7天洪量(或洪峰)取值的最可能情况,条件期望组合则代表的是其取值的平均情况,两种组合方法均具有一定的统计基础;一般认为,目前常用的同频率组合法是一种更偏安全或保守的方法。

由图1~2可知,富春江站,在给定洪峰值情况下,以设计频率等于17%为界 (对应约6年一遇重现期),当其小于17%时,7天洪量的条件最可能值介于同频率值与条件期望值之间,同频率值最大;在给定7天洪量情况下,当设计频率小于25%时(对应4年一遇重现期),洪峰的条件最可能值位于同频率值和条件期望值之间,同频率值最大。因此,对富春江站而言,当设计标准超过6年一遇时,按照最可能组合条件计算的峰、量设计值,其数值介于按同频率组合与条件期望组合的估值之间,同频率组合的估值最大。

湖南镇、黄坛口和新安江3个站,也作了上述分析计算,结果类似。其中,湖南镇的设计频率临界值为25%,黄坛口的为14%,新安江的为29%,即当其设计频率小于该值时,按照最可能组合条件计算的峰、量设计值,其数值介于按同频率组合与条件期望组合的估值之间;另外,估计结果也表明,同频率组合的估值均是最大的。

因此,可以初步认为,对于钱塘江水系,当设计频率小于14%时 (对应于8年一遇以上的重现期),同频率组合方式计算的设计洪水大于条件期望组合和条件最可能组合的结果。对于水库工程而言,其设计标准一般都是较高的,如百年一遇、千年一遇等;所以按照同频率组合的设计成果一般都是偏于安全的。本文的研究表明,最可能组合计算的设计值介于同频率组合与期望组合的设计值之间。

3 结 论

(1)在联合分布的基础上,推导了条件最可能组合的计算公式,为计算峰、量条件最可能设计值提供了基础。

(2)对钱塘江水系4个站点的洪水频率分析结果表明,按照最可能组合条件计算的峰、量设计值,其数值介于按同频率组合与按条件期望组合的估值之间。由此也证明了,目前的同频率法设计洪水计算成果一般是偏于安全的。

(3)条件最可能组合代表的是变量间的一种最可能遭遇出现的方式,较适合于水文事件的组合情况,但本文的结果仅是初步的,值得作进一步研究。

[1]NELSON R B.An introduction to Copulas[M].New York:Springer,1999.

[2]FAVRE A-C,ADLOUNI S E,PERRAULT L,et al.Multivariate hydrological frequency analysis using Copulas[J].Water Resource Research,2004,40(1),W01101.

[3]POULIN A,HUARD D,FAVRE A C,et al.Importance of tail dependence in bivariate frequency analysis[J].Journal of Hydrologic Engineering,2007,12(4):394-403.

[4]肖义,郭生练,刘攀,等.基于Copula函数的设计洪水过程线方法[J].武汉大学学报: 工学版,2007,40(4):13-17.

[5]郭生练,闫宝伟,肖义,等.Copula函数在多变量水文分析计算中的应用及研究进展[J].水文,2008,28(3):1-7.

[6]张娜,郭生练,肖义,等.基于联合分布的设计暴雨方法[J].水力发电,2008,34(1):18-21.

[7]闫宝伟,郭生练,郭靖,等.基于Copula函数的设计洪水地区组成研究[J].水力发电学报,2010,29(6):60-65.

[8]梁忠民,郭彦,胡义明,等.基于Copula函数的三峡水库预泄对鄱阳湖防洪影响分析 [J].水科学进展,2012,23(4):485-492.

猜你喜欢

洪量富春江洪峰
赣江流域洪水峰量演变规律及联合分布研究
杭州 富春江边富春山
富春江的绿
富春江的绿
辽河干流主要控制站近75年最大洪峰及洪量变化特征分析研究
淡定!
解禁洪峰
富春江之美
昌马水库排空过程泥沙含量的计算分析