APP下载

基于相对关联距离熵的水文变异点识别*

2011-01-24陈晓宏陈志和

关键词:博罗相空间水文

杜 建,陈晓宏,陈志和

(中山大学 水资源与环境研究中心∥广东省高校水循环和水安全重点实验室,广东 广州 510275)

受人类活动和气候变化的影响,水文特征的时间变异是客观存在的,认识一个区域水文要素变化规律,修正区域水文时间序列长序列变化的非一致性,从而可为洪水预报、水资源开发以及水利工程设计施工和管理提供科学依据。目前在水文时间序列中用于确定可能变异点的方法,如有序聚类法、Mann-Kendall检验法、秩和检验法、R/S分析法[1]、贝叶斯方法[2]、启发式分割算法[3]和信息测度模型[4]等,这些方法大多数是从概率统计方面来研究,却很少有从系统内部的特征变化来识别水文变异点。

由于降雨、径流等水文过程受众多因素的影响而造成强烈的变异性,表现出伪随机特征,致使传统确定性数学模型对这些水文过程的模拟遇到了很大的困难,而混沌理论的出现为研究这种高度复杂的系统提供了新的思路[5],所以从20世纪80年代开始,混沌理论和方法在降雨、径流、洪涝、地下水、水质以及降雨-径流分析及预测等水文水资源领域的应用研究快速发展[6-7]。

水文变异点在水文系统状态发生改变时表现出来,如何提取系统内部状态变化的信息成为识别水文变异点的关键。由时间序列重构相空间的过程可知:重构相空间中点的轨迹是原时间序列动力性质的一种反映。如果系统的状态发生了变化,轨迹的形状及大小必然发生相应的变化。如能找到反应轨迹的形状及大小变化的参数,则可从系统内部特征的变化找到水文变异点。文献 [8]曾应用相对关联距离熵来描述统重构后相空间中轨迹形状及大小的变化,将其应用于内燃机气门漏气故障诊断研究中,取得了较好的效果。

本文尝试应用混沌理论对水文变异点进行诊断,在重构水文时间序列的基础上,根据反映系统状态变化的相对关联距离熵的变化来对水文序列时间变异点进行识别,以期对水文变异分析做进一步探讨。

1 水文时间序列的相空间重构

混沌学从理论走向应用很大程度上取决于Packard 和 Takens提出的相空间重构理论[9-10]。相空间重构把系统中每一点的实质性信息都抽象出来,揭示了其它方式看不见的运动模式,就象红外线照片可以揭示非感官所及的图形和细节一样,这对于研究复杂的水文系统是一个很有力的工具[11]。相空间重构能保持水文时间时序所对应的原动力系统内在结构的几何不变性,系统中任一分量的演化都是由与之相互作用着的其它分量所决定的,因此这些相关分量的信息就隐含在任一分量的发展过程之中[12]。时间延迟技术是时间序列相空间重构最常用的方法,即为了重构一个等价的状态空间,只需考察一个分量,并将它在某些固定的延迟时间间隔点上的测量作为新维处理,它们确定了某个多维状态空间中的一点,重复这一过程并测量相对于不同时间的各延迟量,就可以产生出许多这样的点,它可以将系统的许多性质保存下来,即用系统的一个观察量可以重构出原动力系统模型。

水文系统可以看作是具有n个变量的动力系统[13],用下述方程表述:

系统的时间演变的状态空间可由坐标x(t)加上其(n-1)阶导数所构成的n维相空间来表示,即

Ruelle提出用离散的时间序列x(t)和它的 (m-1)时滞位移构建一个新的m维相空间 (即嵌入相空间),以代替这种连续变量x(t)和它的导数所反映的系统状态空间,即

其中,τ为滞时,也称延迟时间。对于某一水文站可观测的径流时间序列x1,x2,…,xn,选定τ和m,则其重构嵌入相空间可表示为:

其中,N=n-(m-1)τ

从水文径流时间序列重构相空间的过程可知:由时间序列重构的相空间中点的轨迹是原时间序列动力性质的一种反映。轨迹的形状及大小均反映了原系统的动力性质,如果系统的状态发生了变化,那么其外在表现必然发生相应的变化。

2 径流序列的混沌性识别

Lyapunov指数是一个谱系 λi(i=1,2,…,m-1),若谱系中只有最大者为正值,则系统为一维混沌;若谱系中具有两个或两个以上正的Lyapunov指数,则系统为多维混沌或超混沌,否则系统为非混沌。因此,一般用最大Lyapunov指数来进行混沌分析。最大Lyapunov指数是判断混沌存在的一个重要依据,对于时间序列 x1,x2,…,xn,其求取方法如下[13-14]:先按上节所述方法进行相空间重构,然后根据式 (5)求得欧氏空间意义上Yi的最近邻点及两点间距离,最后根据式 (6)求最大Lyapunov指数λ。

其中N=n-(m-1)τ。

根据以上方法,求得东江流域博罗站月径流系列的最大Lyapunov指数为0.245,从而说明了该水文时间序列存在混沌特性。

3 基于相对关联距离熵的水文变异识别方法

变异点是水文序列发生急剧变化的一种表现形式,当水文系统从一种状态转化为另一种状态时表现出来,水文系统状态的改变将导致水文时间序列的随机性和混沌强弱程度发生变化,进而使得重构相空间中相轨迹点的分布情况发生改变,从而相空间点分布的疏密程度也会发生改变。如何从重构的轨迹中提取反应水文状态变化的信息,将成为水文变异诊断成功与否的一个关键环节,而相对关联距离熵正是体现了这一变化的特征参数。

相对关联距离熵的计算方法如下[8]:

1)有水文时间序列 {xi}(i=1,2,…,n),以嵌入维数m和延迟时间间隔τ重构相空间,按照上述重构相空间的方法得到重构相空间中的点{Yi}(i=1,2… N,N=n-(m - 1)τ)。

2)求相空间中系统相轨迹点对之间的距离

3)求相空间中系统相轨迹点对之间的距离的最大值

4)对相空间中系统相轨迹点对之间的距离dij进行归一化处理

5)定义绝对关联距离熵

由CH的表达式可知,定义的关联距离熵反映了系统相轨迹上点在相空间中分布的疏密程度,是系统在重构相空间中轨道性质的一种反映。对于变点,是观测值的分布按某种规律变化,而在变点处发生突变,改换成另一种规律,在水文时间序列重构相空间的表现是相轨迹点的疏密程度发生了改变,而CH是一个能很好反映这种变化的参数。但是CH反映的是一种绝对大小,与相点个数有关,由此可知这与数据的个数n以及相空间选取的嵌入维数m和延迟时间间隔τ有关,而m和τ的选择是人为控制的,不具有客观性,不利于水文要素的变异点识别,在此基础上提出相对关联距离熵的概念。由于CH反映了动力系统在重构相空间中轨迹上点分布的疏密程度,点分布越均匀则CH的绝对值越大,而点分布越集中则CH的绝对值越小。因此当轨迹上点均匀分布时CH值应为最大,令其为CHmax,在此基础上,对CH进行归一化处理,这样得到的熵称为相对关联距离熵。

经处理后得到的Hd是反映系统性质的参量,与N无关,Hd是一个无量纲的量,有利于水文变异的诊断,系统性质的改变将导致重构相空间中轨迹点分布疏密程度的不同,从而CH不同,相应的Hd不同,Hd是反映系统性质的参量。

因相空间重构对数据长度有一定要求,假设变异的点在j年,其中j={8,9,…,n},取j时刻前的时间序列xj,在重构径流相空间的基础上,按照以上方法求出时间序列 xj的 Hd(xj),计算 Hd(xj)的增值比d Hd(xj),即

找出dHd(xj)最大的那一点,则视这一点为变异的最大点,相应便可诊断出变异的年份。

4 实例研究

如果流域受到自然及人类大规模活动影响,从而流域的自然条件、下垫面条件会发生改变,这些会使该流域水文时间序列的特征数相对关联距离熵发生变化。因此,可以通过分析流域水文时间序列的相对关联距离熵的变化,找出该时间序列的变异点。本文以广东省东江流域博罗站1956-2005年的逐月径流量时间序列为例来验证本方法的有效性。

假设变异的点为 j={8,9,10,…,n},取 j时刻前的时间序列xj,在重构径流相空间的基础上,按照以上方法求出时间序列xj的Hd(xj),其中m=4,τ =8,计算Hd(xj)的增值比

d Hd(xj),找出dHd(xj)最大的那一点,则视这一点为变异的最大点,相应便可诊断出变异的年份,分析的计算结果如表1所示。

表1 博罗站径流序列相对关联熵与相对关联距离熵增值比Table 1 Relative correlation distance entropy and increment ratio of Hd(xj)of runoff series at Boluo Station

从表1可见,相对关联距离熵Hd在1.09-1.14之间,变化的幅度较小,这主要相对关联距离熵反映的是相空间主对角线方向点分布的疏密程度,使得重构相空间中点的疏密程度改变不是特别明显,但是从表1可以看出,1963-1972年的Hd在1.09~1.11之间交替变化,1973-1979年的Hd在1.12左右,1980-1983年的Hd在1.13左右,1984-2005年的Hd在1.14左右,由此可见1963-1972年的变化较其他年份变化剧烈,在1963-1972年径流序列发生变异的可能性最大,这主要因为在60-70年代东江流域开始进行大规模的水利建设,在此期间新丰江水库、东深供水等水利工程相继建成,这些人类活动的影响可能导致径流序列的状态发生变化。从图1年增值比d Hd(xj)的变化趋势看,1963-1972变化比较剧烈,1973-1985年变化次之,1986-2002年变化缓慢,从2003年开始又有变化较大的趋势,这与东江流域的主要水利工程的建设的过程是一致的,东江流域的三大水库中新丰江水库 (1962年建成)、枫树坝水库 (1973年建成)、白盆珠水库 (1985年建成)的相继发挥作用,使得博罗站的径流发生变化。从图1中的年增值比dHd(xj)的变化可以明显的看出博罗站径流量在1972、1982年发生较大变化1972年明显变化最大,所以1972年可以诊断为东江流域博罗站径流量的变异点,这与文献 [15]东江流域水文特征在1972年发生变异的结论相一致。

图1 博罗站径流序列Hd(xj)的增值比的变化Fig.1 Change of the increment ratio of Hd(xj)of runoff series

为了近一步探讨径流序列变异的原因,分析博罗站年径流量与博罗站面雨量的相关关系 (图2),在变化前 (1956-1972年),降雨径流的相关系数为0.969,变化后 (1973-2000年)降雨径流的相关系数为0.937,而新丰江水库与博罗站年径流的相关关系 (如图3所示)在变化前 (1961-1972年)的相关系数为0.895,变化后 (1973-2005年)的相关系数为0.933,由此可看出,博罗站径流量在受降雨影响的同时,越来越受新丰江水库的调节作用的影响。从图1还可以看出除1972年变化较大外,1982年也变化较大。为了探讨1982年变化较大的原因,分析1973-1982年博罗站与枫树坝水库年径流量的相关系数为0.789(图4),而在1982变化后的相关系数为0.856,而此时 (1973-1982年)博罗站年径流与面雨量的相关性0.966,而在1982变化后博罗站年径流与面雨量的相关性为0.951。

同样表明,博罗站的径流受到枫树坝水库的调节作用。1972年变化比1982年变化剧烈是因为新丰江是东江流域最大的水库,总库容为138.96亿m3,具有多年调节能力,而枫树坝水库的总库容为19.32亿m3,相比与新丰江水库,枫树坝水库的调节性能小的多。综上所述,东江流域降雨径流变化过程关系密切,降雨对径流的影响有随着年代推移而减弱的趋势。这说明,变化环境下,径流主要受降雨影响的同时,愈来愈受到水利工程的影响,在径流演变过程中的作用越来越不容忽视。

为了与传统的水文变异方法比较,对东江博罗站的径流序列做Mann-Kendall突变点检验,如图5所示。

图5 博罗年径流量Mann-kendall统计量曲线Fig.5 M-K trends of runoff series at Boluo Station

从曲线的交点来看,有多处交点,位置在1963、1966、1972、2002年,但是无法判断哪些交点是比较显著的变点。Mann-Kendall方法对于趋势变化明显的单变点情形既简单而且直观有效,但若对多变点情形误用可能得出错误结论,必需在先验的了解数据规律后,对多变点情形分段应用该法。而基于相对关联距离熵的水文变异点的识别方法可以清晰的判断出比较显著的变点。

关联距离熵反映了重构相空间中吸引子轨道的分布及形状,体现了系统的本质特征,从而具有较好的对系统性质表达能力。根据相对关联距离熵的变化来反应系统平稳性和随机性的变化,水文变异点是在从一种状态转化为另一种状态时表现出来,在相空间中的体现是相空间点轨迹点的疏密程度发生变化,而相对关联距离熵正是体现了这种变化。基于关联距离熵的水文时序变异点的识别从系统的动力特征的角度,探索从系统内部的特征的变化来辨识水文系统的状态的跳跃,从而识别出水文变异点。

基于相对关联距离熵的水文变异点识别方法与其他水文变异点识别方法相比,能清晰的识别多个变点的情况,计算简单,从系统的动力特征的角度,识别了水文变异点。从关联距离熵的定义可知,关联距离熵反映的是系统在相空间中沿主对角线方向点分布的疏密程度,但无法反映系统在相空间中其它方向的分布情况,使得在应用中关联距离熵的变化不是特别明显,如何从重构的吸引子中提取更全面、能反映系统的参数需要进一步探讨。

5 结论

本文以东江博罗站50年月径流量序列为例子,应用混沌理论中相对关联距离熵对博罗站月径流序列进行水文变异识别。首先将月径流量构成多维相空间,展示系统的动力特征,并基于此计算序列的相对关联距离熵,分析相对关联距离熵的变化来辨识系统的变化,从而识别出水文变异点。本方法从系统的动力特征的角度,探索从系统内部的特征的变化来识别水文变异点,作为水文变异点识别的新方法是可行的。水文系统状态的改变,在相空间点的疏密程度也会发生改变,但是变化程度在相空间中沿主对角线方向反映不是特别明显,如何从重构的吸引子中提取更全面、能反映系统的参数尚需要进一步探讨研究。

水文时间序列既有确定性的部分,又有随机性的部分,探索水文的变化规律,把握水文变化特征,更可靠的的预测未来,选用相关研究方法是非常重要的。本文将混沌理论中相对关联距离熵引入到水文变异点的识别是一次有益的尝试,尚需要进一步研究和完善。

[1]王孝礼,胡宝清,夏军.水文时序趋势与变异点的R/S分析法[J].武汉大学学报:工学版,2002,35(2):10 -12.

[2]熊立华,周芬,肖义等.水文时间序列变点分析的贝叶斯方法[J].水电能源科学,2003,21(4):39-41.

[3]陈广才,谢平.基于启发式分割算法的水文变异分析研究[J].中山大学学报:自然科学版.2008,47(5):122-125.

[4]肖宜,穆宏强,申明亮.差异信息理论在水文时间序列变异点诊断中的应用[J].中国农村水利水电,2002,11:28-30.

[5]丁涛,周惠成,黄健辉.混沌水文时间序列区间预测研究[J].水利学报,2004(12):15 - 20.

[6]王红瑞,宋宇,刘昌明等.混沌理论及在水科学中的应用与存在的问题[J].水科学进展,2004(5):400-407.

[7]李荣峰,沈冰,张金凯.基于相空间重构的水文自记忆预测模型[J].水利学报,2006(5):583 -588.

[8]夏勇,赵红.基于关联距离熵诊断方法研究.振动与冲击[J],2003,22(2):76 -77.

[9]ROSSLER O E.An Equation for Continuous Chaos[J].Phys Lett,1976,57:13 -15.

[10]PACKARD N H,CRUTCHF IELD J P,FARMER J D,et al.Geometry from a time series[J].Phys Rev Lett,1980,45(9):712 - 716.

[11]赵永龙,丁晶,邓育仁.混沌分析在水文预测中的应用和展望[J].水科学进展,1998(6):181-186.

[12]吕金虎,陆君安,陈士华.混沌时间序列分析及其应用[M].武汉:武汉大学出版社.2002.

[13]石教智,陈晓宏.林汝颜.东江流域降水时问序列的混沌特征分析[J].中山大学学报:自然科学版,2006,45(4):111 -115.

[14]LAI Y C,LERNER D.Efective scaling regime for corn.puting the correlating dimension for chaotic time series[J].Physica D,1998(11):10 -18.

[15]刘德地.变化环境下水资源优化配置[D].广州:中山大学,2008.

猜你喜欢

博罗相空间水文
继往开来 守正创新——河北省水文工程地质勘查院
分分合合的坏
继往开来 守正创新——河北省水文工程地质勘查院
水文
水文水资源管理
相干态辐射场的Husimi分布函数在非对易相空间中的表示
宋明广东仕宦推行孝文化探析
我的博罗,又小又安静
非对易空间中的三维谐振子Wigner函数
博罗县抗战纪事