APP下载

基于多元线性回归数学模型的有区间汇流河道洪峰关系定量研究

2012-03-23鹏,张

海河水利 2012年2期
关键词:产流洪峰流量雨量

杨 鹏,张 强

(1.海河水利委员会水文局,天津 300170;2.天津水文水资源勘测管理中心,天津 300061)

1 前言

用河道上游断面洪峰流量预测下游断面洪峰流量是洪水预报的重要环节,以往多数做法是建立河道上下游断面洪峰流量经验关系。河道无区间汇流加入,其相关关系较好;或上下游断面间虽含有一个区间,但区间降雨比较均匀,各场降雨的流域前期影响雨量大致相同,同时河道没有区间来(引)水,其相关关系也较好,且上下游断面洪峰流量关系比较稳定。如果不满足上述条件,比如各场降雨的流域前期影响雨量相差较大,那么就要考虑这一因素对流量关系的影响。

在较大的区间流域降雨往往很不均匀,其降雨径流关系不很稳定,主要原因是各场降雨雨区的产流面积变化很大。如果雨区内不产流的面积越大,则损失的水量在总雨量中的比重就越大,径流系数也就越小。因此,如果把不产流地区的面积在集流面积中扣除,产流区的降雨量和径流量的关系就比较稳定。

根据以上分析,把一场降雨分成产流区和非产流区,产流区和非产流区的边界可定为雨量等于初损值的等雨量线,凡是降雨量小于初损值的地区都不产流。在上下游流量关系中除了区间雨量和前期影响雨量外,再增加一个产流面积系数(Cf)和一个净雨历时(Pt)作参数,即雨量大于初损值的雨量站为产流站,初损值用流域一次降雨平均雨量与一次降雨产流量的差值来确定,产流站数(n)与总雨量站数(N)之比为产流面积系数(Cf=n/N)。当降雨集中在较小地区时(Cf较小),损失量小,径流量大;反之,当降雨分布面广且均匀时,损失量大,径流量小。所以,在其他因素相同时,产流面积系数与径流量成反比关系。

净雨历时在有些地区对洪峰流量的影响也很显著,在其他因素相同时,净雨历时越长则流量过程线越矮胖,洪峰值越低;反之,净雨历时越短则流量过程线越尖瘦,洪峰值越高。所以,净雨历时与洪峰流量成反比关系。

由于此问题是要确定因变量与自变量之间的关系,因此考虑采用多元线性回归数学模型进行定量研究。

2 多元线性回归数学模型的建立

2.1 数学模型

式中:Y 为因变量;X1,X2,X3,…,Xm为自变量;a0,a1,a2,…,am为未知待定参数;e 为n(0,σ)随机变量。

以海河流域永定河官厅至三家店河道为例,因变量是三家店的洪峰流量,用Y 表示;自变量是官厅的洪峰流量,用X1表示;区间降雨量与前期影响雨量之和用X2表示;区间产流面积系数用X3表示;净雨历时用X4表示。

通过对n 场洪水的观测得到一组数据:

式中:下标α 为观测序号,其值为1~n,此处n=22;X的第二下标表示自变量序号,其值为1~m,此处m=4。将这组数据代入式(1)得到:

式(3)也可以表示为:

2.2 正规方程组及其解

当n>m+1 时,式(3)构成矛盾方程组,a0,a1,a2,a3,a4不能同时满足方程组(3)。为了对a 进行估计,采用最小二乘法,设b0,b1,b2,b3,b4分别是a0,a1,a2,a3,a4的最小二乘估值列向量,则估计的回归方程为:

所谓a0,a1,a2,a3,a4的最小二乘估计b0,b1,b2,b3,b4是指使以下的残差平方和(Q)达到最小。

由极值定理对式(6)求导,并令其等于0,则b0,b1,b2,b3,b4可由方程组(7)解出。

方程组(7)称为正规方程组,式中除b0,b1,b2,b3,b4外,其他值都是已知的,所以可以求出b0,b1,b2,b3,b4的值,通过对22 场实测洪水的计算,最后求出b0,b1,b2,b3,b4的值分别为-1 087.6,1.559 2,7.197 1,-437.22,8.173 5。所求的回归方程为:

3 回归方程的检验

3.1 回归方程的显著性检验

由于求出的回归方程并不是在任何情况下都有意义,为此先假设Y 与X1,X2,X3,X4符合式(1)的模型,即假设a1,a2,a3,a4不全为0,然后用观测资料对假设进行检验,以决定是否接受这一假设,也就是决定所得到的回归方程是否可以采用。为了便于确定检验用的统计量分布,我们采用上述假设的对立假设作为原假设,即H0:a1=0,a2=0,a3=0,a4=0。

解决这一问题可先将Y 的总平方和进行分解,再推导出检验用的统计量的分布,最后利用这一分布,根据观测资料对式(2)进行检验,以决定对H0的取舍。

Y 的总平方和可分解为两个部分:

即有S总=S剩+S回,根据F 分布定义,当H0成立时,则:

服从自由度为(m,N-m-1)的F 分布,对于指定的α,由F 分布表可查得Fα(m,N-m-1) ,当由式(2)计算得出的F>Fα(m,N-m-1)时,则拒绝H0,认为线性回归模型式(1)适合于该组资料。由该组资料计算得到的方差分析,见表1。

表1 方差分析

设采用显著水平(α)=0.05,由F 分布表可查得Fα(4,17)=3.007,故F>Fα,回归方程(8)显著,可以接受。

3.2 回归系数的显著性检验

前面对回归方程进行了显著性检验,即通过检验回归方程(8)是显著的,但这只是拒绝了H0:a1=0,a2=0,a3=0,a4=0 ,即“回归系数全部为0”这一假设,并不能排除某个ai可以为0 的可能性,而ai=0 即表示Xi与Y 没有线性关系。我们自然不希望在线性回归方程中包含那些与Y 没有线性关系的变量,因此,除了对回归方程进行显著性检验外,还需要对每一个变量(Xi)进行检验。

假设H0:ai=0,如果检验结果接受这一假设,则Xi就应该从回归方程中剔除,反之则应该保留。下面陈述检验步骤。

用与前面相同的方法做Y 关于m-1 个变量(m=4)的回归方程以及S总,S剩(m-1),S回(m-1)与S剩m,S回m比较,由于自变量减少,S剩(m-1)必增大,等价地S回(m-1)也必减小,故有:

式中:Vm表示在m-1 个自变量基础上增加一个自变量Xi后S剩减小的量(即S回增加的量),称其为Xi的方差贡献,这个量越大,表示Xi对Y 的线性关系越密切。

计算出所有m 个Vm后,选其中最小的一个设为Vk,相应的变量为Xk,于是Xk就是在所有m 个变量中对Y 的线性关系最差的一个,因此只要对其进行检验就可。如果Xk的作用显著,在回归方程中就应该保留,其他变量自然也作用显著,在回归方程中也应该保留。对于本组资料而言,V1=3 034 028,V2=3 459 019,V3=72 001,V4=144 869。

V3远小于V1、V2、V4,表示X3(产流面积系数)对于Y 的线性关系远不如X1(官厅洪峰流量)、X2(区间降雨量与前期影响雨量之和)、X4(净雨历时)对Y 的线性关系密切,这也是可以预料的。对X3进行检验:

在H0:a3=0的假设下,F3=V3/[S剩/(N-m-1)]=6.684 服从F(1,N-m-1)分布,采用显著水平(α)=0.05 ,由F 分布表可查得Fα(1,17)=4.494,故F3>Fα,拒绝H0:a3=0 ,表示X3作用显著,在回归方程中应该保留。

表2 回归方程检验结果

4 观测资料检验结果

利用所求的回归方程对该组观测资料进行检验,以相对误差小于20%为合格标准,合格率为95.5%,6 场大水(三家店洪峰大于1 000 m3/s)全部合格(见表2)。

在官厅洪峰(Q官)与三家店洪峰(Q三)关系中,如果以区间降雨量(P)代替区间降雨量与前期影响雨量之和(P+Pa),则合格率只有57.1%,这说明前期影响雨量(Pa)对径流的影响较大,在实际计算时特别对于汛期第一场洪水不能忽略。

在Q官-Q三关系中,如果不考虑P+Pa的影响,合格率只有19.0%; 如果不考虑产流面积系数(Cf)的影响,合格率为61.9%;如果不考虑净雨历时(Pt)的影响,合格率为19.0%。

[1]长江流域规划办公室.水文预报方法[M].北京:水利电力出版社,1982.

[2]华东水利学院.水文学的概率统计基础[M].北京:水利电力出版社,1981.

猜你喜欢

产流洪峰流量雨量
产流及其研究进展
宁夏红柳沟流域水沙变化及产沙分析
不同坡面单元人工降雨产流试验与分析
北京山区侧柏林地坡面初始产流时间影响因素
基于小波去噪的称重雨量数据分析
暴雨强度公式编制之基础数据质量控制
地表粗糙度对黄土坡面产流机制的影响
退耕还林工程对渭河洪峰流量的影响
佛冈县潖江流域年洪峰流量P-Ⅲ分布参数估算
SL—1 型雨量传感器故障分析排除和维护