开垦河6-8月平均流量有序回归分析与预报

2021-01-18琪美格

农业灾害研究 2021年2期

琪美格

摘要开垦河位于新疆奇台县境内，发源于东天山博格达山脉北坡，开垦河水文站是其水量控制站。本文选用开垦河水文站19602019年68月平均流量并构建为分类因变量（预报对象），5月下的的平均气温、4月下的的平均流量和4月上的降水量为预报因子，用SPSS进行有序回归分析，对2020年68月平均流量各类可能发生的概率进行预报，结果令人满意。

关键词开垦河;分类因变量;有序回归分析;预报

中图分类号：P457

文献标识码：A

文章编号：2095-3305（2021）02-032-02

0引言

每年5月，政府防御等部门要求水文部门提供当地主要河流夏季来水趋势分析成果，由于新疆河流夏季来水变幅大、随机性强，増大了预报难度。本文通过选用开垦河水文站夏季前期预报因子，将2020年68月平均流量构建为反映夏季来水偏丰、正常或偏枯的分类因变量，对其未来各类可能发生的概率用有序回归分析进行尝试预报，确保满足精度要求。

1基本思路

取值有内在大小或高低顺序之分的分类因变量，称为有序多项分类因变量（简称分类因变量），对其各类可能发生的概率进行预报，可用有序回归分析法。

有序回归分析就是通过一组预报因子，采用逐步改变参照类的方法，建立多个类似二值LogisticI的回归方程，以此来描述分类因变量各类与参照类相比的条件下预报因子对预报对象的作用。

如果预报对象y（分类因变量）有J类別别，令第（1，2，，）类的概率为P，则∑P=1，且y≤j的累加概率可表示为P（y≤j）=P1+…：P。P（y≤j常用Logit连接函数，若用x（k=12，…，m，m是预报因子总数）表示预报因子，a和b分别表示第类的常数项与预报因子回归系数，则Logit连接函数形式为：

式中，=1，2，…，J-1，（下同），由此可建立J1个累加Logitt模型，第j个累加Logi模型类似一个二值Logistic回归模型，其中1～类合并为一类，而+1）～J类再合并为另一类，再将两类相比较（后一类为参照类，并逐步改变），即将原来的多项分类通过合并转变成了一般的二值分类。累加LogitA模型的J-1个预测概率回归方程为：

由上式可计得分类因变量各类可能发生的概率：第1类的概率为P1=P（y≤1），第j类的概率为P=P（y≤j）-Py≤j-1）]，第J类的概率为P=1-Py≤（J-1）]。

在J1个连接函数和预测概率模型中，回归系数b是假设不变的，仅常数项a在改变。

2有序回归分析与预报

2.1构建6-8月平均流量分类因变量

开垦河水文站1960-2019年5月下旬句平均气温T53、4月下旬旬平均流量Q43、4月上句降水量P41及6-8月平均流量Q序列SPSS数据文件（仅显示局部）见图1。

Q序列多年均值为10.6m/s。本次约定，Q低于9.54m/s（即距平值《-10）时，来水量为偏枯，对应的分类因变量Y取1;介于9.54ms和11.7m/s之间（即距平值介于-10和10之间）为正常，Y取2;高于11.7m/s（即距平值》10）为偏丰，Y取3。构建的分类因变量Y序列见图1，其中，预报因子是通过1-5月句平均流量、句降水量、旬平均气温与Q建立逐步回归方程优选而得的。

2.2有序回归分析

SPSS操作步骤为：

步骤1：在图1中依次单击菜单“分析→回归→有序”，从弹出的Ordinal回归对话框左侧的列表框中选择“Y”，移动到因变量列表框，选择T53”、“Q43”和'P41”，移动到协变量列表框。

步驟2：单击“输出”按钮，在打开的对话框中勾选“拟合度统计”、“摘要统计”、“参数估计”和“平行线检验”，单击“继续”按钮，返回Ordinall回归对话框。

步骤3：单击“确定”按钮，执行有序回归的操作。

2.3回归效果的统计检验

SPSS输出的回归效果统计检验结果如下：

（1）案例处理摘要：60个分类因变量个案全部有效，其中偏枯27个，正常15个，偏丰18个。

（2）模型拟合信息：仅包含截距项的模型和最终模型的似然比检验结果，其-2倍对数似然值分别为128.051、102.584，c2=25.467，自由度为3，显著性水平p-0.00050.001，表明最终模型要优于只含截距项的模型，即最终模型成立，说明模型中至少有1个预报因子有统计学意义。

（3）拟合优度检验：Pearsonc2及偏差c2分别为130844（p=0.148》0.05）、102.584（p=0.790》0.05），表明有序回归方程预测值与观测值之间的差异无统计学意义，意味着模型拟合优度较好。

（4）累加Logit模型的J-1（J=3）个预测概率回归方程的参数估计累加Logt模型预測概率计算式（2个）

由上式可计得分类因变量各类可能发生的概率P：P1=P（y≤1），P2=P（y≤2）-P（y≤1），P3=1-P（y≤2）;其中，P1是类别1（偏枯型）的预测概率P2是类别2（正常型）的预测概率，P3是类别3（偏丰型）的预测概率。5）平行线检验：广义c2为2.245，D=0.523》0.05，说明在0.05显著性水平下，T53、Q43、P41的回归系数在不同分类因变量水平上是相对不变的。

2.4预报

开垦河水文站2020年T53为15.1℃，Q43为1.81m/s，P41为0.0mm，代入上述2个累加Logit模型预测概率计算式，计得P（y≤1）P（y≤2）分别为0.78和0.94。由此可计得分类因变量各类可能发生的概率P：P1=P（y≤1）=0.78，P2=Py≤2）-P（y≤1）0.16，P3=1-P（y≤1）=0.22。

可见，P1值最大，所以分类因变量Y取1的可能性最大，即开垦河水文站2020年68月平均流量预计为偏枯的可能性较大。实际情况是5.73ms，低于偏枯的上限值9.54m/s，属于偏枯型，预报正确。

3结语

（1）通过优选前期预报因子，用有序回归分析对分类因变量Y未来各类可能发生的概率进行预报，是一次成功的尝试。

（2）有序回归模型拟合信息表明，最终模型成立，且至少有1个预报因子有统计学意义;拟合优度检验显示，模型拟合优度较好;平行线检验表明，预报因子的回归系数在不同分类因变量水平上均相对不变。

（3）2020年68月平均流量丰枯趋势的预报结果正确，说明有序回归分析适用于中长期水文定性预报。

参考文献

[1]旦木仁加甫，中长期水文预报与SPSS应用[M]郑州：黄河水利出版社，2011.

责任编辑：黄艳飞

农业灾害研究

2021年2期

开垦河6-8月平均流量有序回归分析与预报

杂志排行

农业灾害研究的其它文章