APP下载

基于混合地理加权回归的复杂地形降水量插值

2020-04-25崔琴芳董佰山

甘肃科学学报 2020年2期
关键词:环境变量克里插值

崔琴芳,杨 耘,2,刘 艳,董佰山

(1.长安大学地质工程与测绘学院,陕西 西安 710054;2.西部矿产资源与地质工程教育部重点实验室,陕西 西安 710054;3.中国气象局乌鲁木齐沙漠气象研究所,新疆 乌鲁木齐 830002)

水资源是人类赖以生存和生产的最基本物质基础,降水则是主要的来源,由于人力、物力和财力有限导致气象站点分布不均匀,导致大部分区域空间的降水数据无法直接获取。新疆玛纳斯河流域地形复杂多变,不便于气象观测点的布设,并且降雨季节分布极不均匀,因此采用空间数据的插值方法来推测相邻地区降水量显得尤为重要。进行空间插值研究时,应充分考虑插值过程中对降雨有重要影响的地形等因子。

常规的降水量空间插值方法有:样条函数插值(Spline)、反距离权重插值(IDW,inverse distance weighted)、克里金插值(Kriging)、趋势面插值(Trend)等[1-7],但是在地形地貌复杂多样、气象站点分布稀疏的地区对降水量空间分布模拟的吻合程度不高,无法满足相对精度要求。地理加权回归克里格(GWRK,geographically weighted regression kriging)是地理加权回归(GWR,geographically weighted regression)与回归克里格(RK,regression kriging)的结合,用地理加权回归克里格(GWRK)中的局部回归代替回归克里格(RK)中的全局回归,而残差仍采用克里格插值的一种混合插值方法[8-11],能够在顾及回归关系空间非平稳性的同时考虑回归残差的空间自相关。

1 数据准备

1.1 研究区概况

玛纳斯河流域位于 85°01′~ 86°32′E,43°27′~45°21′N,地处欧亚大陆腹地,新疆天山北麓、准噶尔盆地南缘,属内陆干旱区,年平均气温6.8 ℃,年降水量110~200 mm,流域内土壤主要类型为灰漠土,地表过程复杂,是北疆地区的一个典型流域(见图1)。该流域地形呈南高北低走势,源头海拔5 000~5 500 m,山地垂直地带性特征十分明显。

1.2 数据来源及处理

研究采用玛纳斯河流域21个气象站的月平均降水量(2015年3月)数据,数据精度0.1 mm;在地理空间数据云下载MODIS月植被指数数据产品MOD13A3,精度为1 km;同时下载数字高程模型(DEM,digital elevation model),精度为30 m,然后对DEM高程数据进行1 km×1 km重采样后,再提取出坡度、坡向图。最后根据每个站点所在的地理坐标位置提取相应的海拔、坡度、坡向以及植被指数。

图1 研究区气象站点分布Fig.1 Distribution of study areas and meteorological stations

1.3 研究思路

研究所用软件平台:SPSS;GS+;ArcGIS 10.2;GWR 4.0。根据研究区地形地貌特征可知,地形特征是影响降水量空间分布的主要因素,因此,选择表达地形的海拔、坡度、坡向[4]以及可以反映降水量空间分布的归一化植被指数共4个影响因子作为辅助变量,来进行回归克里格、地理加权回归克里格以及混合地理加权回归克里格3种方法空间插值。

2 研究方法

2.1 回归克里格法

(1)

2.2 地理加权回归克里格法

地理加权回归克里格(GWRK)是地理加权回归(GWR)与回归克里格(RK)方法相结合,GWR模型是对OLR模型的扩展,将RK中的全局线性回归用GWR中的局部回归代替,对空间非平稳性进行量化,位置x0处目标变量对环境变量的回归系数不再是常数,而是用空间权重函数(空间位置的函数),研究中采用bi-squarev函数作为空间权重函数[5],在点x(ui,vi)处的GWR模型为

i=1,2,…,n

(2)

其中:(ui,vi)为第i个测站点的坐标;βk(ui,vi)是第i个测站点上的第k个回归参数,是关于地理位置的函数;εi~N(0,σ2)。为表示方便,将βk(ui,vi)简写为βik。

2.3 混合地理加权回归法

混合地理加权回归(MGWR,mixed geographically weighted regression)是在GWR模型的基础上提出来的,其公式为

(3)

GWR模型适合用在解释变量具有明显的空间非平稳性下进行建模,但是在许多实际问题中,解释变量中往往既包括全局变量,又包括局部变量,解释变量中有些可能不具有空间非平稳性,或者空间非平稳性较小可忽略不计[4-6]。降水的影响因素中可能同时包含空间平稳性和非平稳性2种类型,故使用MGWR模型进行降水量的空间分布特征分析。

月平均降水量混合地理加权回归克里格插值过程:利用GWR4.0软件建立月平均降水量与4个影响因子间的GWR模型,并对回归变量进行空间变异性检验,当DIFF标准在0~2之间时,说明变量的空间变异性较弱,这时候将该变量作为全局回归变量建立了式(3)的混合地理加权回归模型,得到地理加权回归模拟的趋势项表面;然后对模型中代表随机性的残差进行地统计分析和普通克里金插值,得到残差项表面;最后将两表面进行栅格运算[1],得到月平均降水量的空间插值结果。

3 结果与分析

3.1 月平均降水量描述性统计

描述性统计便于描述测量样本的各种特征及其所代表的总体特征。对研究区内21个气象站点月平均降水量的观测数据进行了描述性统计,结果见表1。由表1可知,玛纳斯河流域3月份的降水量在0.2~33.4 mm之间,平均降水量12.186 mm;变异系数达到43.58%,属于中等变异,月平均降水量近似服从正态分布。

电阻率值为3.64~11.22 Ωm,声波时差为231.58~302.57 μs/m。从电测曲线解释成果可以看出视电阻率值有升高现象,同时声波时差值变小。

表1 月平均降水量描述性统计

3.2 平均降水量与环境变量间回归分析

根据逐步回归结果,研究采用海拔、坡度、坡向以及植被指数4个环境变量对月平均降水量进行插值研究(见表2),同时环境变量的方差膨胀因子(VIF,variance inflation factor)均小于10,说明环境变量间不存在多重共线性问题,可进行建模实验。

表2 环境变量及共线性检验

3.3 平均降水与环境变量回归分析

(1) 回归克里格插值 建立基于普通线性回归的全局回归克里格进行逐步回归分析,平均降水量与4个环境变量间的回归关系为

yi=8.951+0.017×SLOPE+0.338×ASPECT+15.735×NDVI-0.002×DEM,

(4)

普通线性回归所得到的系数都是常数,表达了各环境变量对目标变量在研究区范围内影响的平均值,回归模型的R2为0.776,调整R2为0.765。

(2) 地理加权回归插值 根据GWR4.0软件所得加权回归结果,建立降水量与环境变量之间的地理加权回归模型:

yi=β0i+β1iSLOPE1i+β2iASPECT2i+

β3iNDVI3i+β4iDEM4i+εi。

(5)

然后对其地理加权逐步回归所得的每个环境变量的系数值在ArcGIS中可视化,这样便能知道每个环境变量在不同的地理空间上对平均降水量的变化,GWR模型的每个环境影响因子的回归系数显示如图2所示。

(3) 混合地理加权回归模型 研究对地理加权回归变量的空间变异性检验进行了分析(见表3)。由表3可知,海拔DIFF值为0.302 1,坡向DIFF值为1.281 1,得出这2个环境变量空间变异值较弱,因此将DEM与ASPECT设为全局变量,来提高模型模拟的精度,建立混合地理加权回归模型:

yi=β0i+β1iSLOPEi+β2ASPECTi+

β3iNDVIi+β4DEMi+εi,

(6)

其中:常数项是变常量;DEM、ASPECT为全局变量;其余为局部变量,且存在较强的空间变异性。地理加权回归模型的R2为0.826,调整的R2为0.804。

3.4 回归残差地统计分析

在GS+软件中对3种回归模型的回归残差进行半方差函数分析(见表4),由表4可以看出,3种回归模型的各半方差函数的块基比均小于25%,说明各回归后的残差存在比较强的空间自相关性,可以使用克里格对其进行空间插值。在ArcGIS中选择合适的模型对残差进行克里格插值,得到残差的空间分布。

3.5 模型精度比较

将气象观测点降水量数据分为2个部分(见图1),一部分(80%的点)用于建模,另一部分(剩下的20%的点)用于验证,选择平均绝对误差(MAE,mean absolute error)进行3种不同插值方法的插值精度的比较,评价指标为

(7)

其中:n为验证站点的个数;y1i为第i个站点的实际降水量值;yi2为第i个验证站点的预测模拟值,值越接近于0说明模型精度越高[8-9],结果显示mGWRK、GWK、RK方法的平均绝对误差依次增大,表明其模拟精度依次降低,基于局部回归的mGWRK插值精度最高。

3.6 混合地理加权回归克里格进行月平均降水量插值

对2015年12个月的月平均降水量利用混合地理加权回归克里格方法进行插值,插值时选择合适的局部变量、全局变量来进行插值研究,具体属性设置见表6,得到的月平均降水量空间插值分布如图3所示。

图2 地理加权回归系数Fig.2 Geographically weighted regression coefficient

表3 地理加权回归模型变量空间变异性检验

表4 RK法残差半变异函数模型对比

表5 RK、GWRK、mGWRK方法插值精度

由图3可知,2015年新疆玛纳斯河流域全年降水量分布不均匀,雨量较为稀少,降水量主要分布在夏季,其次是春季,秋季、冬季降水量偏少。降水主要集中在4月至8月,期间降水量占全年降水量的60%,其中7月降水量最多;玛纳斯河流域降水量总体上与我国西北地区气候变化趋势相一致。

表6 mGWRK模型回归变量属性设置

图3 月平均降水量空间分布Fig.3 Monthly average precipitation spatial distribution

4 结论

研究选取新疆玛纳斯河流域为研究对象,该研究区地形地貌复杂多变。以2015年整年的月平均降水量为例,采用回归克里格(RK)、地理加权回归克里格(GWRK)、混合地理加权回归克里格(mGWRK)3种方法对其进行了插值。结果表明,研究采用的混合地理加权回归模型降水量插值精度优于回归克里格和地理加权回归克里格,由于在实际的应用中并不是所有的回归变量在空间上都存在空间变异性。因此便需要对不同的回归关系设置回归变量的不同属性,即局部还是全局回归变量,这样才能正确表达模型中回归变量与因变量的空间关系,最后分析利用混合地理加权回归克里格模型对2015年全年降水量插值的空间分布结果。

猜你喜欢

环境变量克里插值
大银幕上的克里弗
从桌面右键菜单调用环境变量选项
彻底弄懂Windows 10环境变量
你今天真好看
基于Sinc插值与相关谱的纵横波速度比扫描方法
你今天真好看
混合重叠网格插值方法的改进及应用
要借你个肩膀吗?
一种改进FFT多谱线插值谐波分析方法
基于四项最低旁瓣Nuttall窗的插值FFT谐波分析