APP下载

东北三省及内蒙古自治区降水量空间插值方法比较

2022-11-08洪,郭

广西林业科学 2022年5期
关键词:格法气象站方根

李 洪,郭 琳

(1.国家林业和草原局西南调查规划院,云南昆明 650216;2.水资源安全北京实验室 首都师范大学,北京 100048)

降水量对气候变化监测意义重大,直接关乎人类的生产和生活。随着社会经济发展和生态环境变化,水资源的保护与开发利用等日益受到关注[1-2]。降水空间分布信息在水资源管理、灾害预测预警和区域可持续发展等方面的作用也越来越重要[3]。由于人力和经济等因素,目前气象站点的布设存在较大局限性,不同空间尺度下降水数据的精度要求难以得到满足[4],定点观测到的数据大多不能直接用于其他地点,更不能替代某一较大面积区域的平均值[4-5]。探索可靠和有效的空间插值技术,通过已知站点的降水数据进行空间内插,转化生成区域内高精度的降水量空间分布图,尤为重要[4,6]。

降水量具有间断性和空间不连续性的特点,且小时降水量零值较多[7],受多个地理要素的综合影响,其空间插值表现出较多的不确定性[1,6]。常用的插值方法有多项式法、趋势面法、反距离加权法、径向基函数法和克里格法等[8]。已有研究表明,当数据密度足够大时,各插值方法用于同一组气象数据的插值结果差异不大,但在数据分布稀疏和差异显著时,插值方法的选择及其计算参数的设定尤为关键[9]。应根据插值数据的特征、精度及计算效果等,选择合适的插值方法[10]。

本研究以东北三省及内蒙古自治区123个气象站台的月平均降水数据为基础,对协同克里格法、普通克里格法和反距离加权法3种空间插值方法进行比较分析,寻找适宜东北三省及内蒙古自治区降水量的最佳插值方法,为这些地区的水资源监测及应用提供可靠的数据支撑。

1 材料与方法

1.1 研究区概况

研究区为东北三省及内蒙古自治区(106°40′~132°92′E,38°90′ ~ 52°97′N)。东北三省包括黑龙江、吉林和辽宁3省,是我国的老工业基地和粮食主产区,具有综合的工业体系、完备的基础设施、丰富的农产品资源和优良的生态环境,是极具潜力的富饶之地。内蒙古自治区土地广阔,位于我国北部边疆,是中国第3大省区,也是我国最大的草原牧区。研究区跨度大,地形和气候差异较大,降水分布不均。研究区地理位置及气象站点的分布情况如图1所示。

图1 研究区地理位置及气象站点分布示意图Fig.1 Geographical locations and distributions of meteorological stations in study area

1.2 数据分析与预处理

1.2.1 数据源

选取东北三省及内蒙古自治区123个气象站的月平均降水数据;其中,黑龙江省32个气象站,辽宁省25 个气象站,吉林省25 个气象站,内蒙古自治区41 个气象站。用于空间插值的资料,还包括各站的经纬度、海拔高度和平均气温,各气象站的空间分布情况如图2所示,各数据的统计见表1。气象站分布不均匀,内蒙古自治区较稀疏,吉林和辽宁省较密集。降水量、海拔和平均气温均波动较大。

表1 空间内插数据统计Tab.1 Statistics of spatial interpolation data

图2 研究区气象数据的空间分布特征Fig.2 Spatial distribution characteristics of meteorological data in study area

1.2.2 降水量数据空间分布特征

降水量数据的空间分布特征直接影响降水量内插方法的选择。通过ArcGIS平台构建123个气象站降水量数据的泰森多边形,获得研究区平均降水量空间分布信息(图3);通过趋势分析工具,以降水量为高度构建三维透视图(图4);通过直方图、QQ‑plot 图等,对降水量数据分布的整体趋势、分布均衡性、正态性、聚集性和随机性进行分析,掌握降水量空间分布的基本特征。

图3 降水量数据泰森多边形Fig.3 Tyson polygons of precipitation data

图4 降水量数据整体分布趋势Fig.4 Overall distribution trends of precipitation data

降水量从西至东呈增加趋势,在南-北方向上呈U 型分布,存在明显趋势性。在数据的自相关分析中,考虑数据的Moran′s ⅠIndex = 0.4,信度Z 为9.05,参照统计先验信息,数据有高度的自相关性。气象站的分布均衡性是判断内插数据质量的一个重要指标;正态分布是多种随机数据处理的基础假设,数据如果能符合这种假设,则能应用多种基于随机数据思想的内插方法进行内插。降水量数据本身不呈正态分布,需对数据进行变换处理,使数据更趋于正态分布。有学者运用对数、立方根和平方根等变换方式对数据进行预处理,提高空间插值预测的精度[11]。本研究中,首先对样本数据进行整体分析,揭示降水量的空间分布特征,并选择Log 变换方式对降水量数据进行预处理。

1.2.3 降水量数据与其他数据相关性分析

从机理上考虑,降水量受经度、纬度、海拔和气温等多方面因素的影响,对降水量数据与这些数据进行相关分析(表2)。降水量与经度呈极显著正相关(P< 0.01);与平均气温呈极显著负相关(P<0.01);与海拔和纬度无明显相关性。通过绘制散点图直观分析降水量与海拔、经纬度和平均气温的变化趋势(图5)。随经度增大,降水量逐渐增多,可能是因为经度高的区域更靠近海洋,更湿润。纬度上整体变化不大,可能是因为本研究区域基本属于中温带,纬度跨度不大。当月平均气温为20~27 ℃时,降水量与气温有明显趋势关系,气温越高,降水量越低。综合分析,降水量数据与其他数据存在一定相关关系,且自身分布存在明显特征,具有良好的正态性,适于用多种内插方法进行空间插值。

表2 降水量数据与其他数据的相关性Tab.2 Correlations among precipitation data and other data

图5 降水量与海拔、经纬度和平均气温分布的散点图Fig.5 Distribution scatter plots of precipitation with altitude,latitude,longitude and average temperature

1.3 离群值剔除

离群值产生的原因有很多,可能是真实且正常的数据,与其他观测值属同一总体;也可能是由于测量时的偶然性,或记录和计算时的失误,产生的非正常、错误的数据,与其他观测值不属于同一总体,在插值计算前需将其改正或剔除[12-14]。本研究通过直方图、半变异/协方差函数云和Voronoi 图查找出的离群值基本相同,分别分布于研究区东北方向和南部的两个样本点,将其剔除。

2 空间插值方法选取及依据

考虑降水量的特殊性,即影响降水的因素较多,包括气象站的经纬度、海拔高度、坡度、坡向及风速等[3]。本研究选择协同克里格法(Co-kriging)、普通克里格法(Ordinary kriging,OK)和反距离加权法(In‑verse distance weighting,IDW)3 种方法对东北三省及内蒙古自治区的降水量进行空间内插(图6)。将离散站点的观测数据转换为连续的空间数据曲面,以便更快捷和精确地获取未知点的降水量数值。

图6 空间插值方法Fig.6 Spatial interpolation methods

3 插值精度评价

在进行气象数据空间插值时,交叉验证法(Cross validation)是应用最广泛的一种精度评价方法[18]。本研究通过计算估计值和实测值间的差值,采用预测误差(Prediction error)中的指标作为交叉验证法的评价指标,进行插值结果精度评价和模型合理性分析[19-20]。理想模型的标准为标准平均值(Mean standardized)最接近0,均方根预测误差(Root-mean-square)最小,平均标准误差(Average standard error)最接近均方根预测误差,标准均方根预测误差(Root-mean-square standardized)最接近1,实测值与预测值更接近[18,21]。

3种插值方法中,反距离加权法的均方根预测误差最小(44.750 0 mm)(表3)。协同克里格法的标准平均值为0.000 2,最接近0;平均误差最小(0.011 1);标准均方根预测误差为0.863 5 mm,最接近1;均方根预测误差为46.320 0 mm,与平均标准误差53.790 0 mm相差较小。

表3 空间插值结果的精度评价Tab.3 Accuracy evaluation of spatial interpolation results

4 插值结果分析

根据数据分析,原始降水量数据的空间分布存在二次曲线趋势,且不呈正态分布;克里格插值过程中,选择Log 变换方式,使其呈正态分布,并移除二次趋势面;协同克里格插值过程中,数据中加入经纬度、海拔和平均气温作为影响变量,其他参数选择与普通克里格一致。3 种插值方法得到的研究区降水量分布图如图7所示。

图7 空间插值结果(a:IDW;b:OK;c:Co-kriging)Fig.7 Spatial interpolation results(a:IDW;b:OK;c:Co-kriging)

3 种插值方法所得结果趋势大致相同,且呈现两个极值地区,黑龙江省北部和辽宁省南部地区为降水高值区,内蒙古自治区西南部和黑龙江省东部地区为降水低值区。总体上,内蒙古自治区的降水比其他省份少,与研究区的实际情况吻合。

5 结论与讨论

将反距离加权法、普通克里格法和协同克里格法应用于东北三省及内蒙古自治区的降水量插值运算,并对其插值效果和预测精度进行分析。结果显示,综合3种方法的插值结果与精度评价,协同克里格法的插值效果最好,各项评价指标均较符合要求,插值效果最平滑。

反距离加权法的均方根预测误差最小,但此方法易受极值影响,插值空间分布图中易出现“牛眼”现象,相邻站点的空间依赖关系表现不佳。协同克里格法综合考虑了经纬度、海拔和平均气温等与降水量有关的影响因素,并将其纳入数据集一起参与插值估算,在其他因素均对降水量有影响的情况下,协同克里格法的插值效果及插值精度更理想。此外,在插值前,对数据的分布趋势及分布规律进行分析,对离群值进行查找和剔除均非常必要,有助于插值方法及参数的选择。

无论哪种插值方法均需在特定的假设条件和适用范围内应用,与数据自身特点和空间分布规律有关。本研究在进行降水量插值研究时,仅考虑经纬度、海拔及平均气温的影响,未将其他影响因素(风速、坡度和坡向等)纳入考虑;除插值方法外,站点数量及分布均匀程度、降水量观测时间间隔尺度和栅格单元大小等因素也会造成空间信息的不确定性。在以后的研究中,还需对这些因素进行深入分析。

猜你喜欢

格法气象站方根
基于状态空间涡格法的阵风减缓分析
珠峰上架起世界最高气象站
基于荷载试验的空心板桥梁格法虚拟横梁刚度研究
我们爱把马鲛鱼叫鰆鯃
“洋美猴王”:把京剧唱给世界听
心灵气象站
DZZ3型自动气象站一次地温数据异常的处理过程
均方根嵌入式容积粒子PHD 多目标跟踪方法
自动气象站应该注意的一些防雷问题
数学魔术——神奇的速算