APP下载

中国东北地区气象数据的空间平稳性检验

2014-03-28许家琦李颜伶

关键词:邻域标准差东北地区

许家琦,李颜伶,舒 红*

(1.武汉大学测绘遥感信息工程国家重点实验室,武汉430079;2.青岛勘察测绘研究院,山东青岛266032)

在对空间数据的分析中总是假设空间协方差结构平稳,然而这一假设在实际中常常不成立.例如降水数据就显示出空间非平稳性[1-2],月降水中硫酸浓度也呈现出了非平稳结构[3].空间数据的平稳性检验有多种方法.地理加权回归法将空间的概念引入到一般线性回归的回归参数中,回归系数随着空间位置的变化而变化[4].地理加权回归法检验的是变量之间相关关系的空间异质性,地理加权回归法(GWR)在已知数据非平稳的情况下分析这种非平稳性,而不是用于数据检验是否平稳.本文采用的3种方法(三维散点图法,趋势线法和邻域圆法)都是用来检验属性数据本身的空间异质性.谱方法用局部平稳过程的卷积来表示整个非平稳过程,并用这个非平稳模型来进行谱密度的参数和非参数估计[5-6].由于每个被视为平稳的局部区域中都要有足够多的数据来计算空间变异函数然或者空间协方差函数[7],因此这种方法并不适用于我国较为稀疏的气象站点数据.三维散点图法拟合的是整个研究区域内属性数据的趋势面;趋势线法拟合的是投影面上所有属性数据的趋势;虽然邻域圆法也是把空间分割为一些小的区域来研究,但邻域圆法关注的是局部区域内的二阶矩.均值和方差的计算与经验变异函数的计算不同,对于参与计算的气象站点没有太多数量上的要求.在非平稳的空间协方差结构分析中,把不平稳各向异性的地理空间映射到平稳各向同性的频谱空间中进行处理,然后将处理结果逆变换到地理空间中[8].Sampson&Guttorp法(SG模型)计算复杂,物理含义不够直观明确.而本文采用3种方法:(1)三维散点图法有着简单直观的优点,通过查看气象数据在三维空间中的数值大小来初步判断数据是否平稳;(2)在趋势线法中,把气象数据投影到东西和南北两个面上,在这两个面上分别用多项式法拟合出两条趋势线,从而判断出空间数据在东西方向和南北方向上是否平稳[9].(3)由于随机变量的一阶矩和二阶矩已经足够为大多数实际问题提供可以接受的近似解决方法[10],在邻域圆法中通过统计圆内样本数据的均值和方差来检验我国东北地区气象数据的空间平稳性[11].

1 研究区域概况

本文采用我国东北地区的气象观测站点数据,包括2006年1月1日的日平均气温数据,2006年1月1日的日平均风速数据以及2006年5月的月降水数据作为实验数据.气象站点分布如图1所示.

冬季,受极地大陆气团控制,东北区气候严寒.1月是全年最冷月,全区的月平均气温均在-4℃以下.温度梯度之大,为全年之冠.大小兴安岭北段的平均气温在-30℃左右,是我国冬季最冷的地方.冬季(以1月为代表)在蒙古冷高压影响下,空气稳定,风速较小.特别是松花江流域以北地区,因位置最北,常在高压内部控制之下,冬季为全年风速最小季节.1月份全区平均风速在1~5 m/s之间;山区13 m/s;平原多在3~4 m/s.本区的降水主要集中于夏季.各地降水一般从5月份明显增加,9月份又陡降.降水量自东南向西北有递减的趋势.降水日多于20 d的区域由东北部的山区延伸到了松辽平原的东部,降水日数的高值区仍是小兴安岭南部和长白山一带[12].

图1 中国东北地区气象观测站点分布图Fig.1 Location map of meteorological stations in the Northeast area of China

2 研究方法

设一随机函数Z,其空间分布律不因平移而改变,即若对任一向量h,两个k维向量的随机变量{Z(x1),Z(x2),…,Z(xk)}和{Z(x1+h),Z(x2+h),…,Z(xk+h)}.

有相同的分布律.这种平稳假设至少要求Z(x)的各阶矩均存在,且平稳,而在实际工作中却很难满足.在线性地质统计学研究中,只需假设其1、2阶矩存在且平稳就够了,因而提出二阶平稳假设.即

假定:1)在整个研究区内,区域化变量Z(x)的期望存在且等于常数:

2)在整个研究区内,区域化变量的空间协方差函数存在且平稳[13]:

2.1 三维散点图法

空间现象可以分解为两部分:区域性趋势(平均值)和残差(变化性).二阶平稳意味着区域范围内随机变量的平均值和方差均没有趋势变化.平稳性就是观测值围绕固定常数上下波动,且离开均值上下波动的幅度大体相似(方差为常量).反之,如果趋势面不是一个水平面或者数据围绕趋势面波动的幅度不均衡就是非平稳.所以可以对观测值作散点图,同时显示趋势面,通过人眼初步观察一下是否满足平稳性.

2.2 趋势线法

将三维散点图分别向东西方向和南北方向上投影,绘制气象数据与x轴,y轴的二维散点图.用一条红色的趋势线(既可以是直线也可以使曲线)来拟合这些数据,通过两个方向上的剖面图可以清楚看到数据趋势在哪个方向上.

2.3 邻域圆法

所谓邻域圆法就是在一个观测点的周围以该点为圆心画一个圆,根据圆内的数据计算均值和相对标准差,然后对每个观测点都做同样的计算,通过圆内均值和相对标准差在上是否平稳.由于这种方法可以根据气象站点之间的距离来计算出合适的邻域圆半径并且可以准确地遍历整个研究区域,比起移动窗口法[11],这种方法更适合我国稀疏的气象站点数据.

标准差描述的是区域化变量观测值间的离散情况,因此计算其标准差就相当于求得离散情况,但是由于均值不同时变异程度就不同,即区域内的标准差依赖于区域内的均值,均值不同不能直接采用标准差,因此这里采用相对标准差,也称变异系数,是一个无量纲的统计量,能反映单位均值上的离散程度,可以消除单位或平均数不同对两个或多个资料变异程度比较的影响[14].用公式表示为:

式中s表示圆内样点标准差,m表示圆内样点均值.

如果数据平稳,圆内的均值应该围绕某个固定常数上下随机波动,没有明显的趋势,相对标准差应该基本在0值附近波动.

3 结果分析

本文用R语言实现了对我国东北地区气象要素(气温,风速,降水)的空间平稳性检验.R语言有着优秀的统计分析能力和绘图环境.R里面自带的包中包含了统计学家们开发的前沿算法.通过直接调用这些包里面的函数(如persp3d())可以避免通过大量编程实现统计算法.

3.1 三维散点图法

利用rgl包中的persp3d()函数绘制三维散点图[15],如图2所示.

图2 中国东北地区气象观测数据散点图(气温,风速,降水)Fig.2 Scatterplots of meteorological data in the Northeast area of China(temperature,wind speed and precipitation)

从图2中可以看出,日平均气温有一个由北向南线性增加的趋势,且增幅明显.东北地区2006年1月1日的日平均气温从高纬地区的-25℃到低纬地区的-5℃.但是气温变量的随机波动很小,都是围绕趋势面小幅度的上下波动.风速有一个自西向东减少的趋势,趋势不明显.但是风速变量的随机波动很大,即数据偏离趋势面的幅度很大.降水数据的趋势面是个明显的曲面,趋势面不平直,变量的随机性一般.

3.2 趋势线法

利用r中的l m()和predict()函数绘制趋势线,如图3所示.

从图3中可以看出,气温数据有一个极为明显的由北向南增加的趋势,由西向东方向则微弱减少.风速数据基本上可以看成是一个平稳的数据集,不论是在南北还是东西方向上都围绕平均风速2 m/s上下随机波动.而5月的降水数据由西向东增加,由南向北减少,有着明显的趋势且随机波动较大.

3.3 邻域圆检验

图3 东北地区气象观测数据趋势线图(气温,风速,降水)Fig.3 Trend line maps of meteorological data in the Northeast area of China(temperature,wind speed and precipitation)

用R实现邻域圆法的思路为:定义圆半径值的大小,计算第一个点与所有点(包括第一个点本身)之间的距离,存储距离小于半径值的点并计算其均值和相对标准差,得到第一个点邻域圆内的均值和相对标准差.同理可计算得所有点邻域圆内的均值和相对标准差,并作图显示以判断该区域化变量在该空间上是否平稳.邻域圆按照从西向东、从北向南的顺序遍历整个研究区域.其结果如图4~图6所示.

图4 东北地区日平均气温数据邻域圆法检验图Fig.4 Neighborhood circle plots of daily average temperature data in the Northeast area of China

图5 东北地区日平均风速数据邻域圆法检验图Fig.5 Neighborhood circle plots of daily average wind speed data in the Northeast area of China

图6 东北地区月降水数据邻域圆法检验图Fig.6 Neighborhood circle plots of monthly precipitation data in the Northeast area of China

从图4~图6中可以看到2006年1月1日的风速数据可以看成是平稳的数据,而气温数据和降水数据均不平稳.邻域圆内的气温均值逐步上升,由于气温围绕均值波动的幅度始终较小,因此相对标准差随着均值的增加而逐步减小.邻域圆内的降水均值呈螺旋式上升的趋势,相对标准差从样本点号1到7是平稳的,从9号样本点到81也是平稳的.但是从样本号7到9之间降水数据的相对标准差急剧下降.样本点号为7,8,9的气象站如图所示,由一个三角形围住.从图中可以看出,由于1~7号样本点处于东北地区的西北角上,分布稀疏且呈一个狭长的形状,因此落在每个邻域圆的样本数相对较少,标准差较大.而1~7号样本点周围邻域圆内的样本均值却比较小.所以1~7号样本点周围邻域圆内的相对标准差较大.

4 结论与展望

本文介绍的3种平稳性检验方法各有优缺点,三维散点图法简单直观,可以迅速看出数据的均值是否是一个水平的平面.如果是一个平直的面那么数据均值平稳,反之不平稳.三维散点的缺点在于不便于发现均值不平稳的方向性,以及二阶矩是否平稳.趋势线法把空间数据投影到东西和南北两个方向上,通过两个方向上的剖面图可以清晰地看出空间不平稳的方向性.邻域圆法同时显示了局部区域内样本点的均值图和相对标准差图,它可以同时清楚地展现一阶矩和二阶矩是否平稳.3种方法同时使用,对同样3组数据(我国东北地区日气温,日风速,月降水)进行空间平稳性分析,得到相同的结论.即日气温数据有一个由北向南迅速递增的线性趋势,这与我国大部分地区处于北半球的温带,气温南高北低的气候规律相吻合.东北地区日风速数据在空间上比较平稳,始终在2 m/s的平均值上下波动,但是随机波动幅度较大,从0.5 m/s到4 m/s不等.月降水量有着东高西低,南高北低的趋势.我国东北地区南面临近渤海、黄海,东面临近日本海,临海地区空气湿润,雨量相对充沛.降水的空间趋势检验结果也与我国东北地区的地理环境相吻合.

本文有效检验了中国东北地区气象要素的空间平稳性.在统计建模中如何处理不平稳的空间数据是一个有待进一步研究的问题.

[1] Berndtsson R.Temporal variability in spatial correlation of daily rainfal[J].Water Resources Research,1988(24):1511-1517.

[2] Obled C,Creutin J D.Some developments in the use of empirical orthogonal functions for mapping meteorological Field[J].Journal of Climate and Applied Meteorolog,1986(25):1189-1204.

[3] Loader C,Switzer P.Spatial covariance estimation for monitoring data[R].Stanford:Department of statistics,Stanford University,1989.

[4] Brunsdon C,Fotheringham S,Charlton M.Geographically weighted regression-modeling spatial non-stationarity[J].The Statistician,1998(47):431-443.

[5] Fuentes M.Spectral method for nonstationary spatial processes[J].Biometrika,2002,1(89):197-210.

[6] Fuentes M.A formal test for nonstationarity of spatial stochastic processes[J].Journal of Multivariate Analysis,2005(96):30-54.

[7] Goovaerts P.Geostatistics for natural resources evaluation[M].New York,Oxford:Oxford University Press,1997.

[8] Sampson P D,Guttorp P.Nonparametric estimation of nonstationary spatial covariance structure[J].Journal of the A-merican Statistical Association,1992,87(417):108-119.

[9] 汤国安,杨 昕.ArcGIS地理信息系统空间分析实验教程[M].北京:科学出版社,2006.

[10] Journel A G,Huijbregts C J.Mining Geostatistics[M].London,New York,San Francisco:Academic Press,1978:30-39.

[11] Hass T C.Lognormal and moving window methods of estimating acid deposition[J].Journal of the American Statistical Association,1990,85(412):950-963.

[12] 周 琳.东北气候[M].北京:气象出版社,1991:25-28.

[13] 严 冰,阳正熙,吴堑虹,等.地学数据分析教程[M].北京:科学出版社,2008:91-96.

[14] 常文渊,戴新刚,陈洪武.地质统计学在气象要素场插值的实例研究[J].地球物理学报.2004,6(47):982-989.

[15] 汤银才.R语言与统计分析[M].北京:高等教育出版社,2008.

猜你喜欢

邻域标准差东北地区
用Pro-Kin Line平衡反馈训练仪对早期帕金森病患者进行治疗对其动态平衡功能的影响
为什么人参喜欢长在我国东北地区
稀疏图平方图的染色数上界
为什么人参喜欢长在我国东北地区
基于邻域竞赛的多目标优化算法
关于-型邻域空间
东北地区2016年第三季度ML≥3.0级地震目录
对于平均差与标准差的数学关系和应用价值比较研究
基于时序扩展的邻域保持嵌入算法及其在故障检测中的应用
Brand Value: Excavating and Management of Tourism in the Rural and Village Region