APP下载

数据网格化的多尺度特性研究

2015-03-01程昌秀李晓岚

安徽农业科学 2015年4期
关键词:网格化土地利用尺度

杨 静,程昌秀,李晓岚

(1.昆明理工大学国土资源与工程学院,云南昆明 650093;2.北京师范大学减灾与应急管理研究院,北京 100875;3.中国科学院地理科学与资源研究所,北京 100101)



数据网格化的多尺度特性研究

杨 静1,程昌秀2,李晓岚3

(1.昆明理工大学国土资源与工程学院,云南昆明 650093;2.北京师范大学减灾与应急管理研究院,北京 100875;3.中国科学院地理科学与资源研究所,北京 100101)

由于数据网格化便于多源数据的比较分析、匹配和融合、适合空间模型构建等,早年在气象学领域就得到了广泛的应用。地理信息数据随着全球信息化的发展得到了越来越多的应用,应用方式也在多样化,数据网格化在该领域的应用也越来越广泛。该研究提出了数据网格化的多尺度特性,并对其进行了实验验证,以北京市房山区土地利用动态度数据为例,生成不同大小的网格的土地利用动态度数据,通过网格动态度数据和原始动态度数据的比较得出,基于原始数据的不同大小,网格化数据与原始数据的接近程度会有所差别,所以不是所有格网数据都能代替原始数据进行分析,格网数据要择优选择。

矢量数据;网格化;多尺度

1 理论综述

随着经济全球化、全球信息化的发展,以全球定位系统(GPS)、地理信息系统(GIS)、遥感(RS)技术为支撑的现代测绘科学技术得到了飞速的发展。地理信息数据作为整合各种社会资源的地理信息平台,在国民经济建设和社会发展中的应用日趋广泛。数字中国、数字区域、数字城市、数字国土、电子政务等政府信息工程先后启动,带动着地理信息产业的快速发展,大量的地理信息数据得到了生产和使用[1]。但在实际应用过程中,数据往往有着不同的统计单元。根据数据格式的划分,数据可以分为矢量和栅格2种格式,如土壤的结构和质地,以及地形地貌等专题数据属于GIS 管理下的矢量数据,利用不同遥感平台获取的地表不同类型的专题信息是以像元作为统计单元的栅格数据。由于统计单元的不同不便于利用多源数据进行相关比较和分析,不能充分发挥已有数据的优势。实践证明,多源数据的网格化是解决这一问题的有效方法之一[2-3]。由于网格可以被认为是其他任何统计单元内部的细胞,通过它可以表达任何统计单元的信息,因此在GIS技术的支持下,经过网格化处理的数据及其派生出的结果,在时间上可以形成以网格为基础的数据序列,便于动态规律分析,在空间上形成的网格数据,可以以不同单元为基础进行空间分异规律研究,同时也便于和遥感数据结合,尤其是统计分析时,将行政区划和网格数据联系起来,便于统计行政区划范围内的有用信息。可见网格化数据具有匹配和融合多源数据的优势,特别适合空间模型的构建、实现和表达,同时数据的网格化也是许多图形绘制、科学计算和空间模型实现的基础工作[4]。鉴于数据网格化的诸多优势,数据网格化的存储方式将会受到越来越多的重视,然而在网格化过程中很容易忽略数据的多尺度特性。

尺度在各个学科都普遍存在并受到广泛关注。生态学文献中出现“尺度”一词已有100年历史,早期的植物生态学家已认识到取样尺度在描述物种分布上的重要性,对异量关联、捕食者与猎物的大小关系等问题也有研究[5]。“Global Land Project(GLP)”全球土地计划的目标确定为“度量、模拟和理解人类与环境复合系统”,由此“土地系统的驱动力、土地系统变化的结果、土地可持续性的综合分析与模拟”被确定为未来研究的3大主题,“土地系统变化的关键途径”必然会涉及到对不同时空尺度下土地系统变化过程的深切关注。“尺度”也是理解与开展GLP 3大主题研究的核心关键词[6]。在不同尺度或聚集水平上得出的统计结果是不同的,在一个尺度上推演出的结论和过程往往只适用于那个尺度,不可能适用于另一尺度[7]。如果认识不到过程对尺度的依赖性,往往就会用不恰当的甚至是错误的尺度去观察、说明或解释问题,从而在一定程度上混淆事物现象与本质关系的认识,将根据一个尺度上得出的结论应用到另一个尺度上去,或者是以点的特征来简单代替面或体的特征。不同尺度的数据往往推译出不同的结果,“尺度”已成为人们认识客观世界格局、过程及其时空分布特征的一把关键“钥匙”[8]。选择合适的尺度来了解研究对象的信息已经成为包括生态学、水文学在内的地球科学的研究热点,尺度问题也在这些领域得到了越来越多的重视。

尺度研究主要涉及3个方面:尺度概念、尺度分析、尺度推译[5]。通常意义上的空间尺度和时间尺度是指观察或研究某一过程所采用的空间或时间单位,尺度包括现象尺度、观测尺度、分析或模拟尺度。现象尺度是格局或影响格局的过程的尺度,它为自然现象所固有,独立于人类的控制之外,分析和模拟尺度是空间统计分析或模拟模型中所用的尺度。景观生态学中尺度以粒度和幅度来表达,空间粒度是景观中最小可辨识单元所代表的特征长度、面积或体积。数据网格化逐渐成为人类认识分析统计事物的必要手段,同时其网格化的方法也在不断走向成熟,相关专家对网格化的方法进行了大量的研究[9]。但在此过程中往往会忽略网格划分大小对实验结果的影响。笔者就土地利用动态度数据网格化的多尺度特性进行了实验验证,在该实验中,现象尺度即为矢量数据本身固有的尺度特征,观测或者是分析尺度即是矢量数据网格化的网格大小。

2 数据来源和实验过程

2.1 数据来源与预处理该研究采用的数据来自北京市房山区2001和2004年的土地利用分布矢量图,原始数据是按斑块为单元统计进行的,记录字段有图斑号,土地利用类型,斑块面积。网格数据是在ARCGIS支持下生成的,网格单元大小依次为180 m×180 m、225 m×225 m、270 m×270 m、315 m×315 m、360 m×360 m、405 m×405 m、450 m×450 m、540 m×540 m、720 m×720 m、900 m×900 m、1 100 m×1 100 m、1 300 m×1 300 m、1 500 m×1 500 m、2 100 m×2 100 m。投影方式(Projection):Transverse_Mercator,假东(False_Easting):500000.00000000,假北(False_Northing):中央子午线(Central_Meridian):116.35025200,原点纬度(Latitude_Of_Origin):39.86576600,其中长度单位为m,角度单位为°。生成的网格数据覆盖房山区所有区域。在人类活动和自然因素的共同作用下,土地利用类型和利用面积发生了一定成都的变化。

2.2 网格动态度的计算方法及其分类该研究选用的土地利用动态度计算模型是土地利用变化分析中常用的基本模型之一,从数量变化的角度来分析某时间段内土地利用的变化状况。该研究的土地利用动态度即综合土地利用动态度,表征对应区域的土地利用变化程度。综合动态度是指某一地区某一时段内综合的土地利用类型的数量变化情况,其表达式为:

(1)

式中,LUi为监测起始时刻第i类土地利用类型的面积;ΔLUi-j为监测时段第i类土地利用类型转为第j类土地利用类型面积的绝对值;T为监测时段长度。

在ArcGIS和VisualStudio的支持下,完成了180m×180m、225m×225m、270m×270m、315m×315m、360m×360m、405m×405m、450m×450m、540m×540m、720m×720m、900m×900m、1 100m×1 100m、1 300m×1 300m、1 500m×1 500m、2 100m×2 100m网格动态度的计算。为了直观体现动态度的格局分布,按表1将动态度分成5个等级。

表1 动态度等级分类标准

2.3 网格数据与原始数据的相似度为了评价网格数据与原始数据间的相近程度,该研究提出了比较对象间的相似性评价方法。该方法根据面积权重将数据变化程度进行综合,按照研究区域内各网格属性所占面积的百分比确定研究指标大小,主要步骤如下:①确定研究指标;②计算指数变化值并赋予相应的属性值;③确定各类属性值所占网格区域的面积;④按照面积比例的多少来分配属性值。该实验中研究指数是图斑的动态度变化,按照变化程度将该指数赋予不同的属性值,具体赋值方法如下:

将网格数据与原始数据叠加分析,计算每个图斑的动态度变化值P:

P=|LCi-LCj|

(2)

式中,LCi、LCj分别为原始数据与网格数据的动态度值,P={0,1,2,3,4,5},图斑间的相似度随着P的增大而减小,所以赋予相似度值属性值依次为Q={1,0.8,0.6,0.4,0.2,0},统计不同变化度值所对应的面积总数Si,相似度M的计算公式为:

(3)

相似度值统计了不同动态度变化值所占有的面积,该值由Si、Qi共同影响,是所研究范围动态度变化的综合指数,从该指数可以得出,如果某研究区域变化很大但是所占面积很小则该区域对整体动变化影响相对较小,反之相似度值较大;当某研究区域变化很小但所占面积很大则可能该区域对整体变化值影响较大,反之相似度值较小;该值综合了各个区域的相似情况,得出整体的相似程度。指数对实验过程有一定的指引意义,以下实验部分依据该指数对实验结果进行分析。

3 实验结果与分析

根据上述网格动态度的计算方法及其分类标准,不同网格动态度的分布格局见图1。

图1显示,随着网格大小的不同动态度的分布格局也会发生相应的变化,180 m×180 m网格动态度级别为1和2的网格占据很大一部分;700 m×700 m网格时,动态度级别为4的网格占据面积最多;1 100 m×1 100 m和1 300 m×1 300 m时,动态度级别为3的网格逐渐增多。可见动态度的变化会随着划分网格大小的不同而有所差异。

图1 动态度格局分布

图2 不同网格数据的相似度曲线

图2显示,当网格大小在360 m×360 m左右时相似度值最大,随着网格的不断增大相似度值逐渐减小,网格大小在180 m×180 m到360 m×360 m范围内相似度值在不断增大。所以在实际应用中,并非网格划分越小结果越准确,面对研究对象的不同通常会出现一个最适宜尺度,所以对于不同的应用应选择不同的网格大小。对现象的研究是在一定的观测和分析尺度下进行的,选取不同的观测和分析尺度,将检测到不同的现象,尺度研究的根本目的在于通过适宜的观测分析和模拟尺度来揭示和把握现象尺度中的规律性[5]。观测尺度和现象尺度之间的相近程度会随着网格的变化而不断变化,以行政区划为例,如果研究对象是村级行政区的土地利用动态度,应选择相应的网格大小进行研究;如果研究对象是以乡镇级行政区划为单位的土地利用动态度,又需要用不同大小的网格进行分析研究。

4 结论与讨论

多尺度已经在生态学、遥感、气象等领域得到了越来越多的重视,该研究实验表明数据网格化分析的过程中也会存在多尺度特性,并非网格划分越小结果越精确,研究结果的

准确性与原始矢量数据的尺度有密切的关系。盲目地选择网格大小会造成分析结果的易位,数据资源的浪费,甚至是对读者的误导。在实际生活中,类似的数据还有人口、社会经济数据的统计、气象数据等,比如统计以行政区划为单位的人口数、收入、降水量等数据。以网格为基础的数据序列给实际生产研究的统计分析带来了很大的方便,但是要注意数据的多尺度特性,同样的计算方法不同的研究对象所需要划分网格的大小就会有所差别,也就是尺度效应的影响,尺度选择的问题直接来源于尺度效应,所以针对不同的目标来确定所适宜的分析尺度也即网格大小是非常有必要的。

多尺度特性在各个领域受到越来越多的关注,相关的理论方法也在逐渐的完善,但是在数据网格化过程中多尺度方法的研究还非常欠缺,今后的研究过程中多尺度特性是值得考虑的问题,但是面对具体研究如何选择合适的网格大小依然是研究的重点和难点,一些相关领域(如遥感影像处理、计算机可视化、景观生态学)中设计尺度方法的研究成果可能提供借鉴。

[1] 姚承宽.地理信息数据应用探讨[J].地理空间信息,2003,1(3):20-21.

[2] 秦承志,呼雪梅.栅格数字地形分析中的尺度问题研究方法[J].地理研究,2004,33(2):270-282.

[3] 孙和平,罗少聪.中国及其邻区地表气象数据预处理和网格化数值结果分析[J].地壳形变与地震,1998,18(3):51-56.

[4] 范一大,史培军,辜智慧,等.行政单元数据向网格单元转化的技术方法[J].地理科学,2004,24(1):105-108.

[5] 张娜.生态学中的尺度问题:内涵与分析方法[J].生态学报,2006,26(7):2340-2355.

[6] 朱晓华,李亚云.土地利用类型结构的多尺度转化特征[J].地理研究,2008,27(6):1235-1242.

[7] 郭志达,方涛,杜培军.论复杂系统研究的等级结构与尺度推绎[J].中国矿业大学学报,2003,32(3):213-217.

[8] 陈睿山,蔡运龙.土地变化科学中的土地问题与解决途径[J].地理研究,2010,29(7):1244-1256.

[9] 朱良峰,吴信才,刘修国.GIS中矢量多边形网格化问题研究[J].地理与地理信息科学,2004,20(1):12-15.

Study on Mutil-scale Characteristics of the Vector into Grid Process

YANG Jing1, CHENG Chang-xiu2, LI Xiao-lan3

(1. Faulty of Land Resource Engineering, Kunming University of Science and Technology, Kunming, Yunnan 650093; 2. Academy of Disaster Redution and Emergency Management,Beijing Normal University,Beijing 100875; 3.Institute of Geographic Science and Natural Resources Research of CAS, Beijing 100101)

For the grid data contributes to analyzing, matching and fusion for the mutidatasources.It’s conductive to buid space models. So the vector into grid process is widely used in the field of meteorology. The geographic information data is widely used by the development of global information, whose application mode is diversified. The used of vector into grid process is widely used. This paper presents the muti-scale characteristicsof vector into grid process and a example has verified this phenomenon. Taking the land use dynamic index data of Beijing fangshan as an example, different size of grid data are created based on the source data. By comparing the grid dynamic data and the original data of dynamic degree we know that the similatity between different size of grid data which based on the source data and source data is different. So not all grid data can be analyzed instead of original data and the grid data should be selected carefully.

Vector data; Griding; Mutil-scale

杨静(1989- ),女,山西五台人,硕士研究生,研究方向:土地利用多尺度变化。

2014-12-18

S 126

A

0517-6611(2015)04-353-03

猜你喜欢

网格化土地利用尺度
以党建网格化探索“户长制”治理新路子
财产的五大尺度和五重应对
土地利用生态系统服务研究进展及启示
城市大气污染防治网格化管理信息系统设计
化解难题,力促环境监管网格化见实效
宇宙的尺度
滨海县土地利用挖潜方向在哪里
9
论低碳经济与转变土地利用方式
土地利用变化与碳循环