APP下载

基于模糊集的小多边形处理

2016-05-14胡开

绿色科技 2016年6期

胡开

摘要:以巴宜区为例,在融合2012二类调查矢量数据和2009林地保护利用规划矢量数据时引入基于模糊集的小多边形处理方法,对原理和可行性操作步骤进行了阐述。探讨了叠加分析后不同处理方法对处理结果精度的影响,阐述了基于模糊集的小多边形处理方法在西藏自治区、乃至全国林地年度变更中的应用前景。

关键词:矢量数据融合;模糊集;小多边形处理;林地年度变更

中图分类号:TP391 文献标识码:A 文章编号:1674-9944(2016)06-0181-03

1 引言

在林地年度变更工作中,由于西藏2012年二类调查矢量数据和2009林地保护利用规划矢量数据在时效性、空间位置、属性数据等方面均存在较大差异,需将二者融合形成林地年度变更本底数据库以减少外业现地的核实工作量。

随着二者的叠加分析后需消除小多边形。目前常见的GIS软件中普遍使用的处理方法是按相邻最长边界线合并到临近多边形中去,或按照相邻最大面积合并到临近小班中,然而这些方法都是针对由几何位置的不确定性引起的小多边形而提出,没有考虑属性数据的差异,具有一定的随机性。

笔者在此引入了基于模糊集的小多边形处理方法,综合考虑矢量数据几何位置融合和属性数据融合。

2 实验数据

本次研究采用巴宜区(原林芝县)2012年二类调查矢量数据和2009林地保护利用规划矢量数据作为研究数据。

其中2012年二类调查矢量数据更新至2012年年底,采用高斯克吕格投影,西安80坐标系,信息量大,调查大部分为实地调查,数据可靠。

2009年林地保护利用规划矢量数据更新至2009年年底,是在2002年二类调查的基础上补充区划加实地验证而得,采用高斯克吕格投影,西安80坐标系,该数据的属性数据更加符合林地年度变更要求。

两种数据坐标系一致,不存在空间基准的融合。

3 研究原理

3.1 矢量边界适宜性判别

假设矢量数据有x种属性,对于每个矢量面,其属性值则可能与这x个属性值有关。取各属性值与矢量面相吻合的程度为其隶属度,表达式为:(1)

其中rik表示第k种属性与第i个面要素属性符合的程度;i表示第i个矢量面;j表示矢量面的第j个特征;Ikj为第k种属性类型的第j个特征准则值;ωj则为第j个属性特征的权重。

如果矢量数据是通过n种矢量数据叠置所得,那么叠置后的矢量面属性与n种类型的属性有关,由式(1)可得

由于n=2,从而得到叠置图上地理边界适宜性判决函数为:

其中△rij表示两相邻矢量面属性模糊集对应元素的差值。架设各叠置层上各属性值的权重系数相同,令各叠置层的权为ω1,ω2,……,ωn,其中,λ为参数,应该适当选取,使得0≤μ≤1;则有:

3.2 属性不确定性的度量

将小多边形进行合并时,必然引起属性数据的变化,即小多边形合并之后模糊属性值调整为面域模糊属性值时,与原模糊属性值的差异。使小多边形在合并前后属性值变化最小的是最理想状态。分析(3)式和(4)式可知,此时“取最小值。因此,进行小多边形合并的时候,应选其边界中μ值最小的边界作为消除边界,从而达到小多边形在合并前后属性值变化最小的目的。

3.3 小多边形的处理

图1为2012年二类调查矢量数据和2009林地保护利用规划矢量数据叠加分析后产生了小多边形C,其中A、B、D、E为其相邻的多边形,关键问题为C与哪个多边形合并最合理。对于C的四条边界ab、bc、cd、ad选其边界中适宜性最小的作为消除边界,与邻边边界合并。

由于二调数据与林地保护规划利用规划矢量属性数据较多,如果对每种属性都定义其与矢量面的隶属度工作量巨大,而且实际意义不大。为了简化计算,结合叠置后矢量面的实际情况,以及两种矢量数据的特征,作如下处理。

从两种不同矢量数据中选取有代表性的属性宇段。选取相关属性字段为林地保护林用规划数据的“地类”、“面积”、“林地保护等级”;二类调查数据的“地类1”,“图形面积”、“小班蓄积”。选取“地类”是因为它们是区划小班的主要属性,选取“面积”和“蓄积”是为了跟踪小多边形(进行相交后,被切碎的细小多边形保留了原始数据的字段和属性)。

对于每条边界对应的两个不同矢量面的属性模糊集,定义模糊集相对应元素的差值。若边界对应两矢量面属性一致,则认为△rij=0,若边界对应两矢量面属性不一致,则认为△rij=1;涉及到行政界线,不可合并,认为△ij=1。以边界ab为例,矢量面A和C对应的属性如表1。

由式(7),可知:

μ=1/4(△r11+△r12+△r13+△r21+△r22+△r23)=1/4(0+1+1+O+0+0+0)=0.5。

同样的方法计算bc、cd、ac的边界适适宜性判别值为0.25,0.75,1。其中边界bc适宜性判别值最小,所以应该消除边界bc,将矢量面B和C进行合并,并取B的属性为合并后多边形的属性。

4 批量处理方法

实际操作中,如果对每个多边形进行不同边界的适宜性判别,工作量巨大,可行性不高。下面结合实际,介绍一种批量处理的方法,对关键步骤作如下解释。

4.1 转换为coverage格式

Coverage是ArcInfo workstation的原生数据格式。它将空间信息、属性信息分别存放在两个文件夹。COV-erage可以存储拓扑要素类,支持高级要素类对象:比如多点和多线等。通过小多边形由“shapefile”格式转换成为“coverage”将相邻面的属性赋到公共边界上提供了条件。

4.2 去伪节点

由面转成线后,在很多线与线交叉的地方存在伪节点,使得原来一条边界变成了两条,在国产软件geo-way3.6中可以批量处理该类伪节点。

4.3 计算value值

Value值即为前文提及的边界适宜性判别值。

具体操作流程详见图2。

5 结果与分析

处理完小多边形后重新计算面积,分地类统计面积变化,同时按照传统方法“最大边长合并”与“最大面积合并”2种方法进行小多边形的自动处理,分地类统计不同方法的两种矢量数据面积的变化,以各树种与原始数据的差平方和为方差,反映处理前后,数据的波动。为突出处理前后,以及不同方法的效果,面积统一采用“公顷”,保留两位小数。

从表2和表3可以看出,无论是二类调查数据,还是林地保护利用规划数据,用基于模糊集的方法进行合并,方差都远远小于最大面积合并和最大边长合并的方差。从表中可以看出,“基于模糊集的方法”优于“最大边长合并”,效果最差的是“最大面积合并”的方法。

6 结语

从数据分析可以得出,基于模糊集的小多边形处理方法明显优于传统的最大边长合并、最大面积合并两种方法。基于模糊集的小多边形处理方法在精度损失方面是最小的。但同时也会相应增加数据处理工作量,根据实验结果,处理一个县的数据大概要增加工作量一个工日。

随着林地年度变更的全面铺开,西藏自治区2016年度将有65个县(区)需要进行林地年度变更工作,基于模糊集的小多边形处理方法能明显提高融合数据精度,减少外业工作量,能够较好的适合林地年度变更的需求,提高林地年度变更工作效率。