APP下载

基于eCongnition软件的土地利用分类研究

2020-10-28乌云德吉陈瑞卿敦惠霞

北方农业学报 2020年4期
关键词:植被指数面向对象土地利用

乌云德吉,陈瑞卿,敦惠霞

(1.内蒙古自治区农牧业科学院农牧业经济与信息研究所,内蒙古呼和浩特 010031;2.中国农业科学院农业资源与农业区划研究所/农业农村部农业遥感重点实验室,北京 100081)

1 土地利用分类背景

近年来,利用遥感图像,采用面向对象分类方法进行土地覆盖制图引起了广泛的关注[1]。土地利用和土地覆盖类型的遥感制图是在局地、区域和全球尺度上监测、理解和预测人类活动和自然相互干预的重要依据[2]。城市及周边土地覆盖类型包括不透水面、水体、林地、农田、低矮灌丛等。用米级或亚米级的高分辨率光学遥感数据快速提取土地覆盖类型是目前普遍关注的焦点,具有十分重要的意义。准确高效提取城市周边土地和建成区,不仅可以为城市规划提供科学依据,还能够为减少或避免热岛效应和维护景观格局提供科学依据。城市建成区空间布局在城市规划和资源管理中具有重要作用,面向对象的图像分析技术能够有效地提取城市建筑区域的图像[3]。利用遥感影像分类土地利用和土地覆盖的方法大致可以分为基于像素的分类和面向对象的分类2种,分割通常是面向对象分类的第一步[4]。国内外许多学者针对面向对象分类方法做了大量研究,例如:DURO 等[5]对比了3种机器学习分类方法,分别是决策树DT、随机森林RF、支持向量机SVM,分类结果证明,面向对象的分类方法整体分类精度高于基于像素的分类方法,但是,基于像素的分类中3种方法的精度没有明显的差别,面向对象分类中差异较大,随机森林RF和支持向量机SVM的分类结果明显优于决策树DT。BELGIU 等[6]指出,面向对象的分类方法在罗马尼亚、意大利和美国3个试验区农作物种类识别的精度和时间上要优于基于像素的分类方法,并且基于哨兵-2时间序列数据的时间加权动态时间偏差(TWDTW)方法在罗马尼亚和意大利的分类精度跟随机森林RF 相差不多,但是在美国没有随机森林RF 理想,并且TWDTW 方法对训练样本的依赖性没有随机森林RF 高,这对训练样本较少的区域具有十分重要的价值。此外,面向对象的分类能够有效降低噪声,噪声会导致过分分割和影响边缘检测。董婷等[7]以武汉市主城区为研究区域,选取Landsat 7/ETM+和Landsat 8/OLI 影像,利用改进后的归一化水体指数NDWI、归一化植被指数NDVI和光谱特征分析实现了建筑用地和裸地的分离,该文章的研究证明,层次分类能够较高精度地提取城市裸地信息。马吉晶等[8]基于GF-2 提出了耦合空-频域信息的浊水提取模型,较高精度地提取了城市浊水区域。张华等[9]基于GF-1 遥感数据,以民勤绿洲为试验区,获取了建筑物、林地与耕地的最优分割尺度,使用最邻近分类法对试验区的地物进行了分类,取得了较高的精度。还有部分研究表明,结合基于像素和面向对象的分类方法是最好的选择;其中,eCongnition软件的应用表现最好,该软件的核心就是先基于像素分割影像,再面向对象建立规则集,逐步修正、提取、合并类,是一种灵活的非监督分类软件[10-11]。

2 研究区概况

随着我国城市化进程的加速发展,在对城市发展和变化的评价与规划中遥感起到了至关重要的作用。当前,航空航天遥感、雷达遥感、无人机遥感、高光谱遥感等新技术的广泛应用,大大方便了小尺度城市土地利用的分类研究。但是,卫星影像因其低成本和高获取能力仍然是主流技术之一,它在城市变化监测研究中起着重要的作用。在分类研究中,面向对象分类较适用于城市地区提取。因此,本文选取了海南省屯昌县为研究区,采用面向对象分类方法对研究区城市及城市周边土地覆盖类型做了识别和提取。

屯昌县位于海南省中部偏北,地理位置为19°08′~19°31′N、109°45′~110°15′E,东与琼海市和定安县交接,南与琼中县接壤,西北与澄迈县毗邻,面积1 231.5 km2,境内有6个国有农场,且植被类型丰富。此外,屯昌县为低山丘陵地带,地势呈南高北低,山地占全县面积的5%、丘陵占85%、其他地类占10%,属热带季风气候,四季变化不大,长夏无冬,高温多雨,干湿季分明。

3 面向对象分类法和规则集的建立

3.1 面向对象分类

面向对象分类突破了传统的基于像素的分类方法,不再以像素为最小单位,而是将图像划分为对象,并综合利用对象的光谱和空间特征进行分类[6]。近10年,在土地利用分类研究中算法的发展已经从传统的基于影像到基于像素,再逐步发展到现如今的基于对象分类;随着算法的优化,算法实施的平台不断发展。目前,比较成熟且应用比较广泛的此类商业软件主要有:美国Trimble公司的eCognition软件、美国Overwatch System公司的Feature Analyst 软件、美国ERDAS公司ERDAS IMAGINE 遥感图像处理软件的Objective模块、加拿大PCI公司PCI GEOMATICA 软件的Feature Obje X模块、美国ITT公司ENVI 遥感图像处理软件的Feature Extraction模块等。其中,eCognition和Feature Analyst 是从高分辨率遥感图像中提取信息的两种最先进的商业软件[12]。

3.2 eCongnition 中规则集的建立

eCongnition在定义中只使用规则进行分类,因此,可以为不同的类制定不同的规则,例如使用阈值、隶属函数来设置某些类别,然后根据构建的规则对图像对象进行分类。eCongnition 中有多种分割方法,包括:棋盘分割、多尺度分割、四叉树分割等。其中,四叉树分割和棋盘分割均采用自上而下的分割规则,自上而下的分割是指将对象分割成更小的对象。(1)棋盘分割:棋盘分割是许多分割算法中最简单的算法,即将图像对象分成正方形的图像对象,然后每个对象按照设计的方格尺寸沿网格线切割;(2)四叉树分割:四叉树分割是基于四边形的分割算法,原理类似棋盘分割,但是创建的块大小不同。四叉树结构的特殊点是每个正方形都有第1个可能的最大尺寸,而第2个正方形满足由图案和比例参数定义的同质性标准;(3)多尺度分割:多尺度分割是一种自下而上的分割方法,在目标间平均异质性最小、内部像素间均匀度最大的前提下,通过对相邻像素或小分割对象的合并,实现了基于区域融合技术的图像分割。多尺度分割的最大优点是可以设置尺度参数值,并且可以在任何应用技术领域中提取和成型。

本试验主要应用了多尺度分割方法。多尺度分割算法的运行取决于各项分割参数的选择,主要的分割参数有:图像各波段权重、分割尺度(Scale)、均质度标准[包含颜色参数(Color)和形状参数(Shape)],其中形状参数又包括紧致度(Compactness)和平滑度(Smoothness)[13]。

3.2.1 各波段权重的选择 图像各波段权重的设定主要由各波段所含信息量的大小、各波段的相关性以及目标地物光谱信息的特征确定。通过赋予图像各波段层不同的分割权重,强调对信息提取有用的波段,去掉冗余的波段,可以有效提高分割速度。

3.2.2 分割尺度的选择 分割尺度是控制图像对象异质性和确定生成图像对象大小的阈值。分割尺度越大,生成的多边形越少,多边形的平均面积越大,反之同理。所以,对于不同的目标地物,选择适合的分割尺度(最优分割尺度)是非常重要的。针对图像设置不同的分割尺度,生成不同尺度下的图像对象层,构建图像对象网络层次结构。图像对象层按照从大到小、从上到下方式进行排列:图像像元层位于最底层,分割尺度最大的图像对象层位于最高层。

3.2.3 均质度标准的选择 均质度标准(homogeneity criteria)是由颜色参数和形状参数综合衡量的。颜色参数是参与生成图像对象最重要的标准,考虑到光谱信息是遥感图像数据中所载的主要信息,在一般情况下需要设置较大颜色参数权重。形状参数分为平滑度参数和紧致度参数。平滑度参数通过平滑边界优化图像对象;通过图像对象之间的紧凑性来优化紧凑性。进行均质度标准参数权重选择时需要遵循2个原则:尽可能设定较大颜色参数的权重;对于外形规则的地物适当提高形状参数的权重。

4 数据源和方法

4.1 数据源

GF-2是第1颗空间分辨率优于1 m的民用光学遥感卫星,卫星携带了2个高分辨率的1 m 全色相机和4 m 多光谱相机。该卫星具有空间分辨率高、定位精度高、姿态快、可操作性强等特点,有效地提高了卫星的综合观测效率,达到国际先进水平。GF-2是我国高分辨率地球观测系统(CHEOS)的第2颗高分辨率成像卫星,是我国第1颗具有地面采样距离(GSD)的民用高分辨率成像仪。与GF-1 相机相比,数据分辨率有所提升[14]。GF-2 因其数据高获取能力和高空间分辨率越来越受到国内学者的重视,GF-2 数据广泛应用于农业资源管理[15]、精准农业[16]、林业[12]、建成区提取监测[17-18]、水域监测[8,19]等领域,是目前我国空间分辨率最高的卫星数据,对国土资源调查、灾害应急管理等具有十分重要的价值。

本试验数据为海南地区GF-2 卫星数据,全色分辨率为1 m,多光谱分辨率为4 m。研究区域为海南省屯昌镇及其周边区域,覆盖范围:5 735像元×5 429像元,主要包括建筑物、植被、道路、水体和裸地。

数据预处理:在ENVI5.3 平台对数据进行了正射校正、辐射定标、数据融合和大气校正等预处理,得到标准化数据,便于在eCognition软件中进行分类和构建特征值,图1为真彩色合成的研究区示意图。

4.2 植被指数特征值的建立

米级分辨率和亚米级分辨率的卫星影像多应用于城市环境调查,如土地覆盖和土地利用制图[20]。目前,我国相继发射的GF 系列卫星为国内土地利用分类研究提供了更加丰富的数据源,尤其是GF-2 米级分辨率为城市地区的土地利用变化监测提供了更加可靠的数据支持。植被指数(VI)广泛应用于土地利用分类研究,随着面向对象分类法的快速发展,将植被指数作为特征值参与到面向对象的分类算法中可以有效地弥补遥感影像本身光谱值的不足,能够放大特征值,达到针对某一地物更准确的提取效果。李恒凯等[21]采用GF-1 遥感图像作为数据源,采用面向对象的分类方法,结合模糊分类和CART 决策树分类方法,并在非水体类别中采用了归一化植被指数(normalized difference vegetation index,NDVI),用于区分植被和非植被,取得了高精度的研究区土地利用分类结果。张贵花等[22]将植被指数与不同分辨率的遥感图像结合起来,在eCongnition 平台确定最佳分割尺度,并根据典型植被类型的物候特征、光谱和空间特征构建了分类规则,并利用面向对象分区策略,对黄河三角洲植被类型进行了自上而下的分类,取得了较高的分类精度。本试验在用eCognition Developer 进行分类时利用光谱值进行分类并不能达到理想的分类效果。基于以上考虑,并且由于GF-2 蓝、绿、红、近红外4个波段的限制,在软件平台只引入以下3个特征值。

4.2.1 归一化植被指数(normalized difference vegetation index,NDVI) NDVI是植被物候学中最常用的植被指数之一[23]。NDVI 利用绿色植物叶片的光谱特性,在红光波段的强吸收和近红外波段的强反射表达植被生长状况。通过NDVI的计算和设定阈值进行分类能够有效地区分城市地区和植被覆盖地区,在本试验中NDVI 被定义为

4.2.2 土壤调节植被指数(soil-adjusted vegetation index,SAVI) SAVI的目的是解释背景的光学特征并纠正NDVI 对土壤背景的敏感性[24]。SAVI 不同于NDVI的是增加了根据实际情况确定的取值范围为0~1的土壤调整系数L。L=0,表示植被覆盖度为零;L=1,表示土壤背景的影响为零,即植被覆盖度越高,L的值越趋于1。近年来,SAVI 逐渐应用于城市不透水面的提取,对于区分裸土和不透水面具有较高的贡献率[25]。考虑到研究区影像为海南省5月20日的GF-2 卫星数据,植被覆盖度较高,土壤背景的影响较小,所以在本试验中将L 设置为0.8[26-27],公式为

4.2.3 归一化差异水体指数(normalized difference water index,NDWI) NDWI是基于近红外波段与绿波段的归一化比值指数。该指数一般用来提取图像中的水体信息,效果较好[28]。本试验采用了Mcfeeters在1996年首次提取的NDWI计算方法,用于提取研究区水体信息,其公式为

4.3 技术路线

以上3种特征值均用于区分试验区的地物类型,本试验首先基于像素(pixel based)在eCongnition中用多尺度分割法分割了影像。多尺度分割是eCongnition 中常用的分割算法。基于区域融合技术的图像分割是一种自下而上的分割方法,它将相邻像素或小块目标组合在一起,保证了目标间的最小平均异质性和目标间的最大同质性。多尺度分割的最大优点是可以设置尺度参数,并且可以在任何应用技术领域中进行提取和建模,技术流程见图2。

由图2可以看出,试验第1 步在数据预处理和数据融合的基础上首先建立了一个多尺度分类规则,命名为Level1,然后在NDVI、NDWI和SAVI 3个特征的基础上,人为查看最佳提取阈值,发现NDVI在0.46 是一个较为明显的临界点,>0.46表明植被覆盖度较高,在Level1 图层中将符合条件的判定为林地。第2 步利用NDWI 提取水体,经过反复查看,将NDWI为0.30 作为识别水体的阈值,即NDWI≥0.30时能够较好地提取水体,包括城市地区的水体和河道浅水区。在以上2个步骤中,符合条件的判定为目标地类,不符合条件的判定为未分类,第3个子规则在未分类地物中进行:将NDVI 设置为≥0.20,满足条件为其他植被,不满足则是未分类地区;在提取城市地区不透水面中,归一化建筑指数NDBI是较为有效的手段,广泛应用于城市土地利用变化监测研究[29],但是受GF-2 波段的限制,未能计算NDBI 用于不透水面的提取,改用SAVI 区分城市地区和非城市地区(详见4.2),经过反复试验,将SAVI<0.20 判定为城市地区,其他的则为未分类;除了林地、水体和不透水面,试验区还有农田和低矮灌丛、城市地区绿化带等其他植被类型,第4步同样在未分类当中进行,这里将NDVI≥0.20定义为其他植被;因为前3 步已将林地提取出,所以并没有林地的干扰。在完成以上步骤后,发现还有未分类的地物,通过观察发现均是草地、荒地或低矮灌丛等植被区域,所以,最后将SAVI值在0.20~1.00的地物定义为其他植被,并得到最终分类结果(图3)。

5 结果与分析

试验采取了海南省中部地区及周边5 735像元×5 429像元大小的GF-2 图像为数据源(融合后分辨率1 m),在eCongnition软件平台,首先使用多尺度分割算法切割图像,并构建了NDVI、NDWI、SAVI 3种植被指数特征用于分层分类的提取地类。在多尺度分割图上设置了3种植被指数的提取关键阈值,搭建了4层子规则,逐步提取了林地、水体、不透水面和其他植被(农田、灌丛和城市绿化)。分类结果为不透水面12.392 km2、水体2.534 km2、林地8.519 km2、其他植被7.690 km2。

通过混淆矩阵对分类结果进行了精度验证,基于高分辨率高分数据的面向对象土地利用分类能够达到很高的精度。该分类体系的Kappa 系数达到了0.95,总精度(overall accuracy)达到了0.96,制图精度(PA)和用户精度(CA)均在0.90 以上,获得了很好的分类效果(表1)。

通过对分类结果的分析,林地提取结果最优,水体其次,不透水面和其他植被也有较好的分类结果。本文采用的指数特征在分类过程中的贡献率表现,NDVI 对林地和其他植被的贡献率较高;SAVI 对于不透水面的贡献率高,能够很好地将建筑物和道路从其他地类中提取出来,但是在部分地区未能将裸地从不透水面中提取出来。由图3的分类结果可以看出,结合植被指数和水体指数对试验区的土地利用分类取得了十分理想的结果。其中,林地因其高NDVI值的特点,提取效果是最为理想的,水体其次,其他植被的分类过程中,有一小部分林地和农田有混淆的情况,其原因可能是试验选取的遥感图像是海南地区的,而海南又属于橡胶树种植区,人工种植的橡胶树地块容易跟天然林地混淆。在试验初始阶段,在基于光谱DN值和形状特征、紧凑特征度等特征采用分类分割方法未能取得较好的分类结果,尤其没能完整地提取图3c 左上角的水体部分,对浅水的提取也不够准确完整。但是,通过计算NDWI值,设定阈值的方法能够较完整地提取浅水地区和城市地区的水域。此外,使用SAVI 能够较完整地提取不透水面(建筑物和道路)。

表1 精度验证结果

本试验的结果表明,在eCongnition软件平台,采用多尺度分割和多种指数结合的方法,逐层提取城市土地利用、覆盖分类十分高效,且便于操作,适合在区域尺度上应用。

6 结论和讨论

城市土地覆盖信息的提取是进行城市合理布局评价的首要内容。然而,使用传统的基于像素的分类方法对高分辨率遥感图像的分类并未充分利用图像的数据信息,造成分类精度较低。利用面向对象的遥感信息提取方法,提高了高分辨率遥感图像分类的精度和效率。

本试验也有不足之处,例如天然林地和高大农作物的混淆,不透水面和裸地的混淆,如图3d所示,影像有一块较为明显的裸地。但是,通过分层分类的提取,3种植被指数未能有效地区分裸地,而且较为明显,这也是作者未来在土地利用分类研究中重点研究的方向。

猜你喜欢

植被指数面向对象土地利用
GEE平台下利用物候特征进行面向对象的水稻种植分布提取
基于深度学习与融合地形特征的黄土陷穴面向对象提取方法
土地利用变化与大气污染物的相关性研究
基于无人机图像的草地植被盖度估算方法比较
基于GIS⁃Logistic回归模型的土地利用变化及驱动机制研究
冬小麦SPAD值无人机可见光和多光谱植被指数结合估算
土地利用规划的环境影响评价分析
区域规划土地利用变化监测与评估关键技术研究
面向对象方法在水蓄冷PLC编程中应用分析
从面向过程到面向对象思维方式的教学引导