APP下载

决策树在高分辨率影像目标为小地物的分类应用研究

2014-10-26张妤琳刘晓南

韶关学院学报 2014年6期
关键词:面向对象决策树分辨率

张妤琳 ,赵 宇 ,刘晓南 *

(1.韶关学院 英东农业科学与工程学院,广东 韶关 512005;2.广东省生态环境与土壤研究所,广东 广州 510650)

航天遥感技术经过几十年发展,已形成全天时、全天候、实时/准实时的高空间分辨率对地观测能力,更多的应用领域如土地利用、城市规划、全球变化、农业、林业、测绘制图、军事有了更便利、更详细、更具现势性的数据来源[1-2].当图像空间分辨率突破米级时,人们平常视觉所见的多数目标物个体如单株树、汽车和房屋等在图像上直接可见,能提供更多的地面目标和细节特征,提高信息提取和监测的精度,以解决更多与经济、社会和生活密切相关的问题,造福于人类及其居住环境[3-4].快鸟(Quick Bird)遥感卫星影像数据(以下简称快鸟数据)分辨率为0.61 m,具有空间分辨率高、不受地形和空域限制、数据更新快,可定时/定向/定点、费用合理等优点,广泛应用于各领域.

但在加快高分辨率影像应用的同时,其局限性也逐渐显现,如高空间分辨率往往伴随低的光谱分辨率[5];数据量大、处理耗时、对硬件要求高[6];高昂的成本让一般项目望而却步等.应用相关软件从Google Earth上下载快鸟、Ikonos等数据已成为免费获取高空间分辨率影像的有效途径[7-8],但因无光谱信息,对其解译局限大.因此,研究如何充分利用易获得的高空间分辨率的优越性、提高分类精度与目标提取的可靠性有重要意义.

1 研究背景

遥感影像必须经过处理和解译才能成为有用的信息,主流解译方法包括目视解译、人机交互式解译、RS与GIS一体化解译和影像智能解译(即自动解译)[1,9]等.目前也出现了神经网络、向量机、面向对象[10]等多种新型方法,但这些方法或对分类人员者有较高的知识要求,或算法复杂、难以理解和解释,均未能得到更广的应用.高空间分辨率影像解译的局限性主要表现为:(1)同面积遥感影像因分辨率提高而数据增大,数据传输要承受更大压力,解译方法须可操作性较强且计算量较低;(2)影像视角范围扩大并且光照条件趋于复杂,同一地物像点位移、反射多变、景物遮挡等现象更普遍,但自动解译分类处理时易产生错误,对传统解译方法提出严峻挑战.

决策树分类方法已在各类遥感信息提取和土地利用/覆盖(LUCC)分类中被应用[11-12].在美国“土地覆盖数据库”计划中,该方法在土地分类、城市密度、林冠密度等信息提取均有应用,但研究应用于高空间分辨率遥感影像的解译中还较少.本文结合高分辨率遥感研究领域中重点科学问题之一:如何对目标为小物体的研究,对小型地物——水塘进行遥感影像解译研究实践.

2 研究对象与方法

本文对目标为水塘研究的广州市天河区快鸟数据,分别运用最大似然分类法、面向对象分类法和决策树分类方法进行遥感解译.通过ENVI中混淆矩阵工具,结合野外调研的146个GPS点,构建误差混淆矩阵,计算分类精度及Kappa系数以评估前述三种方法的解译精度.

2.1 研究区概况

研究区位于广州市天河区, 位于 113°15′55″~113°26′30″E,23°6′0″~23°14′45″N 之间. 区径东西极限长18.75 km,南北极限长15.75 km,总面积137.38 km2,是广州市的新城市中心.地势由北向南倾斜,形成低山丘陵、台地、冲积平原三级地台.水资源丰富,河涌遍布.土地利用以城乡建设用地、园林地为主.

2.2 数据准备和预处理

数据源为从Google Earth下载的天河区2007年快鸟数据,选取外业调研采集的25个GPS点对影像进行几何校正,为增强可比性和推广性,不做图像增强.采用的辅助数据包括1∶1万的DEM、交通及水利部门土地利用数据以及该区域的SPOT5影像.分类完成后,都采用Majority分析对小图斑重新分类.

2.3 分类体系

以检验分类技术和方法对比为目的,突出以小地物为目标的特点,参照第二次全国土地利用调查分类体系,根据研究区的特点,确定土地利用的类别为:塘、耕地、园林地、城乡建设用地、交通用地、水利用地和其他土地.

3 结果与分析

3.1 最大似然分类法

最大似然分类是基于参数化密度分布模型的遥感分类主要方法[13].若影像数据的空间分布特征较为离散、复杂,或训练样本不充分、无代表性,或函数参数计算不准确,则可能造成分类结果偏离实际情况,导致精度下降.广州市天河区的快鸟影像用该法分类得到的结果如图1所示.该方法在此次研究中的分类精度并不理想,尤其是研究目标——塘的分类结果远远达不到要求.因为数据空间分辨率高,所以特征空间分布较为复杂和离散,且从Google Earth下载的数据无光谱信息,这在其他土地高精度的分类结果上也能体现出来,该分类精度和kappa系数分别为78.330 3%和0.739 0.

3.2 面向对象分类方法

面向对象分类方法是以像元为单元[14],分类过程步骤多,数据量大,耗时,对硬件要求高,不适宜用于分辨率高数据量大的遥感数据.

该方法用影像的颜色(光谱)信息进行信息的提取与归并[15],分类的规则局限于影像本身的光谱比率、形状、面积等信息,而从Google Earth下载的快鸟数据无光谱信息.在分割和合并的过程中,对边界明显的地物如高速公路、河涌等斑块效果较好,而对边界不明显的斑块,如林地和耕地的斑块分类效果较差.该方法分类精度取决于设定的斑块大小,斑块过大则分类误差大,如交通用地与城乡建设用地,斑块过大则合并为一类;斑块过小则数据量大,如天河区的城中村建筑物斑块细小密集;对尺度不同、内部变化不同的地物分割精度和融合度显著不同,缺乏统一可靠的图像分割融合精度与评价标准,斑块的大小不好掌控,主观性大.图2为用面向对象分类法对广州市天河区快鸟数据进行分类得到的结果,该分类精度和kappa系数分别为74.181%和0.689 1.

3.3 决策树分类结果

本次研究采用决策树算法中最主流的基于ID3算法发展的C4.5算法[16],针对本次研究数据量大和目标地物小的特点,采用单变量决策树[9],即在每一内部结点处的判别界面输入数据的单一特征定义.在每一内部结点,输入数据被单一判决特征分割成两个或多个子数据集.分类过程从“原级”到“终极”回归分割直到每一个叶结点终止,每一叶结点的分类值即是分类开始时所定义的 “种子”值,具体流程见图3.

图4为依据图3建立分类规则进行分类所得结果,从该图可看出,塘和耕地的精度最高,因两类数据来源于目视解译成果;交通和水利用地次之,因数据来源于往年土地调查结果;园林地和城乡建设用地间精度较低,因两者分类是基于NDVI数据,计算的精度依赖于SPOT5的精确度和NDVI的选值,另在城乡建设和水利用地中,有绿化用地被划分为园林地;精度最低是其他土地,该类土地通常以裸地为主,裸地是过渡性质的土地利用类型,最终去向为城乡建设用地,这对目标于小地物研究来说影响很小.因此决策树的总体分类精度为94.857 4%,相对最大似然分类法和面向对象分类方法提高了16.52%和20.68%,kappa系数分别提高了0.18和0.23,为 0.916 2.

图2 广州市天河区快鸟数据面向对象方法分类图

图3 基于决策树的快鸟数据分类流程

图4 广州市天河区快鸟数据决策树分类图

4 结语

在本次决策树规则的编写中融合目视解译、人机交互解译(NDVI)、RS与GIS一体化(土地调查数据)的三种解译方法.在结合这三种方法能利用GIS多源信息辅助分类、增加信息量、减少解译中的不确定性等优点外,决策树方法也具备自身独特优势:(1)对分类者要求较低:不需备具大量知识以先验确定,分类更方便、快捷,结果更客观;(2)对遥感数据要求较低:当影像空间分布复杂、光谱信息和属性缺失、数据多源且有不同分布和尺度等时,不需假设先验概率分布,分类结果也较理想;(3)能单独或同时应用高空间分辨率和高光谱分辨率的优点,解决两者不可兼得的矛盾;(4)决策树既是直观明了的知识表示,也是高效的分类器,易于表达和应用;(5)在对影像数据特征空间的分割上,更有效提取小目标地物,运算速度快、效率和鲁棒性高,对应用于未来使用更广泛同时数据量更大的高分辨率遥感影像上更具优势.

在本文研究中,决策树的解译结果精度最高,这与辅助数据精度高息息相关,这既是该分类法的优点,也是缺点.当辅助数据较少、精度较低、与遥感影像成像日期不匹配等时,只能利用遥感数据本身获取分类信息,这时的分类精度则可能低于最大似然和面向对象两种分类方法.在以后的研究中,如何用决策树更好的挖掘遥感影像本身的数据信息将是研究的一个方向.

[1]何凯涛,甘甫平,王永江.高空间分辨率卫星遥感地质微构造及蚀变信息识别[J].国土资源遥感,2009(1):97-99.

[2]周兆叶,储少林,王志伟,等.基于 NDVI的植被覆盖度的变化分析[J].草业科学,2008,25(12):23-29.

[3]明冬萍,骆剑承,沈占锋,等.高分辨率遥感影像信息提取与目标识别技术研究[J].测绘科学,2005,30(3):18-20.

[4]黄慧萍,吴炳方,李苗苗,等.高分辨率影像城市绿地快速提取技术与应用[J].遥感学报,2004,1(1):68-74.

[5]王兰,耿泽勋,冯颖.高辐射分辨率遥感影像的特性分析与处理[J].海洋测绘,2010,30(4):79-82.

[6]孙丹峰,杨冀红,刘顺喜.高分辨遥感卫星影像在土地利用分类及其变化监测的应用研究[J].农业工程学报,2002,18(2):160-164.

[7]莫平浩,胡茂林.利用 Google Earth 制作卫星影像图[J].电力勘测设计,2008,4(2):30-31.

[8]马谦.智慧地图:Google Earth/Maps/KML核心开发技术揭秘[M].北京:电子工业出版社,2010.

[9]黄建文,鞠洪波,赵峰.快鸟数据在退耕还林中应用方法的研究[J].林业科学研究,2004(3):267-271.

[10]赵磊.基于多源遥感数据的区域景观格局尺度效应[J].遥感应用,2009(8):55-60.

[11]那晓东,张树清,孔博,等.基于决策树方法的淡水沼泽湿地信息提取[J].遥感技术与应用,2008,23(4):365-373.

[12]王占昌.利用决策树对卫星遥感数据进行分类[J].青海科技,2005(5):28-33.

[13]陈亮,刘希,张元.结合光谱角的最大似然法遥感影像分类[J].测绘工程,2007,16(3):40-47.

[14]李霞,王飞,徐德斌,等.基于混合像元分解提取大豆种植面积的应用提取[J].农业工程学报,2008,24(1):213-217.

[15]陈云浩,冯通,史培,等.基于面向对象和规则的遥感影像分类研究[J].武汉大学学报,2006,31(4):316-320.

[16]洪家荣,丁明峰,李星原,等.一种新的决策树归纳学习算法[J].计算机学报,1995,18(6):470-474.

猜你喜欢

面向对象决策树分辨率
一种针对不均衡数据集的SVM决策树算法
EM算法的参数分辨率
原生VS最大那些混淆视听的“分辨率”概念
决策树和随机森林方法在管理决策中的应用
基于深度特征学习的图像超分辨率重建
一种改进的基于边缘加强超分辨率算法
基于决策树的出租车乘客出行目的识别
面向对象Web开发编程语言的的评估方法
基于面向对象的车辆管理软件的研制与开发
基于肺癌CT的决策树模型在肺癌诊断中的应用