一种新的面向对象城市建筑物信息提取方法研究

2015-12-14樊舒迪胡月明刘振华

华南师范大学学报（自然科学版） 2015年6期

樊舒迪，胡月明，刘振华

(华南农业大学资源环境学院，国土资源部建设用地再开发重点实验室，广东省土地利用与整治重点实验室，广东省土地信息工程技术研究中心，广州510642)

城市建筑用地信息提取是城市发展规划和建筑用地开发的重要基础工作，快速、准确的建筑用地信息能够在国家的城镇化进程中发挥重要作用. 随着遥感技术的发展，影像地表信息的提取变为可能，在城市建设用地信息提取方面取得一定的成就. 曹雪和柯长青［1］结合高分辨率影像提出一种多尺度遥感分类算法提取城市建筑信息;刘勇洪等［2］基于决策树对影像进行分类;孙晓霞等［3］利用面向对象分类方法从IKONOS 全色影像中提取城市中的道路信息;程家聪［4］通过多尺度分割后，基于样本的面向对象分类提取珠三角地区的建筑用地信息;徐涵秋［5］通过对谱间特征和归一化指数分析对城市建筑用地信息进行提取;樊风雷等［6］分析了建筑用地、水体和植被等3个指数的分布规律，找出了获取建筑用地信息的最优组合，获取了全新的NDBI 提取建筑信息.

目前的城市信息提取方法大致分为以下4 种:(1)利用非监督分类分类器进行分类，也称为聚类分析，如ISODATA、链状方法等［7］;(2)经过特征判断和样本选取后，利用监督分类分类器进行分类，如最小距离、最大似然、支持向量机等;(3)利用成熟的单一指数或多个指数结合进行提取;(4)将地物作为对象，采用面向对象的分类方法对目标地物进行提取.

基于遥感影像进行建筑物自动提取技术存在诸多问题:(1)传统的影像信息提取是在光谱分析的基础上进行的，由于高分辨率影像的光谱信息十分有限，此类方法不能最大程度地挖掘建筑物信息;(2)采用单一归一化指数或是多个指数组合的方法虽然可以有效地获取建筑用地信息，同样因高分辨率影像光谱信息的局限性，该类方法效果好坏取决于影像融合结果的优劣;(3)建筑用地不同于其他类型的地物，其获取方式有一定的针对性. 综上所述，由于众多条件的限制和影响，在影像中提取建筑特征比水体、绿地等信息更加具有挑战性.

建筑用地信息提取方法的研究更多地把关注点放在地物光谱信息的差异，虽然考虑了多因子结合联合提取的可能性，但还未将地物的形状、纹理、大小、相邻关系纳入考虑范围，就高空间分辨率遥感的影像而言，其地物景观的结构、纹理、几何特征和位置等信息更为丰富.因此，本文采用多尺度分割和基于规则知识库结合的方法对广州市白云区的建筑用地进行提取.

1 材料与方法

1.1 研究区概况

以白云区榕溪街区为研究区，该区的建筑物分布密度大且绿化较少，东部与铁路相邻，西街与大冈街区隔水相望，南部有榕溪花园(图1).

图1 研究区(QuickBird-2 真彩色合成)Figure 1 Study area (QuickBird-2 true color)

1.2 数据及预处理

采用QuickBird-2 卫星数据，QuickBird-2 多光谱有4个波段，其分辨率为2.44 m，全色波段1个，空间分辨率为0.61 m; 该数据的多光谱波段为可见近/红外波段，传感器的可见光/近红外部分与Landsat-7 ETM 数据中的可见光/近红外的波谱范围基本一致.其扫描宽度为16.50 km;重访周期1.00 ～3.50 d，随纬度不同而异，研究区影响像素为555*444，对应面积为9.16 km2.本文采用ENVI 5.1 平台开发的基于MODTRAN4+辐射传输模型的FLAASH模块对QuickBird-2 各波段进行大气校正. 考虑到QuickBird-2 包含较低分辨率多光谱数据和高分辨率全波段数据，采用Gram-Schmidt 融合方法对QuickBird-2 数据进行融合，从多光谱波段中提取1个波段作为全色波段，对提取出的全色波段和多光谱波段进行变换，将改全色波段被作为变换的第一波段;用高分辨率的全色波段替换Gram-Schmidt 变换后的第一波段;最后应用Gram-Schmidt 反变换得到融合图像(图2).

图2 融合前后图像对比Figure 2 Comparison of images before and after fusion

1.3 研究方法

采用尺度分割和规则数据库结合的方法，技术流程见图3，首先对高分遥感多光谱和高光谱数据进行融合，并以融合后的结果为研究对象采用基于Mumford-Shah 模型的Full Lambda-Schedule 算法做多尺度分割;最后，经过反复试验，选取包含光谱特征、形状特征、几何特征和纹理特征等多个指标建立规则知识库，利用此规则知识库对Full Lambda-Schedule 算法获取的多尺度分割结果进行分类，从而得到较高的分类结果.

图3 技术流程图Figure 3 Technical flowchart

1.3.1 多尺度分割-MumfordShah 模型图像分割的目的在于将图像中相似度高的灰度值或遥感影像中辐射亮度值的区域分离出来，然后通过各个区域边界的方式表达. Full Lambda-Schedule 算法是基于简化的Mumford-Shah 模型针对Synthetic Aperture Radar(SAR) 影像的初步识别、地物特征获取以及挖掘潜在研究区目标地物的需求而提出的. 基本思想是统筹考虑影像数据中的光谱信息、形状信息以及空间信息，对相邻区域的像元集合区域迭代至一定的预设条件，以完成对图像的分割［7］.

假设u(x，y)是定义域Ω 的图像，K 是图像边界，它将图像分成若干个离散的区域，得到分割图像u0(x，y)，则Mumford-Shah 模型目的就是找出最优的边界，将定义域内的若干分离像元集合连接起来，最终分割后的图像u0(x，y)与原来的任何分割图像u(x，y)形成边界的误差相比都要小，即令方程最小化:

其中，K 为分割得到的边界集合;边界总长度为φ(K);Ω 为已有图像;g 为图像Ω 的灰度值;u 表示图像各个子区域的分段近似值常数;λ为分割参数，若λ取值较小，得到细节较多的分割结果，反之，得到细节较少的分割结果.

Mumford-Shah 模型是一种很好的分割架构，该模型优点在于不需要知道待分割图像区域的先验知识，完全可以基于图像数据来完成分割.要将该模型应用于实际的数字图像分割中，就需要将其离散化.将Ω 看作一个由离散变量i (i =1，2，…，n)索引的像元集合，图像g 和它的模型分别由每个像元灰度值g(i)和u(i)表示，分割后得到的区域为图像Ω 被边界K 分成的子集，K 表示边界，φ(K)表示边界包含的像元总数.

式(1)离散化后，转化为:

对于固定的边界K，当u 为每个区域的均值时，E(u，K)达到最小，因此可以假设:

其中O 表示整个图像区域.要令式(3)最小，需通过区域生长的方法，Oi表示图像的第i 子区域，ui表示该区域所有g 值的均值，θ(Oi，Oj)表示子区域Oi和Oj的公共边长，区域合并的标准如下［8］:E(K，θ(Oi，Oj))－E(K) =

其中|Oi|表示第i 子区域面积;若Oi、Oj满足条件λ≥ti，j时，说明Oi、Oj需要被合并，ti，j表示方法如下:

其中，Oi表示图像Ω 的第i 子区域，|Oi|表示第i 子区域面积，ui表示该区域所有g 值的均值，‖ui－uj‖2表示第i 子区域和第子区域的欧式距离，φ(θ(Oi，Oj))表示第i 子区域和第j 子区域的公共边长.

简单描述Full Lambda-Schedule 算法如下:

初始阶段，将图像中的每个像元都作为一类地物，如50* 50 的图像在初始状态下，认为该图像存在2 500个地物类型.

第二阶段，对所有相邻区域的像元计算其ti，j值，并通过一般的排序方法定位最小的ti，j值，并且确定最小值的下标编号i 和j.

第三阶段，将第二阶段定位到的编号为i 和j 区域内的像元作为同一类地物，即一个新的地物类型.

最后，重复第三阶段的合并过程，直到ti，j大于合并预设的终止条件为止，假如只剩下一类地物，同样终止运算.

1.3.2 建筑物规则知识库的建立面向对象技术将对象作为最小单元，采用基于规则(rule) 的方法提取地物信息，对每个对象设置规则对其对象进行约束，每一个规则中包含许多属性，每个属性都是对其规则的描述.每个对象可包含一个或者多个规则，每个规则包含多个属性，每个对象中各个规则之间的关系是逻辑运算中“或”的关系，每个规则中各个属性之间的关系是逻辑运算中“且”的关系.通过以上规则的逻辑关系，建立合理的规则体系可实现对地物的精确识别.参考文献［9－11］，本文根据光谱特征、形状特征、几何特征和纹理特征等指标建立建筑物规则知识库.

(1)对地表建筑物提取必须先排除其他类型的地物，首先要排除水体的影响，本文根据当前的数据情况改进了Xu［12］提出的MNDWI.对构成该指数的波长组合进行了修改，可以看出MNDIWI 需要数据中包含中红外波段，现有数据并不满足此条件，通过水体的光谱特征分析，发现水体对可见光中的绿色波段反射率相对近红外较高，与其他的地物有着较明显的区别，鉴于以上情况，采用近红外替代中红外，分别在含不同水体类型的遥感影像进行实验，获得了与MNDWI 相似的效果，精度与原有的指数相持平.实验还发现，改进后的归一化指数比原来的NDWI 更能够体现出水体内部不易发掘的特征，如悬浮颗粒的密度、沉淀物的状态变化、水体污染情况等.除此之外，MNDWI_Changed 能够有效地剔除水体中的阴影区域，解决了消除水体阴影的难题.修改后的MNDWI 用于精确分辨影像中的水体，修改后的归一化水体指数为:

其中，Bgreen表示绿色波段反射率，Bnir表示近红外波段反射率.使用修改后的指数可较精确地区分研究区水体信息.

(2)在排除植被影响的过程中，考虑到植被光谱中近红外和红色波段的典型光谱特性，可以利用归一化植被指数进行提取. 城市中的植被主要以公园的植被和道路中的绿化带为主，由于植被的近红外波段与红色波段差值明显大于建筑物以及水体等地物.经过反复试验，本文将与之定为0.30，大于或等于阈值的地物为植被.

(3)道路的光谱特性与低反射率的建筑物十分相似，仅通过各波段的反射率难以将其区分.通过对道路的几何形状特征分析，可知道路主要呈狭长的带状，亮度与低反射率建筑物相似，根据以上特征，可以使用空间属性中的延伸性和形状要素进行提取.

(4)地表建筑物相对复杂，不能单一采用光谱特征来进行判断，可以采用主成分分析提取出主要信息［12］，其中包括大部分的建筑物、部分植被、部分水体以及少量阴影，首先排除植被、水体和阴影，通过植被指数NDVI ＞0.30 排除植被，剩下建筑物、水体和阴影. 然后通过MNDIWI_Changed ＞0 排除水体，得到建筑物和阴影. 由于阴影的光谱比较特殊，可通过(Band(B)－Band(R)) /(Band(NIR)－Band(R)) ＜0 进行提取，除此之外，还需外加规则Band(NIR) ＜1 000.00 和AREA ＜100.00 约束以去除一些噪声的影响，以上条件为第一层条件.

对于建筑物的光谱特征判断，可知建筑物反射率随波长单调递增且斜率增大，可以建立规则知识库使用约束条件:(Band( R)－ Band( B)) /( Band(NIR)－Band(R)) ＞0 AND Band(B)－Band(R) ＜0 AND (Band(R)－ Band(B)) ＞(Band(NIR)－ Band(R)) AND (Band(R)－ Band(G)) /(660－560) ＞(Band(NIR)－Band(R)) /(830－660); 对于建筑物的形状特征，该街区并无大面积的厂房或广场，可以添加约束条件:AREA ＜300.00 AND (RECT_FIT ＜1.00 OR 1.00 ＜=ELONGATION ＜5.00 OR FORMFACTOR ＞1.27 OR LENGTH ＞92.96 OR 15.00 ＜=MAINDIR ＜=75.00)，以上条件为第二层规则.根据低反射率建筑的光谱曲线分析，其可见光近红外反射率在0.10 ～0.20，需要在第二层条件基础上添加新的约束条件:Mean( Band( B)) ＞1 000.00 AND Mean( Band( NIR)) ＜2 000.00，其中，Mean( Band(* ))表示地物某波段反射率，由于原始数据经过辐射校正，数据存在10 000 的倍率，在此特别说明(1 000 表示地物反射率为0.10). 同理，根据低反射率建筑的光谱曲线，在第二层条件上添加约束条件:Mean(Band(B)) ＞1 250.00 AND Mean(Band(NIR))＜1 750.00;对于高反射率建筑物，由于已知其光谱曲线为单调递增函数，只需添加约束条件:Mean(Band(B)) ＞2 000.00.由于研究区存在一些蓝色屋顶的建筑物，需要另分一类，由于蓝色屋顶建筑的光谱曲线与阴影相似，但反射率整体高于阴影，去除水体和植被的影响后，将阴影提取出来，并添加光谱特征条件:Mean(Band(B)) ＞1 000.00 AND Mean(Band(NIR)) ＜2 000.00.

2 结果与分析

2.1 利用Full Lambda-Schedule 算法进行多尺度分割

本文利用Full Lambda-Schedule 算法对原始影像进行多尺度分割. Full Lambda-Schedule 算法中的阈值设置如下:记t 为地物与背景的分割阈值;地物像元数占图像比例为w0; 平均灰度为u0; 背景像元数占图像比例为w1，平均灰度为u1，图像的总平均灰度为:u =w0u0+w1u1，从最小灰度值到最大灰度值遍历t，当t 使得值g =w0(u0－u)2+w1(u1－u)2最大时，t 即为分割的最佳阈值. 经过反复实验对比发现，在分割与合并的阈值分别为80 和50 条件下，能够最大可能地将不同类型(光谱特性)的地物分开并且合并同类的碎块.多尺度分割后(图4)，原有的噪声得到了很好的控制. 虽然多尺度分割最大可能地将不同类型的地物分开并且合并同类的碎块，但由于地物本身的形状、纹理等性质的差异，依然存在同一类地物被分成了2 类甚至多类的现象，在这样的情况之下，需要在此基础上结合规则知识库对信息提取进行优化.

图4 分割前后图像对比Figure 4 Comparison of images before and after segmentation

2.2 地表建筑物信息提取

在多尺度分割的基础之上，根据遥感影像信息、相关资料的收集和调查，将地物分类为8 类(植被、水体、蓝色屋顶建筑物、高反射建筑、中反射建筑、低反射建筑、道路和阴影)进行信息提取. 其中，蓝色屋顶的建筑物是钢结构厂房或货集装箱房，屋顶采用蓝色彩钢瓦或防火岩棉夹芯板，低反射建筑是光谱反射率大约0.10 的建筑物，其光谱与道路的相似，中反射建筑是一般的建筑，如城中村的红砖房、表层深色涂料的房屋等，其反射率介于0.10 ～0.20之间，高反射建筑物是指表层为反光涂料如白色轻质隔墙板的建筑，其反射率在0.20 以上，光谱特性区别于其他建筑. 用FullLambda-Schedule 算法对影像进行多尺度分割后，根据各个地物的纹理特征、形状特征和光谱特征，通过逻辑运算对每类地物进行进一步提取，提取结果如图5C 所示.为了便于比较分析，本文分别采用一般面向对象法——基于样本特征的面向对象分类和监督分类法提取地表结构信息(图5A 和图5B).由图5 可看出，传统的监督分类并没有对图像进行分割，出现较多的噪声，造成部分水体被错分为阴影，而传统的基于样本特征的面向对象分类，很难将低反射建筑物从中反射建筑物中分离.对于本文的高分辨率影像数据，采用基于规则的方法，结合对光谱特征的判断，通过知识库的一系列规则的限定，更容易将原有错分为阴影的道路和基于样本特征的面向对象分类很难提取的低反射建筑物提取出来，不但提高了特征提取的精度，而且规则易于理解，可行性较高.

本文采用的数据分辨率较高，相对于监督分类来说，面向对象方法提取地物信息可行性更高，优势更大.文中采用的基于规则的面向对象分类在一般的面向对象方法的基础上，加入了形状要素、矩形要素、纹理要素等条件约束可优化城市信息的提取，得到精度更高的结果(图6).可以看出，面向对象方法比传统监督分类更好地提取建筑物的轮廓，减少噪声，得益于规则知识库的条件限制，基于规则的面向对象分类的信息提取精度比一般的面向对象方法更高，提取的效果更好，比传统方法更适合高分辨率影像的城市信息提取.城市地区的矩形轮廓较为明显，原本由于高楼、树冠等地物形成的阴影被去除.

图5 分类结果Figure 5 Classification results

图6 城市信息提取结果Figure 6 Information extraction results of city

2.3 精度验证

通过对训练区随抽样、相关资料的收集调查和目视解译的方法对分类结果进行精度评价，其结果见表1 ～表3，结果表明总体精度等于被正确分类的像元数除以总像元数，其中基于规则的面向对象分类的总体精度为87.01%，基于样本的面向对象分类的总体精度为81.17%，最大似然分类的总体精度为72.54%.在最大似然分类误差矩阵中，植被分类的精度较高，误差较小;但是水体、道路、阴影和蓝色屋顶的建筑物错分误差较大，有相当一部分的道路被错分类为低反射建筑物，这主要是由于道路与低反射建筑物的光谱特性十分接近，仅仅通过光谱特征难以从低反射建筑物中提取出道路;同样也有一部分蓝色屋顶建筑未被从低反射建筑物中提取出来，这是因为蓝色屋顶的涂料不尽相同，有部分与低反射地物的光谱极为相似，导致错分现象的出现.面向对象的分类方法充分利用了地物的纹理特征、形状特征和光谱特征等对象知识，综合分析各个特征，道路提取的精度得到了显著提高，除此之外，部分水体被错分类为阴影的问题也得到很好解决，错分和漏分比传统监督分类要少得多，总体精度也达到了87.01%，该方法比一般的面向对象方法的总体精度更高. 最大似然分类方法的Kappa 系数为0.68，表示达到中等的一致性;基于样本的面向对象法的Kappa 系数为0.81，基于规则的面向对象法的Kappa 系数为0.87，几乎完全一致，对于高分辨率影像的建筑物的信息提取，面向对象的方法优于传统监督分类，而本文的方法比一般的面向对象方法精度更高，更适用于高分辨率的遥感影像信息提取.

表1 基于规则的面向对象法精度评价Table 1 The accuracy assessment of rule-based object-oriented method

表2 基于样本的面向对象法精度评价Table 2 The accuracy assessment of example-based object-oriented method

表3 最大似然分类方法精度评价Table 3 The accuracy assessment of maximum likelihood method

3 结论

多尺度分割技术与知识库结合的方法很好地解决了传统方法的噪声问题，这是因为细小的噪声低于判断阈值，被合并入相邻区域中，在分析时被作为同类像元对待，即同一对象.该方法在分类过程中灵活地应用影像中的各种光谱特征、几何特征、纹理特征、空间属性和拓扑关系建立有层次的规则知识库，符合人的思维，高分辨率影像的城市信息提取工作中可行性高.

尺度分割和规则数据库结合的方法可以有效地避免传统的基于像素分类时出现一些错分类或漏分类的情况(如:道路和阴影)，比其分类方式更加符合人类的思维方式，与实际值更接近，总体分类精度可达到87.01%，是高分辨率影像城市信息提取的较为有效的方法，精度有保障.

本文提取城市信息具有一定的局限性:其一，多尺度分割的阈值是通过像元数所占比例确定，耗时较长，需要经过多次试验，如果研究区过大，可能出现多个阈值，需要对研究区进行分区然后在逐一确定阈值;其二，一种地物区别于其他地物的特征难以选取，同样需要大量试验，且需要拥有丰富的遥感学、地理学、物理学和材料学等知识以及信息提取经验作为支撑.

［1］曹雪，柯长青. 基于对象级的高分辨率遥感影像分类研究［J］.遥感信息，2006(5):27－29.Cao X， Ke C Q. Classification of high-resolution remote sensing images using object-oriented method［J］. Remote Sensing Information，2006(5):27－29.

［2］刘勇洪，牛铮，王长耀.基于MODIS 数据的决策树分类方法研究与应用［J］. 遥感学报，2005，9(4):407－409.Liu Y H， Niu Z， Wang C Y. Research and application of the decision tree classification using MODIS data［J］.Journal of Remote Sensing，2005，9(4):407－409.

［3］孙晓霞，张继贤，刘正军. 利用面向对象分类方法从IKONOS 全色影像中提取河流和道路［J］. 测绘科学，2006，31(1):62－63.Sun X X， Zhang J X， Liu Z J. Extracting the river and the road using an object oriented technique from IKONOS panchromatic imagery［J］. Science of Surveying and Mapping，2006，31(1):62－63.

［4］程家聪.面向对象的高分辨率遥感信息提取技术研究［D］.武汉:华中科技大学，2013.Cheng J C. Object-oriented information extraction technology research of high resolution remote sensing［D］.Wuhan: Huazhong University of Science ＆ Technology，2013.

［5］徐涵秋.基于谱间特征和归一化指数分析的城市建筑用地信息提取［J］.地理研究，2005，24(2):311－320.Xu H Q. Fast information extraction of urban built-up land based on the analysis of spectral signature and normalized difference index ［J］. Geographical Research，2005，24(2):311－320.

［6］樊风雷，刘润萍，张佃国.一种改进的城市建筑用地信息提取方法及在广州地区的应用［J］. 华南师范大学学报:自然科学版，2014，46(4):98－102.Fan F L，Liu R P，Zhang D G. An improved method to extract building land information and the application in Guangzhou［J］. Journal of South China Normal University:Natural Science Edition，2014，46(4):98－102.

［7］冯登超.基于最小距离法的遥感图像分类［J］.北华航天工业学报，2012，22(3):1－2.Feng D C. Remote sensing image classification based on minimum distance method［J］. Journal of North China Institute of Aerospace Engineering，2012，22(3):1－2.

［8］Robinson D J，Redding N J，Crisp D J.Implementation of a fast algorithm for segmenting SAR imagery［R］. Australia: DefenseScience and Technology Organization，2002:34.

［9］Koepfler G， Lopez C， Morel J M.A multisca1e a1gorithm for image segmentation by variational method［J］. SIMA Journal on Numerical Analysis，1994，31(1):282－299.

［10］胡进刚. 一种面向对象的高分辨影像道路提取方法［J］.遥感技术与应用，2006，21(3):184－188.Hu J G. A method of road extraction in high-resolution remote sensing imagery based on object-oriented image analysis［J］. Remote Sensing Technology and Application，2006，21(3):184－188.

［11］Mcfeeters S K.The use of the Normalized Difference Water Index (NDWI) in the delineation of open water features［J］. International Journal of Remote Sensing，1996，17(7):1425－1432.

［12］Xu H. A new index for delineating built-up land features in satellite imagery［J］. International Journal of Remote Sensing，2008，29(14):4269－4276.