APP下载

先验知识引导的遥感影像均值漂移多尺度分割

2021-12-17吴田军骆剑承沈占锋张新邵明文

遥感信息 2021年5期
关键词:均值尺度对象

吴田军,骆剑承,沈占锋,张新,邵明文

(1.长安大学 理学院,西安 710064;2.中国科学院空天信息创新研究院 遥感科学国家重点实验室,北京 100101;3.中国科学院大学,北京 100049;4.中国石油大学(华东)计算机科学与技术学院,山东 青岛 266580)

0 引言

在高空间分辨率(以下简称“高分”)遥感影像发展历程中,面向对象的分析思想对分类、变化检测、目标识别等信息提取任务的精度提升起到了开拓性、引领性的作用[1-2]。作为面向对象分析的前提和基础,影像分割是实现对象化信息提取的关键步骤,将直接关系到地物信息提取的精度和效率[3-5]。因此,随着近年来高分对地观测技术的普遍应用以及各行各业对基础地理信息获取精度要求的提高,遥感影像分割技术在面向对象分析领域受到越来越多的关注。

遥感影像的分割其实是将一幅遥感图像划分成若干互不交叠的区域(对象),以保证每个区域的像素在一定尺度下具有光谱、纹理等特征的高度同质性(即较小的异质性),从而在空间上分离和表示地物目标[6]。在传统的图像处理领域,较为经典的方法是边缘检测法和区域分割法。前者是基于不同区域间像元灰度不连续的特点,利用Roberts、Prewitt、Sobel、Laplace、LOG、Canny等算子检测出区域间的显著边缘,以实现影像的对象化切分;后者则是将具有相似性的像元聚合起来构成斑块,实现的主要方法有阈值法、聚类法、区域生长与合并法等[7]。

与一般图像相比,遥感影像具有多尺度、多波段、宽覆盖以及地物类型多样等特点。其在使用常规的图像分割方法时,存在两个方面的典型问题:一是没有充分利用遥感影像所体现出来的地物多源特征,仍主要依靠图像的光谱信息进行分割,导致不能有效地融合地物多维特征信息;二是没有充分考虑遥感影像的地物尺度特性,过分割、欠分割现象较为普遍,导致分割对象的边界误差被过多地传递到后续的分类、目标识别、变化检测等任务中,阻碍了面向对象分析方法的推广应用。

针对这些问题,学者们陆续开展了一些探索,取得了一些研究进展,但总体来看仍存在以下三个方面的问题:首先,单景遥感影像的数据量越来越大,需要同时处理的数据规模已严重影响分割效率;其次,影像空间分辨率已发展至米级/亚米级水平,清晰程度的提高势必对地物分割边界的精细程度提出了更高要求;最后,尺度对于正确认知地表具有重要意义,但现有分割算法采纳的尺度参数以及尺度间的选择与转换机制仍无法达到与地物匹配的程度。因此,在这些困境之下,我们有必要面向实际应用的需求进一步发展遥感影像的分割算法,以提高对象级信息提取的精度[8]。

从方法层面来看,在近年来实施的高分遥感影像分割任务中,基于区域生长与合并的分割方法更受重视,相关研究不断涌现。该类方法是在指定尺度下,从单个像元大小的区域开始,采用相邻影像区域两两合并增长的方式,实现对目标影像上的同质对象的提取。相比其他方法而言,区域生长与合并的分割实现过程更易于与尺度问题相结合,能够通过在算法中制定一定的合并规则将影像划分为不同尺度下的小区域(即对象或基元),进而可建立不同尺度间对象的空间关联与转换关系[9]。鉴于此,本文聚焦区域生长与合并方法体系中一种快速、稳健的分割算法——均值漂移(mean shift),在其传统的算法实现基础上,针对遥感数据特性进行优化改造,以满足高分遥感影像面向对象分析对边界精细刻画的要求,为后续的对象表达与分析奠定基础。

考虑到影像分割算法输入的尺度参数与待分割影像中的地物类型以及影像自身的空间分辨率密切相关,因此有必要结合影像空间区域内不同的地物类别进行分割尺度参数的多样化设置与自适应选择。源于该想法,本文将传统的均值漂移分割流程进行改进,提出一种先验知识引导下的多尺度分割方法,期望在先期解译获得的土地覆盖/利用图蕴含的地物空间分布信息助力下,实现目标影像的多尺度分割。核心思想是利用先期解译的土地覆盖/利用图斑边界与土地覆盖/利用类别等先验知识的指引,设计出一套基于均值漂移的多尺度分割实现策略,期望改进的均值漂移多尺度算法在对象分割方面能优于传统的单尺度算法,可以更好地实现从栅格化影像空间到矢量化地理空间的转换过程,助益于后续的对象分类等信息提取任务。

1 均值漂移原理及其图像分割应用

1.1 均值漂移算法的基本原理

均值漂移最早是针对传统自然图像提出的一种在特征空间中实现统计迭代聚类的算法,其原理简单、效率高,因而被广泛应用于平滑、分割、目标跟踪等图像处理任务中。该方法的关键步骤是依靠特征空间中的训练样本点进行非参数的密度函数估计[10]。在此基础上,密度函数梯度估计可由密度函数估计的梯度求得。因此,均值漂移算法具有较好的收敛性,漂移方向总是能指向局部密度极大值点,故而是一种自适应快速上升算法,可以通过计算找到最大的局部密度,并向其位置“漂移”[11]。

在实际应用中,为了减少计算复杂性,往往会设置样本点为等权重,并将带宽矩阵统一选择为单位矩阵的比例阵。另外,为了增加收敛路径的平滑性常采用高斯核函数,此时只需指定一个大于零的带宽h确定核函数即可,由此实现通过数据点向样本均值移动的迭代过程。综合来看,均值漂移算法对于不同结构的数据均具有较好的适应性与稳健性,更详细原理可参见文献[12]。

1.2 均值漂移的图像分割流程

近年来,均值漂移算法作为一类区域生长与合并方法被广泛应用于各领域的图像分割任务中,特别是被成功用于高分遥感影像的对象化提取[13-14]。概括来说,均值漂移的图像分割流程包含“滤波”(filtering)和“合并”(merging)两个步骤,图1表示了其基本过程,大致包括以下步骤[15-16]:首先,在确定算法核函数以及光谱域带宽hs、空间域带宽hr后进行均值漂移算法实施的主体部分,即基于“空间-光谱”域的均值滤波过程;通过均值漂移滤波过程实现影像的初始滤波和像素聚类,从而形成若干个不可再分的碎小斑块区域(像斑),以此作为后续尺度合并的基础;其次,通过设置最小区域合并尺度参数M实现基于滤波结果的区域合并,即将像元数小于M的斑块合并到其相邻的最相似斑块中,从而完成像斑的合并过程;最后,通过区域标记和矢量化技术提取多边形作为对象边界,完成整个影像的分割过程。

图1 遥感影像均值漂移分割流程图

在前期的研究工作中,本文在剖析了均值漂移分割算法filtering和merging两大关键步骤后,对其算法原理开发的开源代码(edge detection and image segmentation system[17])进行了改造,以使其能更好地适应波段数大于3的多光谱高分遥感影像,并保证在较好抑制遥感影像噪声的同时,最大限度上保留边缘等结构特征。此外,本文还发展了基于均值漂移的分区分块并行分割策略,以适应单幅/拼接的大规模高分影像数据量大的问题[18]。在这些工作基础上,经过前期的探索和实践,我们意识到,目前的单尺度均值漂移分割方法存在较大的弊端,亟需对其进行多尺度的实现设计,寄希望通过参数的多元化选择来生成更符合地物语义表达的对象。

2 现有遥感影像分割方法的局限性

对地表过程的观察与测量依赖于观测的尺度。在一个空间尺度上是同质的、各向同性的现象,到另一个空间尺度就可能是异质的、各向异性的,因此尺度选择与转换机制是地学研究的关键问题[19]。类似地,对于遥感影像信息提取而言,尺度的选择也会影响结果的精细化程度。因此如何根据不同的成像条件、任务目标、环境影响因素,选择合适的尺度进行遥感信息提取,已成为目前面向对象分析奏效与否的重要因素。

在本文重点关注的遥感影像分割任务中,尺度选择问题同样是影响分割质量的关键因素。首先,基于地物的空间分异规律以及交错分布,不同地物往往具有不同的空间表达尺度,即便同一种地物在不同的尺度上也有着不同的特征[20],因此在遥感影像大范围宏观的对地观测视角下,多尺度是地物的基本特性,但多数分割方法仍是基于单个尺度实现的,很难应对带有较高地物复杂性的遥感影像分割任务。鉴于尺度参数对分割结果的重要影响,不少学者也提出了一些自适应的多尺度选择算法[21-22],其中多数方案是基于自底向上的区域合并方法产生的。较为典型的是eCognition软件所采用的多分辨率分割方法(multi-resolution segmentation),其通过调整一个与分割结果——影像对象大小密切相关的尺度参数实现对影像的多尺度分割。然而,尽管这些算法取得了一定研究进展,但仍没有建立起遥感影像多尺度分割的统一标准,局限性体现在两个方面。一是未建立尺度自动选择和递进关系的转换机制,影像分割中“尺度参数”的设置没有直观地连接到一个具体的、有关联的地物目标框架下,“适宜”的尺度参数选择一直没有最佳定论。二是影像对象的建立受分割方法的影响较大,不同尺度下得到的结果大相径庭,对地物的贴合程度差异较大,欠分割和过分割现象的矛盾一直未能有效规避,需要针对不同的地物差异化地选择与其特征相适应的尺度参数,才能有望得到贴合地表空间表达的分割对象。上述两个方面的局限性说明,遥感影像的多尺度分割方法值得进一步深入研究和发展。

3 先验知识引导的多尺度分割方法

3.1 研究目标与方法思想

对于遥感影像分割算法而言,输入的尺度参数应与待分割影像中的地物类型(土地覆盖/利用类型)、影像自身分辨率大小密切相关,因此有必要结合影像区域内不同地物类别进行参数的多元化设置与选择。然而,传统的分割算法通常只在某一指定的尺度下实现基于影像数据的对象构建,并未考虑影像上不同地物对分割尺度的适应性差异问题。因此,在知识驱动的遥感信息提取架构下,如何将已有的先验知识融入到分割过程,使尺度参数的设置与选择更加合理,算法执行效率和精度得到提升,这是本文关注研究的问题。

进一步来说,既往的分割方法一般以单一的影像作为输入,不寻求建立“待分割对象”与“该空间上的已有认知(如先期土地覆盖/利用图的图斑边界与地物类别)”两者之间的对应关系。事实上,作为一类重要的先验知识,前期解译的土地覆盖/利用图蕴含了大量的地物空间分布和类别属性信息,可以辅助后续目标影像的智能化处理[23-25]。例如,在过往解译的土地覆盖/利用图中,图斑边界表示了从土地覆盖/利用角度描述的完整、均质地块,其类别属性指示了地块内部占主导地位的土地归属类型,而且这些信息在短期内具有相对稳定性,因此依据其提供的先验认知来指导差异化的尺度参数选择,有望获得更好分割结果。另外,参照图1的实现过程,只需设定多个不同的最小区域合并尺度参数M,即可便捷地实现基于均值滤波的多尺度合并过程,从而达到多尺度分割的目的。鉴于以上分析,本文考虑在目标影像的分割过程中引入先期解译的土地覆盖/利用图,将传统均值漂移分割流程进行改进,引入先期解译图的图斑边界和类别属性等先验知识,为均值滤波得到的像斑选择不同的最小区域合并尺度参数M,以实现差异化的像斑合并,继而达成多尺度分割并改善对象提取精度的目的。

3.2 实现流程

依据上述设计思想,对传统均值漂移分割流程进行改造,得到了图2所示的多尺度分割步骤。

图2 先验知识引导下的遥感影像均值漂移多尺度分割方法实现流程

具体说明如下:首先,构建特征空间,依据高分遥感影像的空间分辨率和光谱分辨率确定核函数及其带宽参数h=(hs,hr);设置待识别区域的目标地物类别体系C={C1,C2,…,Cm},并对各地类设定最小区域合并尺度参数Mi(i=1,…,m),由此构建尺度参数集;其次,将已有的土地覆盖/利用图实施类别合并和矢量栅格化操作,获得与目标类别体系一致的地类栅格数据;随后,依据核带宽参数对待分割的影像实施基于空间域和光谱域的均值滤波,获得大量细碎的像斑用于后续的区域合并;滤波完成后,执行本文方法的核心步骤,即多尺度的像斑合并,先读取第一个像斑,依据地类栅格数据判断该像斑所在覆盖区域的优势地类Ci(即像斑所在空间区域内同类别栅格像元比例最高的地类),据此对该像斑分派匹配于地类Ci的最小合并尺度参数Mi,进而在此尺度参数下对该像斑及其周边区域进行像斑的合并、标记,并根据给定的不同合并尺度参数Mi对标号数据进行对象限制与再合并,继而再继续扫描是否还有未处理的像斑,若有则读取下一个并重复上述处理步骤,直至所有像斑处理完成且所有像斑区域都满足要求,从而完成多尺度参数设置下的像斑合并;最后,对合并处理后得到的像斑,利用矢量化技术构建多边形,输出最终的分割对象。

4 实验及其结果分析

4.1 实验1

为检验本文设计方法在遥感影像分割应用上的效果,首先选取国产资源三号(ZY-3)高分影像进行实验。图3(a)所示的ZY-3融合影像位于安徽省淮南市,成像于2013年3月18日,尺寸大小为2 675像素×2 279像素,空间分辨率为2.1 m。此外,还收集了在图3(a)区域范围内先期解译的土地覆盖图(见图3(b),参照2012年12月的ZY-3高分影像解译得到的图斑矢量,地表覆盖的主要类别包括耕地、林地、水域及建设用地四大类),将此作为先验知识用于本文算法中。

图3 实验1使用的数据集

在核带宽参数hs=10、hr=20的设置下,采用单尺度方法以及本文设计的多尺度方法得到的分割结果如图4所示,其中图4(a)、图4(b)分别为采用统一尺度参数M=1 000(情形1,所有地类的尺度参数均为1 000)、M=100(情形2,所有地类的尺度参数均为100)的分割结果,而图4(c)则是对不同地类设置不同尺度参数(情形3,耕地、林地、水域及建设用地的尺度参数分别为1 000、1 000、1 000、100)的分割结果。需要说明的是,图4(a)、图4(b)是为了比较不同尺度下的分割效果而进行的对比实验结果;另外,图4(c)的尺度参数集是作者经过多次实验后选择的尺度参数组合值,带有一定的经验性。

目视比对图4的三个结果可以看出,在使用单一分割尺度参数M=1 000时(图4(a)),影像在建设用地区域存在一定的欠分割,而在选用单一分割尺度参数M=100时(图4(b)),影像在耕地和林地区域存在较严重的过分割。相对而言,选用尺度组合参数集M={1 000,1 000,1 000,100}得到的多尺度分割结果(图4(c)),能对不同地类区域保持较好的对象完整性。因此,对比单尺度参数和多尺度参数设置下针对耕地、林地、水域以及建设用地等地物对象的提取效果后,可以说明,在原始的分割算法中嵌入前期解译图蕴含的先验知识,可以帮助其进行尺度参数的合理选择,减少了过/欠分割现象的发生。

图4 实验1基于不同尺度组合的均值漂移分割结果(黑色线为分割对象边界线)

由于目前尚无统一标准直接对分割效果进行定量评估,通过对象级分类的分析效果加以间接佐证。在图4的分割结果基础上,采集了200个训练样本进行分割对象的土地覆盖分类,得到图5所示的结果;之后再用其余的50个测试样本进行了分类精度的评价,精度统计如表1所示。从图5的分类结果以及表1所示的分类精度评价可以看出,在选用单一的分割尺度M=1 000时,对象尺寸较小的建筑物存在一定的欠分割,导致建筑物这一类别的分类精度相比于选用单一分割尺度M=100时略低;在选用单一的分割尺度M=100时,对象尺寸较大的耕地又存在一定的过分割,导致其分类精度相比于选用单一分割尺度M=1 000时略低;而当基于多尺度分割获得的对象进行土地覆盖分类时,分类精度得到一定程度的提高。这间接说明,与单一尺度参数分割相比,本文方法计算得到的多尺度分割对象能较好地兼顾各类型地物在空间上的聚合性和分异性,差异化的分割对象更符合地表实际情况,而这间接助力了面向对象分类精度的提升。

图5 实验1基于不同尺度参数组合分割对象的分类结果

表1 实验1不同分割尺度下面向对象分类的分项精度比较

4.2 实验2

为进一步检验本文方法,选取SPOT 5 全色多光谱融合的真彩色合成影像作为实验2的数据集(图6(a))。该实验区位于广东省惠州市,数据成像于2006年4月13日,尺寸大小为2 033像素×1 716像素,空间分辨率为2.5 m。图6(b)是当地2005年参照0.5 m空间分辨率的WorldView影像目视解译后得到的土地利用调查图。依据地类层级关系进行了地类合并,得到了如图6(c)所示的先期地类图(包括耕地、林地、草地、水域、建设用地、其他用地六大地类),将其作为先验知识输入至本文方法开展实验。

图6 实验2使用的数据集

在与实验1相同的核带宽参数设置下,获得了如图7所示的分割结果,其中图7(a)、图7(b)分别为采用了单一尺度参数M=1 000(情形1,所有地类的尺度参数均为1 000)和M=100(情形2,所有地类的尺度参数均为100)得到的分割结果,而图7(c)是对不同地类采用不同的尺度参数(情形3,耕地、林地、草地、水域、建设用地及其他用地的尺度参数分别为500、1 000、500、1 000、100、500)得到的分割结果。从整体上观察,可以看出,本文方法提取的对象边界较单一尺度分割方法得到的结果有一定效果提升:图7(a)采用单尺度参数M=1 000时,在建设用地区域表现为严重的欠分割;在图7(b)采用M=100时,在耕地、林地及水域区域又表现出明显的过分割;图7(c)所示本文方法得到的多尺度分割结果保持了相对完整的对象斑块,同时也没有出现过多的欠分割,一方面对尺寸较小的建设用地对象进行了较为细致的分割,另一方面在尺寸较大的林地、水体对象上又保持了较好的完整性。

与实验1类似,在获得了图7所示的分割对象后,采集了100个训练样本和50个测试样本分别进行面向对象分类及其结果的精度分析。从图8和表2的视觉对照和精度比对可以看出,基于多尺度分割对象的分类结果在整体精度上亦有所提高。这正如上述分析,本文方法实现了不同地类对象的多尺度提取,即避免了选用单尺度参数M=1 000分割导致欠分割较严重而影响了建筑用地的分类精度,也规避了选用单尺度参数M=100分割导致的过分割而影响了耕地的分类精度。因此,与单一尺度下对象级分类结果对比,可以看到,本文多尺度分割方法一定程度上减少了过/欠分割现象的发生,获取的对象边界与差异化的地物目标贴合程度更好,间接帮助了面向对象分类的精度提升。

图7 实验2基于不同尺度组合的均值漂移分割结果(黑色线为分割对象边界线)

图8 实验2基于不同尺度组合分割对象的分类结果

表2 实验2不同分割尺度下面向对象分类的分项精度比较

4.3 讨论

针对遥感影像地物对象的多尺度提取需求,本文改造了传统的均值漂移分割算法,在实施合并步骤时,通过先期解译图的地类空间分布获取了滤波像斑所在空间范围的优势地类标签,据此为不同区域的像斑选择了符合其地类固有特征的“最小区域合并尺度参数”,从而建立起了待分割对象与先验知识之间的空间映射关系,自适应地匹配合适的尺度参数,最终实现了多尺度的分割过程。

通过上述两个实验的结果分析,我们对本文发展的多尺度分割方法归纳了以下两点优势:第一,改进的多尺度分割方法继承了均值漂移滤波算法在稳健性等方面的原有长处,并在分割对象的边界准确性方面优于单尺度方法,能更好地实现遥感影像从栅格到矢量的转换过程,有利于对象形态的表达和后续的特征提取;第二,多尺度是复杂地表空间的固有特性,过往的算法多与对象多边形的面积而非内容相联系,而本文设计了结合地物空间分布的尺度参数选择策略,能适应空间分异的对象提取。

5 结束语

针对面向对象分析的前置环节,本文以适应性和稳健性较好的均值漂移算法为基底,提出了一种先验知识引导下的多尺度分割方法,详细给出了实现流程,并通过两个实验数据集对其分割效果以及进一步的对象级分类进行了分析验证。实验结果表明,在先期解译土地覆盖/利用图提供的先验知识辅助下,本文设计的多尺度分割方法较传统的单尺度方法能更好地结合地类空间分布信息实现对象提取,为后续的对象分析提供了精准的边界形态信息,因而在高分遥感信息提取领域具有一定的应用前景。

最后,需要说明的是,本文仅从算法角度提出并验证了我们设计方法的可行性与有效性,并未对多尺度分割的其他环节做过多考虑。例如,我们在实验中是通过反复多次实验后经验性地选取了一组较优的尺度参数集,并未通过设定某种准则来选择更优的尺度参数集,也没考虑如何在分割过程中耦合除影像色调之外的纹理等多源特征。此外,基于本文提出的技术框架,未来还可以进一步发展更优的像斑归并规则,以获得蕴含一定语义的高层次对象。上述这些问题有待在后续研究中进一步探索。

猜你喜欢

均值尺度对象
涉税刑事诉讼中的举证责任——以纳税人举证责任为考察对象
财产的五大尺度和五重应对
攻略对象的心思好难猜
基于熵的快速扫描法的FNEA初始对象的生成方法
宇宙的尺度
均值与方差在生活中的应用
区间对象族的可镇定性分析
关于均值有界变差函数的重要不等式
对偶均值积分的Marcus-Lopes不等式
9