APP下载

影像图中水体识别与提取技术研究综述

2022-12-01赵晨曦胡敬芳宋钰高国伟胡平

传感器世界 2022年8期
关键词:波段水体阈值

赵晨曦 胡敬芳 宋钰 高国伟 胡平

1. 北京信息科技大学 传感器北京市重点实验室,北京 100101;

2. 北京信息科技大学 现代测控技术教育部重点实验室,北京 100192;

3. 北京国科舰航传感技术有限公司,北京 100101

0 前言

在人类生活、生产等方面,水资源是一种非常重要的资源,发挥着重要的作用。快速并且准确地提取水体信息,在水资源规划和调查、预防洪水灾害和船舶航行中具有重要意义。遥感图像不直接与物体相互接触、不对其他物体造成破坏,能够动态地对其进行广泛而深入的检测,它的分辨率很高,而且具有成像周期相对较短、实时性强、不受地域限制的特点。传统水体信息的获取方式主要包括2类,分别为人工野外测量和水文监测站的监测。人工勘测可以得到较为精确的水体信息,但往往需要耗费大量的人力物力以及时间,在测量过程中也会存在一定的危险性,此类方法对于高时空频率水资源的收集并不具有适用性,遥感图像有利于高分辨率的遥感图像水体信息的获取,弥补了人工野外观察耗时耗力等问题。

现如今,已经有多种提取算法用于水体识别,例如最早的阈值法、分类器法,再到目前热门的神经网络算法以及深度学习法。阈值法操作简单但精度较低,只适用于地势平坦、水域较为宽阔的水体识别;分类器法精度相对于阈值法较高,但实现难度较高,无法实现全自动化水体提取;深度学习算法目前已经可以基本实现全自动化水体提取,精度随学者们的不断研究也在逐渐升高[1]。本文通过对比分析各类研究方法在速度、精度以及自动化程度存在的问题,直观地了解这一研究领域的进展。

1 水体提取研究现状

遥感水体提取技术现阶段已经能够将光谱与空间信息进行结合,极大提升了技术的实用价值。最初,水体提取只能通过人工野外测量来获取水体信息,此后不断发展到将半自动化作为核心的提取方法。在这之后,全自动化水体的提取得到进一步完善,多元遥感数据下的深度学习算法解决了全自动化水体提取中的精度问题,分别针对不同应用领域实现了高精度提取。然而,遥感图像中的阴影、云层遮挡、亮度不同仍会对水体提取的精度产生影响,对于这些课题的研究在水体识别、分割、目标检测中具有重要的意义。遥感水体发展历程如图1所示。

2010 年之前,遥感技术尚未像现在一样先进,图像质量不清晰等问题严重影响着水体提取的精度,通常只能够实现以像素波段间为核心的运算与分析。周成虎等人[2]发现,在TM影像(Thematic mapper所获取的扫描影像)中,水体具有一种特别的谱间特征,其灰度值为:

TM2+TM3>TM4+TM5 (1)其中,TM2表示0.52~0.60 μm,绿光波段;TM3表示0.63~0.69 μm,红光波段;TM4表示0.76~0.90 μm,近红外波段;TM5表示1.55~ 1.75 μm,中红外波段。

MCFEETERS S K等人[3]结合植被指数进行分析,通过2个主要波段建立了归一化差异水体指数,针对这一方法研究出了在不同条件下的水体指数,成为了当时的热门研究对象并逐渐发展成为水体提取的主要方法。

2010 年之后,针对水体提取的精度问题,面向对象法得到进一步完善,在精度方面得到极大提升。崔齐等人[4]探讨了一类实现空间高分辨率遥感影像的方式,采取了面向对象,结合矢量约束提升实际的提取效果,解决了传统阈值法不能够对细小水体进行精确提取的问题。由于影像质量的影响以及外界环境变化,传统的阈值法提取的精度就会大幅降低;面向对象的抗噪力很强,随着高分辨率影像的兴起,影像中的一些细小水体变得更加明显清晰,通过将纹理和空间信息及其他区域信息的结合和匹配,水体的提取精度也就会提高。

2015 年之后,研究学者为图像匹配校准做出了巨大的贡献,提出了多元化的新型技术。光学影像在水体识别应用时存在一定限制,云层和阴影对最终提取效果产生的影响较为突出;SAR图像对于浅水和阴影区域具有比较良好的适用性,可以充分利用雷达数据所具有的优势,进而为水体提取提供一定便利。当前来讲,半自动化的水体提取技术已逐步完善,实现全自动化的水体提取是主要的研究方向,有着人脑运转机制的深度学习方法成为了此研究领域的热门[5]。

深度学习方法利用信息融合技术以及多种网络来构建水体提取模型[6]。在实际河流遥感图像中,背景大多是复杂异构的,传统的检测方法不能识别出小的支流,边缘信息粗糙[7]。为了解决上述问题,XIA M等人[8]提出一种基于不同大小融合的可分离残差网络。该方法利用残差神经网络作为主干网络获取河流的信息特征,通过不同尺度的模块将深度特征信息与浅层特征信息融合。利用浅特征和大尺度注意模块对河流的主要位置进行定位,利用深特征和小尺度注意模块对河流边缘进行精细分割,从而从背景中准确提取河流。LIU P等人[9]提出一种新的全卷积网络,其中空间残差SRI模块通过连续融合多层次特征来实现语义理解,为了提高计算效率,引入了深度可分离卷积和卷积分解,显著减少了模型参数的数量。XIA M等人[10]提出一种加权密连卷积网络(W-DenseNet)用于强化学习。通过跨层连接使网络中各层之间的信息流最大化,减少了梯度消失和退化的现象,大大提高了训练收敛速度。WENG L G等人[11]针对训练过程中参数过多、精度低、网络退化等问题,提出了一种可分离残差SR-SegNet算法。SR-SegNet算法一方面通过引入深度可分离卷积来限制参数数量,提高了特征提取能力;另一方面,SR-SegNet在编码阶段去除卷积核相对较多的卷积层,并采用级联方法融合图像的低层和高层特征。实验结果表明,与FCN、DeconvNet和SegNet等传统方法相比,该方法具有显著的改进,以上方法的对比分析如表1所示[11]。

表1 FCN、DeconvNet、SegNet与SR-SegNet算法对比

2 水体特征及提取过程

水体具有多种特征,在分析处理遥感影像的过程中,需要明确每一特征,重点涉及到光谱特征、空间特征等多个方面。水体污染、云层阴影的遮挡或水体中泥沙含量的不同都会对光谱特征产生影响。腐殖质、有机、无机等污染物少的优良水质对阳光能够表现出较为显著的吸收性和较小的散射性。与另外的地物相比,优良水体未超过遥感传感器的波长区间,实际的反射率相对较低。现实生活中的水体还会含有其他不同的物质,水体反射光谱特征也会根据其物质的不同发生不同的变化。

空间特征是地理现象最为核心的特征,其重点涉及到形状特征、纹理特征等多个方面。在自然生态环境中,水体的形状不确定,主要涉及到2类形状特征:一种是线状特征,以江河支流为代表;另一种是多边形特征,具有不规则性,以湖泊和海洋为代表[12]。水体具有显著的连续性,每条河流都是不会突然中断的地物,与其他河流有着一定的交叉汇合,这个特性可为水体提取提供参考。

2.1 水体特征关键参数识别

遥感图像中蕴含着许多水体特征中的参数信息,例如水体颜色、边界轮廓以及不同光谱段属性等。水体中不同的泥沙含量会严重影响水体的颜色,河流的交叉汇聚和河宽的变化也给水体的边界提取增大了难度。目前需要攻克的问题就是找到一种能够从充满噪声、不确定性和不完全性的海量信息当中提取出精确水体信息的方法。

2.2 提取过程

对于特征提取而言,主要是以遥感影像为基础提取有价值的信息。在对水体特征进行处理时,通常将预处理作为首要步骤,遥感图像预处理过程流程图如图2所示。水体提取的方法众多,例如阈值法适用于平坦地区,面向对象法适用于细小水体,在获得预处理的遥感图像后,针对于不同的水体特征选择适合的具体水体提取方法再进行提取。

3 水体信息提取算法

本文将分别从光学(Optical)影像与合成孔径雷达(Synthetic Aperture Radar,SAR)影像2个方面对水体信息提取算法进行简要概述。光学图像内存在实现分类提取和目标识别功能的灰度信息,这些信息由数个波段组成;SAR图像采用二进制复数的形式记录一个波段的回波信息,由于能够变换各个像素的数据,可以利用这一点来实现相位信息和相应振幅的提取。

3.1 基于Optical影像水体提取算法

3.1.1 阈值法

(1)单波段法

单波段阈值法的原理是选取单一的近红外波段,通过多次试验确定某一灰度阈值将目标地物与背景区分。FRAZIER P S等人[13]以澳大利亚Wagga 湖的水体为例,通过阈值法进行提取得到的结果显示 TM5 提取效果更为理想。针对单波段法来讲,对于地势较为平坦、背景不复杂的地区具有良好的适用性。此方法是最简易的水体提取方法,但有很多的局限性,所以多波段法已逐步成为主流,绝大多数研究都会将2类方法搭配应用,进而提升水体信息的提取效果。

(2)多波段法

多波段法一般包括2种类型,分别为谱间关系法和水体指数法。谱间关系法的原理是用逻辑判别表达式对指定的地物进行提取,该方法对某些非常规的水文特征不具有适用性。贾永红等人[14]提出一种将湿度分量作为核心的谱间关系模型,其对应的表达式为:

其中,B2表示绿色波段;B4表示近红外波段;B7表示短红外波段;KT3表示湿度分量。

谱间关系法对于山区水体的提取具有较强的适用性,稳定性好,能够将水体和山体阴影进行有效区分。但这种方法操作起来十分繁琐,需要用到较多的逻辑判断,若判断出错,往往会将建筑物错误地判定为水体,特别是在水植混合区域,实际的提取效果往往不太理想,不具备通用性。

水体指数法是结合不同光波段的比值进行运算,明确相应的水体指数,综合阈值完成提取操作。归一化差异水体指数是由McFeeters提出的,其参考了归一化差异植被指数的理念,相应的表达式为:

这种方法对复杂背景的图像提取效果差,仍需要图像校准过程。孟伟灿等人[15]探讨了一类全新的水体指数,用于解决波段信息较为单一的问题,这种指数主要通过2个波段明确综合水体指数(CWI),分别为V波段和Sat波段,经研究发现,利用该水体指数水体的光谱值比以往要高,而背景值则相对以往下降。该表达式为:

其中,Sat波段为4、3、2波段进行HSV变换得到; V波段为2、3、4、5波段进行LBV变换得到。

经对比分析,各种水体指数都能够有效提取水体,其中利用新型水体指数提取水体的效果最好。然而,水体指数法针对湿地等反射强度大、散射复杂的目标存在不准确甚至误识别的情况。

3.1.2 分类器法

(1)Support Vector Machine法

此类方法主要参考了机器学习方法[16],即便样本量很少,通过该方法也可得到较为理想的分类结果[17]。核函数在SVM法中起着重要的作用。选取最为适用的核函数类型,并对核函数参数进行合理的设置,可以明确该方法性能[18]。按照这种方法,段秋亚等人[19]将鄱阳湖区作为研究的实例,通过2块尺寸不尽相同的GF-1卫星影像进行测试分析,判断各类方法的实用效果,结果表明,在各类主流方法中,SVM法的提取精度最为理想;张德军等人[20]以三峡库区水体为例,结合收集的GF-1数据对目标水体完成提取操作,最后得到的数据显示,SVM法在精度方面具有非常显著的优势,然而在细节方面难以进行良好的处理,尤其是河流的边界或一些细小的水体。

(2)决策树法

决策树分类法的重点是结合一些重要条件对初始数据展开细化处理,通过决策树能够明确各像素的正确类型。程晨等人[21]将鄱阳湖湿地作为探讨的实例,开发了特殊的4层分类器,根据要求进行缨帽变换,结合要求构建决策树模型,最后得到的数据显示其提取效果非常出众。决策树分类法能够表现出多样性的特点,例如具有较强的灵活性,运算效率十分突出,可以规避物谱存在偏差所导致的各类问题,在各类提取结果中,空间分布的地物有一定概率出现错提的情况。

(3)面向对象法

相关实验结果显示[22],在近红外区间内,水体所表现出的光谱特性与水面粗糙度存在紧密的联系[23],在产生高分影像之后,水体提取能够良好地兼顾水面纹理数据,使目标逐步提升至对象层次[24]。面向对象法可以利用多样性的算法,使同质像元构成大小存在差异的对象对目标影像信息有效提取[25]。水体受到阴影的影响,在完成多尺度分割之后,综合光谱信息和空间拓扑关系能够对阴影部分和水体进行准确区分[26]。王俊海等人[27]将光谱数据和形状信息作为核心,结合纹理数据有效降低了城市阴影产生的干扰。崔齐等人[4]提出了一类通过矢量约束提升水体提取精度的方法,通过该方法可以降低地物阴影等产生的影响,对细小水体信息实现了高精度的提取。

3.1.3 其他方法

(1)Back propagation神经网络法

对于该网络而言,信号具有前向传播的特性。为了能够解决常规方法要求对阈值进行设置的问题,杨文亮等人[28]参考BP 神经网络,并对方法的有效性进行了检验。针对人工神经网络法来讲,它是比较典型的监督分类方法,能够明确样本的阈值,大幅度缩减了主观选择阈值所形成的误差,该方法在具体应用的过程中存在一定限制,可能会陷入局部极小的情况,运行时间难以控制。

(2)深度学习法

深度学习是近些年高新技术最为典型的一类,在2006年被提出后就受到了业界的高度关注[29]。这种方法能够体现出较好的特征表达能力,利用深度神经网络结构提取目标比较重要的特征是全自动提取的必要前提。王雪等人[30]运用构建的全卷积神经网络模型进行试验分析,结果显示,全卷积神经网络模型与常规的方法相比具有明显优势,自动化水平相对较高,可以表现出更强的适用性,提取精度也十分理想。梁泽毓等人[31]重点应用多元遥感数据下的深度学习方法,对安徽段的水体进行提取操作,实现了全自动化处理。

3.2 基于SAR影像的水体提取

3.2.1 SAR图像预处理

针对SAR图像而言,其空间分辨率相对较低,噪声比较繁杂,获取的数据不精确,一般需要先对其图像进行几何校正、裁剪、镶嵌、融合等操作。几何校正的步骤为:按照“不受时间影响”的原则明确地面控制点,比如河流交叉点等;在图像及其参考图像上对所有控制点的坐标进行读取,再依托公式对所有控制点的均方根误差进行计算,以所得值为依据明确所有控制点几何校正的精度。裁剪图像的用意是去除研究区之外的区域。在镶嵌图像的过程中,应当选取某影像作为参考图,用作输出镶嵌图像的基准,对输出图像的像元尺寸、数据类型,以及镶嵌图像的对比度匹配予以明确。图像融合可以将低分辨率的多光谱影像与高分辨率的单波段影像重采样生成一幅高分辨率多光谱影像。这些研究为更好地在SAR图像中准确识别水体提供了理论和方法支撑。

为避免图像辐射值因非地物变化引起的差异,可以采用相对辐射校正方法和绝对辐射校正方法。前者的原理是选取2幅图像,其中一副为参考,对另外一副的DN值进行调整,保证同名地物在两时相图上的DN值相同,通过多时相遥感图像的光谱归一化处理,能够进一步明确各时相遥感图像对应的不同辐射值,达到动态监测的目的;后者的原理则是用真实的地表反射率来表示遥感图像的DN值,主要以图像过境时的地表测量数据作为依据,对大气和传感器进行校正时,考虑到地形起伏等因素,实施起来存在一定难度,能够达到此条件的遥感图像比较少。因此,为解决图像辐射值差异,实际应用中多采用辐射校正方法对水体进行识别。

3.2.2 基于SAR影像的水体提取算法

在浅水区域,SAR图像能够提供有效的数据,充分利用雷达数据所具有的优势可以为水体提取提供一定帮助。该类方法中比较具有代表性的包括灰度阈值分割法、基于灰度共生矩阵纹理信息的方法等。

(1)阈值法

这种方法根据表面平滑性相对较强的水体在SAR图像中的特殊性质,利用阈值对影像进行划分,主要包括水体与非水体的二值图。曹云刚等人[32]对ASAR数据进行充分利用,通过该方法成果完成了水体提取工作。申邵洪等人[33]以 KI算法为核心,对水体数据进行准确提取。李景刚等人[34]在进行实验的过程中,重点应用了最大类间方差阈值法,并对其进行了一定改进,最后得到的数据显示,通过Otsu法获取的水体信息具有相对较高的精度。

(2)基于Digital Elevation Model数据

受到地形因素的影响,SAR图像会形成一定的地形阴影,通过阈值法进行水体提取时,阴影也会被提取出来,可以通过 DEM 模拟SAR,利用阴影的特征对其进行准确提取。杨存建等人[35]通过SAR清除水体内的阴影,最终实现半自动提取。HONG S等人[36]重点对SAR、 DEM 数据等进行应用,最后的结果表明,提取精度得到显著优化。

(3)基于滤波法

滤波法是现阶段应用最为广泛的方法,将形态学滤波作为核心,通过多样性的滤波算法对SAR图像所涵盖的斑点噪声进行抑制,以此增加水体提取的精度。王栋等人[37]建立了完善的序列非线性滤波模型,对亮度相对较低的区域进行提取,得到的效果非常理想。Klemenja KS等人[38]将形态学滤波和监督分类方法进行搭配应用,通过训练样本对河网进行提取,最后得到的数据显示,在无需其他用户输入的条件下,这种方法能够在多种数据集中进行应用。基于小波变换的方法在应用时,若水体边缘线光滑性较差,受到形态结构元素的影响,往往会导致边缘特征出现一定误差,实际的精度不够理想。

(4)基于灰度共生矩阵

灰度共生矩阵能够构建多维特征空间,在对样本进行充分积累之后,SAR图像所涵盖的噪声能够得到有效清除,进而使“椒盐现象”的问题获得解决,优化了整体的提取精度。LYU W T等人[39]通过SVM对目标区域进行提取,与常规的阈值法进行对比,这种方法可以将水域和其他的地形有效区分,提升水体提取精度。胡德勇等人[40]在进行实验分析的过程中,将纹理信息和SVM分类作为核心,通过居民地信息提取方法对目标地区信息进行提取。

3.3 光学与雷达遥感数据结合的提取方法

光学影像与雷达影像有一定的互补性。云层和阴影通常情况下会在光学影像应用时产生较为明显的影响,雷达影像在阴影区域就可以很好地获取到所需的信息。近些年,研究学者们便将2种影像结合起来进行水体提取,先通过光学遥感影像展开处理,此后再通过SAR影像对水体完成进一步处理。ZENG C Q等人[41]将光学影像和SAR影像搭配应用,结果表明,2种遥感图像相结合的方法能够更好地实现水体提取。IRWIN K等人[42]构建了能够保证提取精度,尽可能缩小单个数据集模型差异的多个数据集融合分类模型。

现阶段,优化水体提取精度是水体提取需要攻克的一个难关。目前只能通过综合运用雷达影像和光学影像的方法来进行优化,尽管这种方法并未得到推广,然而伴随SAR影像的广泛应用,SAR影像在提取水体信息方面的优势也会逐渐显现出来。

4 研究方法对比分析

4.1 光学影像水体提取方法对比

常规方法一般包括2类,分别为阈值法和分类器法,虽然比较完善,但是在精度要求较为严苛的条件下其适用性较差。下面从数据源、精度、优缺点以及应用领域几方面进行对比分析,如表2所示。

4.2 雷达影像水体提取方法对比

伴随SAR图像的不断进步,其逐渐在水体提取方面得到应用和推广,上一节中介绍了基于雷达影像的4种水体提取方法,分别为阈值法、滤波法、基于DEM数据法及基于灰度共生矩阵法。各类方法都存在其优缺点,如表3所示。

4.3 光学影像与雷达影像对比

从成像特点方面来看,这2类影像表现出互补的特点。对于雷达数据的水体信息提取方法来讲,其绝大部分是为提取中空间低分辨率图像而专门设计的,空间高分辨率雷达影像还不够完善,涉及到的提取方式为数不多。随着光学影像水体提取方法的不断完善,可以发现其对各类影像和地形都具有适用性,精度也比较理想。

针对大面积精度要求相对较低的地区,2类数据的提取各具特性。由于影像质量影响较为突出,第二类方法只对平坦地形具有适用性。在精细化水体提取领域,通常情况下要求应用空间分辨率相对较高的影像,前者在实际应用时提取精度比较理想,后者由于受到基础建设的干扰,提取水体信息时采用灰度共生矩阵的方法,将面临提取周期过长的问题,信息精度也难以保证,所以目前要攻克的难关就是基于雷达准确提取高空间高分辨率影像的水体信息。

表2 光学影像水体提取方法对比分析

表3 雷达影像水体提取方法对比分析

5 结束语

目前,世界各地水资源不断紧缺,因此,精准、高效、动态监控水资源对水质、水量及流域分布的掌握具有重要意义。随着遥感数据增多、图像分辨率升高与图像算法技术的提升,为完成水体提取奠定了理论基础。各国研究学者们基于光学影像与SAR图像提出了多种水体提取的方法,但仍存在一些问题。从算法通用性看,阈值法较为简单;从影像校准方面看,深度学习法提取精度较高。但对于空间高分辨率且背景较为复杂或是一些细小的河流支流影像来说,水体提取的精度却不是很高。

水体提取精度、复杂地区的水体智能化高效提取是未来的挑战。传统水体释义方法需要人工干预,基于深度学习方法的算法能够模仿人脑的运行机制进行全自动化的水体提取。利用深度学习方法构建水质反演模型,对水体的水质总磷、总氮、氨氮等污染物进行检测,使影像图中水体监测走向实用化成为可能。

猜你喜欢

波段水体阈值
Ku波段高隔离度双极化微带阵列天线的设计
最佳波段组合的典型地物信息提取
新型X波段多功能EPR谱仪的设计与性能
农村黑臭水体治理和污水处理浅探
农村黑臭水体治理与农村污水处理程度探讨
土石坝坝体失稳破坏降水阈值的确定方法
基于小波变换阈值去噪算法的改进
生态修复理念在河道水体治理中的应用
最佳波段选择的迁西县土地利用信息提取研究
采用红细胞沉降率和C-反应蛋白作为假体周围感染的阈值