APP下载

一种自动特征提取的SAR图像水华识别方法

2021-06-29戚雯雯孙梦伟徐冰冰

计算机时代 2021年4期

戚雯雯 孙梦伟 徐冰冰

摘  要: 针对SAR图像水华识别中人工提取特征效率低的问题,提出了一种自动特征提取识别方法。该方法应用改进的K-means算法提取SAR图像暗斑,利用数据增强算法扩充暗斑图像集,并基于对水华暗斑图像特征的深入分析对DenseNet网络结构进行改进,以实现对水华暗斑与非水华暗斑更有效地识别区分。以太湖数据集作为实验数据,该方法获得了87.30%的总体精度,这一结果表明自动特征提取识别方法对于SAR图像水华识别的有效性。

关键词: 水华识别; SAR图像; 改进的DenseNet; 自动特征提取; SAR信息提取

中图分类号:TP751          文献标识码:A     文章编号:1006-8228(2021)04-60-05

Abstract: To solve the low efficiency of manual feature extraction in the Synthetic Aperture Radar (SAR) image algae bloom discrimination, an automatic feature extraction and recognition method is proposed. This method uses an improved K-means algorithm to extract dark spots in SAR images and uses a data enhancement algorithm to expand the dark spot image set. Based on the in-depth analysis of the image features of algae bloom dark spots, the DenseNet network structure is improved to achieve the discrimination of algae bloom and non-algae bloom dark spots more effectively. The method obtained an overall accuracy of 87.30% using the Taihu Lake dataset as the experimental data. This result shows the effectiveness of the automatic feature extraction and recognition method for algae bloom discrimination in SAR images.

Key words: algae bloom discrimination; SAR image; improved DenseNet; automatic feature extraction; SAR information extraction

0 引言

水華是湖泊富营养化,水体中藻类大量繁殖生长而导致的水体污染现象[1]。传统的水华监测识别方法通常为实地采样和布点,费时费力,难以准确地反映水华的空间分布情况。随着科技的发展,卫星遥感技术在环境监测领域发挥着越来越重要的作用。合成孔径雷达(Synthetic Aperture Radar, SAR)是一种主动式的微波成像传感器,在多云多雨的天气下也能进行有效的对地观测。由于其不可替代的优势,SAR图像已成为水环境遥感监测应用中重要的数据来源。

水华在湖面上通常以绿色油膜状物质存在[2]。油膜状物质对水面波纹起平滑作用,当SAR发射的电磁波入射到水面时,会大幅降低SAR接收到的后向散射回波信号,因此水华区域在SAR图像中以低灰度的暗斑形式呈现。但是,当水面处于低风速(小于3.2m/s)状态时[3],同样会形成类似于水华的暗斑区域。区分SAR图像中不同类型的“暗斑”,存在着诸多技术挑战。目前,国内外SAR图像水华识别研究还处于起步阶段。文献[4]提出了一种基于支持向量机(Support Vector Machines, SVM)的SAR图像水华识别方法,得到了74.32%的总体识别精度。该文献的成果表明,仅使用SAR图像进行水华识别是具有可行性的。鉴于水面油膜在SAR图像中与水华具有较高的相似性,在目前水华识别研究较少的情况下,溢油识别的相关方法具有很好的借鉴价值。近年来,许多研究人员多次将深度学习引入了溢油识别中,并取得了卓越的表现。2018年,文献[5]将卷积神经网络(Convolutional Neural Network, CNN)应用于SAR图像溢油识别,准确率达到了91.33%。2020年,文献[6]提出了一种深卷积神经网络(Deep Convolutional Neural Network, DCNN),对溢油的识别准确率达到了94.01%。由此可见,深度学习技术可以提取油膜的潜在特征,对于溢油检测的精度提升起了关键作用。

本文提出了一种基于改进DenseNet网络的SAR图像水华识别方法(Algal bloom Discrimination method based on Improved DenseNet structure SAR image, ADID-SAR)。该方法在应用改进K-means方法获取SAR图像暗斑样本集的基础上,利用数据增强算法扩充样本集,使其满足自动特征提取方法的需求,并通过对水华图像特征的深入分析,改进优化传统的DenseNet网络结构。该方法能够自动提取更深层次的暗斑特征,识别暗斑属性,降低非水华对识别结果的影响。

1 研究区域与数据

本文以太湖为研究区域,太湖位于江苏省无锡市,是我国五大淡水湖之一,其水质质量与苏州、湖州、无锡以及宜兴市等周边城市的农业灌溉、水产养殖等生产活动密切相关。自20世纪80年代后期,太湖水体开始出现富营养化现象,2007年太湖爆发了严重的蓝藻水华污染事件[7]。因此,本文选取太湖作为研究区域,区域位置及其SAR图像如图1所示。

2 ADID-SAR方法

ADID-SAR方法包括图像预处理、暗斑提取、数据增强、识别器训练,以及水华识别等步骤,总体框架如图2所示。

当物体以不同的径向速度和距离与雷达之间存在相对运动时,会导致雷达获取的目标后向散射系数存在一定的误差。存在的误差在SAR图像中以斑点噪声的现象呈现,所以需对原始SAR图像进行预处理操作,预处理步骤包括辐射校正、斑点滤波、几何校正以及图像拉伸等操作。通过以上处理,可以在一定程度上减少SAR图像中相干斑噪声的影响,有利于后续各环节的顺利开展。

2.1 暗斑提取

预处理后的SAR图像如图3所示。在预处理基础上,使用分割算法对暗斑区域图像块进行分割处理。以图3中暗斑区域A为例,其暗斑提取处理过程如图4所示。图4(a)为裁剪后的SAR暗斑图像,选用改进的K-means算法[4]对其进行分割处理。该过程以K-means为基础,使用多阈值Otsu算法获取的阈值集合作为聚类中心,解决了聚类数目K难以确定的问题,有效避免了聚类算法因为孤立点而陷入局部最优值。图4(b)为分割后的二值图,此时的分割结果存在边缘噪声和零碎干扰区域。为较好地消除以上干扰,采用自定生长中心的区域生长算法进行精分割处理,完成对暗斑块的提取,提取结果如图4(c)所示。

水华暗斑和非水华暗斑在灰度值上是相近的,但两类暗斑在区域边界灰度变化上存在差异,其中水华暗斑灰度呈现跃迁趋势,而非水华暗斑则比较平缓。根据光学图像目视对照,并结合气象条件完成对样本的标签添加。

2.2 数据增强

由于SAR暗斑样本集的规模偏小,不能满足后续处理中网络应用的需求,为了增加训练数据的数量,可以采用旋转、翻转等数据增强方法。其中,旋转操作是随机将图像旋转一定的角度,翻转操作是按照图像左右和上下的两个对称轴分别进行翻转[8]。图5以太湖区域SAR图像中一处暗斑为例,展示了使用数据增强方法所获取的结果。分别将图像样本按照顺时针的顺序进行90°、180°和270°旋转和翻转处理,通过这些操作,暗斑图像的集合增加至原来的6倍,完成暗斑样本集的扩充。

2.3 基于改进DenseNet网络的识别器构建

深度学习具有自动特征提取的能力,可有效避免人工特征选择方法中特征提取效率低的问题。DenseNet网络是近年来卷积神经网络结构发展中的关键结构,其最大优势在于优化梯度流,实现了资源的最大化利用和计算量的压缩。DenseNet模型的网络结构主要由Transition Layer和DenseBlock组成。图6是一个增长率k=4的DenseBlock结构,每个层都会将前面所有层的输出作为其额外输入,即该网络结构中所有层都是互相连接的。这种密集的连接机制使得网络参数更少,最大化地实现不同层之间的信息交互,充分利用输入图像的原始信息。

纹理是遥感图像的重要特征,尤其在单波段、单极化的SAR图像中,其作用更为显著。因水华暗斑和非水华暗斑的成因不同,使得这两类暗斑在纹理上存在差异,其中水华暗斑的纹理比较细腻平滑,非水华暗斑比较粗糙分散。为了加强自动特征提取过程中暗斑纹理特征的特点,本文在ADID-SAR识别中对DenseNet网络的池化操作进行了改進,用最大池化替代了平均池化。相较于平均池化,最大池化可以更好地保留图像中的纹理特征。该结构使用的暗斑图像样本集的尺寸为224?224?3,随机排列,以确保每张图像被选中的概率都是相同的。首先将若干个样本输入到一个卷积核大小为7?7的卷积层和窗口大小为3?3的最大池化层,通过特征提取与降维后,将获取到的特征图输入到DenseBlock和Transition Layer中,进行各层特征的提取与融合。其中,Transition Layer结构包括一个卷积核大小为1?1的卷积层和池化窗口大小为2?2的最大池化层。最后,将特征图输入到分类层,该分类层由全局平均池化(Global Average Pooling, GAP)层,完全连接层和softmax分类器组成。通过GAP对获取到的特征图进行降维,经linear特征约束后,使用Softmax分类器识别获取到的特征,区分暗斑为水华暗斑还是非水华暗斑。

ADID-SAR方法中使用的网络结构具体参数设置如表1所示,输入样本经卷积与池化操作后得到的特征图尺寸大小为56?56,然后经过4个DenseBlock和3个Transition Layer结构后获得的特征图尺寸大小为7?7,最后经GAP操作降维后获得尺寸大小为1?1的特征图,用以水华的分类识别。ADID-SAR方法中的网络结构由于其密集连接方式,可以捕捉到输入图像中细微的差异,具有强大的特征学习和表示能力,而且最大池化能很好的保留图像的纹理特征,提高SAR图像识别的准确性。

3 实验结果与分析

3.1 评判标准

为了定量评估本文方法的性能,采用以下几个指标进行评价。

⑴ 精确率(Precision,P):对预测样本的表示,是水华样本预测正确的比例。

⑵ 召回率(Recall,R):对真实样本的表示,是水华样本预测正确的样本数与所有水华样本数的比值。

⑶ F1值:F1值是P和R的一种调和平均数,当F1值较高时则能说明方法比较有效。

⑷ 准确率(Accuracy,A):样本被正确识别的个数与总个数的比值。

⑸ Kappa系数:Kappa系数越高,说明一致性越好。

式⑸中,A表示准确率,其计算公式如⑷所示,[Pe]的计算公式如⑹所示。在上述公式中,TP表示预测正确的水华样本,FN表示预测错误的水华样本,FP表示预测错误的非水华样本,TN表示预测正确的非水华样本。

3.2 结果与分析

实验收集了覆盖太湖的27景Sentinel-1A SAR图像,经预处理、裁剪以及分割后,获得129个暗斑,与同时间段光学图像和气象水文资料对比确认,其中水华暗斑72个,非水华暗斑57个。本文ADID-SAR方法验证结果如表2所示,使用该方法预测为水华的精确率P为87.00%,预测为非水华的精确率P为88.04%,暗斑识别总体精度A为87.30%,F1值为87.52%,Kappa系数为0.86。结果表明ADID-SAR方法可以从数据集中提取出丰富的基本特征,增强了特征挖掘能力,具有明显的优势。

在SAR图像目标识别中,人工提取特征结合SVM分类是较为常用的识别方法。同时,随着深度学习技术的发展,InceptionV3网络由于其模型的多样性,在多数领域展示了出色的性能。为了进一步验证本文方法的有效性,将ADID-SAR方法与这两种典型方法进行对比实验,识别结果如表3所示。

方法1是文献[4]中提出的基于人工提取特征并以SVM为识别分类器的水华识别方法。方法2是改进的InceptionV3网络用以自动提取特征的水华识别方法。方法3是本文提出的ADID-SAR方法。由表3可以看出,方法2和方法3的总体识别精度都达到了85%以上,这说明自动提取特征的深度学习网络对于SAR图像水华识别性能改善具有积极作用。而本文所提ADID-SAR方法的识别精度最高,达到了87.30%,F1值和Kappa系数也都明显高于其他两种方法。这表明了ADID-SAR可以有效地利用提取到的特征,给出更平滑的决策边界,提高参数效率并减少过度拟合,同时,该识别方法网络结构的密集连接方式具有正则化效应,更适用于小数据集的识别过程。

4 结束语

特征提取是水华識别的关键步骤,本文针对SAR图像水华识别领域中人工提取特征效率低、易受人为因素影响且难以获得图像数据深层特征的问题,提出了一种基于自动特征提取的SAR图像水华识别方法——ADID-SAR。该方法可以自动提取水华暗斑图像中的特征并完成对暗斑的识别,融合了多层特征图,增强了特征传播和特征重用性。实验结果表明,本文所提方法在水华识别精度方面有了明显的提升,总体精度达到了87.30%,相比同类算法,其识别性能明显优于其他模型。该方法的实验结果还证明了深度学习方法在SAR图像水华识别中的有效性和发展潜力,这为水环境污染防控与治理提供了有价值的参考,具有一定的应用前景。

参考文献(References):

[1] Guo L. Ecology: doing battle with the green monster of Taihu Lake[J].Science,2007.317(5842): 1166-1166

[2] 于洋,彭福利,孙聪.典型湖泊水华特征及相关影响因素分析[J].中国环境监测,2017.33(2):88-94

[3] 白晓华,胡维平,胡志新等.2004年夏季太湖梅梁湾席状漂浮水华风力漂移入湾量计算[J].环境科学, 2005.6:59-62

[4] Wu L, Wang L, Min L,et al. Discrimination of algal-bloom using spaceborne SAR observations of great lakes in China[J]. Remote Sensing,2018.10(5):767

[5] 吴丹妮.基于PolSAR海面溢油和类似溢油区的分类研究[D].大连海事大学,2018.

[6] Zeng K, Wang Y. A deep convolutional neural network for oil spill detection from spaceborne SAR images[J]. Remote Sensing, 2020, 12(6): 1015.

[7] 杨柳燕,杨欣妍,任丽曼等.太湖蓝藻水华暴发机制与控制对策[J].湖泊科学,2019.31(1):18-27

[8] 苏浩.基于深度学习的遥感图像目标检测方法[D].电子科技大学,2020.