APP下载

一种基于DexiNed改进的红外图像边缘检测算法

2021-10-08刘伯运

红外技术 2021年9期
关键词:红外边缘损失

何 谦,刘伯运

(海军工程大学动力工程学院,湖北 武汉 430033)

0 引言

红外成像技术根据辐射原理得到红外图像,像素亮度表征了物体表面的温度。由于具有隐蔽性好、可全天候工作、可穿透烟雾等优良特性,红外成像技术在军用和民用领域都得到了广泛应用。受制于红外图像的成像机理、成像系统特性和各种外界噪声的影响,红外图像通常具有分辨率低、对比度差和边缘模糊等特点。

边缘特征在红外图像处理中极为重要,是目标检测、跟踪和识别的基础。为满足人们对红外图像进一步分析和识别的需求,红外图像边缘检测技术体现出了较大难度和重要意义。相比于可见光图像边缘检测,红外图像边缘检测发展较晚,相关研究也较少,且大多都是根据可见光图像边缘检测方法改进而来,而红外图像与可见光图像的边缘检测任务存在很大不同,相比于可见光图像,红外图像的特点主要有:无立体感、空间分辨率低、对比度低和边缘模糊、非均匀性、信噪比低,等等。

近十年来,一些研究者针对红外图像边缘检测问题提出了解决方法,如基于边缘检测算子改进的方法[1-4]、基于蚁群算法的方法[5-6]、基于数学形态学的方法[7-8],这些方法的本质都是只考虑红外图像局部的急剧变化,尤其是亮度、梯度的变化,以此来检测边缘,但这些低层次特征难以反映较为复杂的场景。因此,虽然这些算法取得了较大的发展,却始终存在一定限制,而打破这一限制的重要方向就是加入高层次的语义信息。

近年来,随着深度学习技术的快速发展,大量研究[9-14]表明,卷积神经网络(Convolutional Neural Network,CNN)具有强大的分层特征学习能力,并在自然图像边缘检测中超过了人类视觉水平[11-14]。因此,有研究者开始尝试将深度CNN应用到红外图像边缘检测中。文献[15]将改进的HED(Holistically-Nested EdgeDetection)[10]网络与匹配滤波对红外图像处理的结果进行融合以提取边缘,但该方法处理较为复杂,没有发挥出深度CNN 端到端的优势,且受限于HED网络的性能,检测效果不太理想。

将深度学习技术应用于红外图像边缘检测也面临着较大的问题。在自然图像边缘检测任务中,我们可以利用多个公开数据集训练和评估模型[16-21],但目前暂时没有可以用于红外图像边缘检测的公开数据集。

总的来说,相比于自然图像,红外图像的诸多缺点大大增加了边缘检测任务的难度,无数据集可用的现状使得任务更加艰巨。为此,本文提出了一种基于深度学习的红外图像边缘检测算法,在DexiNed[14]的基础上,缩减了网络规模,并在损失函数中引入了图像级的差异,精心设计了函数参数,进而优化了网络性能。此外,还通过调整可见光图像边缘检测数据集来近似模拟红外图像边缘检测数据集,对改进后的模型进行训练,进一步提高了网络对红外图像中边缘信息的提取能力。

1 边缘检测方法

本文主要涉及红外图像边缘检测方法和基于深度学习的图像边缘检测方法,下面分别对其进行简要介绍。

1.1 红外图像边缘检测方法

作为图像边缘检测领域的一个分支,有关红外图像的边缘检测方法研究较少,绝大多数都是基于传统的可见光图像边缘检测技术改进而来,根据图像的低层次特征提取边缘信息。这些方法主要可分为3类:一是基于边缘检测算子改进的方法[1-4],大多是结合各种去噪技术对图像进行预处理,然后采用边缘检测算子提取边缘,最后结合边缘连接等图像后处理技术优化结果,此类方法结构简单、处理速度快,但处理结果往往不符合人眼视觉,较为生硬;二是基于蚁群算法的方法[5-6],通过蚁群搜索最优路径的方式寻找边缘区域,具有较强的鲁棒性、优良的分布式计算和一定的抗干扰能力,然而,受制于蚁群算法本身计算量大、收敛速度慢、易过早陷入局部最优和参数设置带有明显经验性的特点,此类算法在处理效率和自适应性上还有待于后续研究的不断改进;三是基于数学形态学的方法[7-8],需要针对具体问题,精心设计结构元素和运算方法,以在抑噪和检测精度之间达到良好的平衡。

1.2 基于深度学习的图像边缘检测

近年来,CNN得到了快速发展和广泛应用,得益于其强大的特征提取能力,CNN 在图像边缘检测领域表现出了优异的性能。图1对比展示了传统的和基于深度学习的图像边缘检测算法用于红外图像的边缘提取结果。

图1 几种图像边缘检测方法提取红外图像边缘的效果对比:(a)红外图像(来源于FLIR 红外数据集);(b)Canny算子的边缘检测结果;(c)BDCN[12]的边缘检测结果;(d)本文方法的边缘检测结果Fig.1 Comparison of severalimage edge detection methodsto extract infrared image edge:(a)isanexampleinfrared image from FLIR Thermal Dataset (www.flir.com);(b)is theresultof the Cannyedge detector;(c)isthe result of BDCN[12];(d)is theresult of our method

DeepEdge[9]提取边缘候选点周围的多个图像块,并将这些图像块输入多尺度CNN 以确定其是否为边缘像素。HED[10],即 Holistically-Nested Edge Detection,Holistically 表示该算法试图训练一个端到端的网络,Nested 则强调在生成的输出过程中通过不断地集成和学习得到更精确的边缘预测图的过程。RCF[11](Richer Convolutional Features)提出了一种基于丰富卷积特征的精确边缘检测算法。BDCN[12](Bi-Directional Cascade Network)提出了一种双向级联网络结构,在该结构中,单个层由其特定尺度上的标记边进行监督,而不是直接对不同的层应用相同的监督。LPCB[13](Learning to Predict Crisp Boundaries)提出了一种新的边缘检测方法,该方法能有效地对不平衡数据进行分类,并使网络能够产生清晰的边界。DexiNed[14]可以生成适于人眼视觉的细化边缘图像,并且无需事先训练或微调,就可以在任意边缘检测任务中使用。以上网络几乎都采用VGG[22](Visual Geometry Group)作为其主干。

2 本文方法

本文采用了基于深度学习的红外图像边缘检测方法,选用了目前自然图像边缘检测领域性能最好的网络模型,并在此基础上进行了相应优化,精心构造了损失函数,并制作了近似的红外图像边缘检测数据集以微调网络,进一步提升了神经网络提取红外图像边缘信息的性能。

2.1 网络结构

选用DexiNed[14]作为红外图像边缘检测网络结构的基础并加以改进。作为目前最先进的边缘检测网络模型之一,文献[14]声称其不需要事先训练和微调就能直接用于任意边缘检测任务。

DexiNed 的结构如图2所示,它由6 个主块组成,每个主块输出特征映射,使用一个上采样块生成中间边缘映射。所有由上采样块产生的边缘映射被连接起来,以馈送网络末端的学习滤波器堆栈,并产生融合的边缘映射。DexiNed 具有优异性能的原因主要在于其具有密集的网络层和层与层之间有效的联接。此外,上采样块也起着重要的作用,它由条件叠加子块组成。每个子块有两层,即卷积层和反卷积层。本文也尝试使用其他更为简单的上采样方法,例如双线性采样和depth-to-space(由Tensorflow 提供),发现其效果远不如该上采样块。

然而,DexiNed 在拥有良好的性能的同时也牺牲了模型的容量,它包含了35.2M 可训练参数,相较于BDCN 为16.3M,RCF 为14.8M,其规模显得较为庞大。DexiNed 网络具有6 个主块,其预测结果为6 个主块输出结果的融合或平均。在训练和测试时,总是发现其第五和第六个主块的输出结果非常相似。据此猜想,第六个主块输出的有无对最终融合结果的影响并不是决定性的(验证见3.2 节)。因此,为精简网络结构、减小网络容量,只保留了5 个主块,将参数减少至30.4M,相比于原网络容量缩减了13.6%,改进后的网络结构如图2的虚线框中所示。

图2 DexiNed 网络结构和精简后的网络(位于虚线框中)Fig.2 Network architecture of DexiNed[14] and simplified one(in dotted box)

2.2 损失函数

在其他条件不变的情况下,网络的精简或多或少都会造成其性能的下降。而在训练过程中,损失函数是最为重要的环节之一,因此,本文对DexiNed[14]原有的损失函数进行了改进。

DexiNed[14]使用的损失函数为加权交叉熵损失(weighted cross-entropy loss),它是每个对应像素对之间的预测和真值的差异的加权总和,主要显示了像素级的差异。为了获得更好的性能,在损失函数中引入了图像级的差异,与LPCB[13]相同,使用Dice 系数来度量预测P和真值G之间的差异。

Dice 系数是一种集合相似度的度量函数,通常用于计算两个样本的相似度。采用Dice 系数计算的损失为:

式中:pi和gi分别表示预测P和真值G中的第i个像素值。

最终的损失函数为交叉熵损失(cross-entropy loss)和Dice 损失的结合:

另外,有一个细节需要说明:在计算交叉熵损失时,将网络第五个主块输出结果的交叉熵损失乘以2,以近似表示叠加原网络第六个主块的交叉熵损失,这样做有效地改善了精简后网络的训练效果(分别训练1 个epoch 后,相比于去掉第六个主块而不改变损失函数的网络,仅将损失函数中的第五个主块的损失乘以2,就能将loss 降低21.4%、accuracy 提升2.5%)。

2.3 模拟红外图像边缘检测数据集

在前文中,已对红外图像边缘检测的难点进行了分析,红外图像与自然图像存在的显著区别,意味着红外图像边缘检测任务的难度要远大于自然图像。考虑到目前没有公开的红外图像边缘检测数据集,本文认为有必要建立红外图像边缘检测数据集,进一步地训练网络,提升其对于红外图像的边缘提取能力。

利用现有的自然图像边缘检测数据集,可以在自然图像的基础上模拟相应的红外图像,以此来建立近似的红外图像边缘检测数据集。要想通过自然图像较为准确的模拟红外图像,则必须在原始景物红外辐射分布的基础上,从时间、空间、光谱和辐射量等方面进行[23],这并非本文研究的重点,且实现起来比较复杂。

针对红外图像的特点,提出了一种较为简单的方法来近似模拟红外成像的视觉效果:首先将自然图像灰度化,然后降低对比度,接着添加高斯噪声,最后得到近似模拟的红外图像,如图3所示。结合这种方法,基于BIPED[14]数据集建立了近似的红外图像边缘检测数据集。BIPED[14]数据集包含了250 幅分辨率为1280×720 的户外图像,通过裁剪、旋转、翻转等操作,得到增强后的数据集,再通过图3方法进行处理,最终得到的模拟红外图像边缘检测数据集中包含72000 个模拟红外图像与边缘真值图像对,称该数据集为IR-BIPED。

图3 可见光图像转变为模拟红外图像的过程Fig.3 The process of transforming an optical image into a simulated infrared image

3 实验

3.1 与DexiNed 的性能对比

首先,需要知道本文所做的一系列工作,相比于其基础——DexiNed,是否在提取红外图像边缘的效果上获得了提升。

前文中提到,文献[14]声称DexiNed 不需要事先训练和微调就能直接用于任意边缘检测任务。因此,先将[14]中训练好的DexiNed(在BIPED 数据集上训练了24 个轮次)直接用于红外图像边缘检测,得到结果1。在本文方法中,将改进后的模型加载训练好的DexiNed 部分权重后,在IR-BIPED 数据集上继续训练3 个轮次,测试得到结果2。公平起见,同样将训练好的DexiNed 继续在IR-BIPED 数据集上微调3个轮次,测试得到结果3。测试结果1~3 对比如图4所示,其中的红外图像来源于FLIR 红外数据集。

由图4可见,3个结果比较相似,但结果2提取得到的红外图像边缘最为清晰、细节最为丰富。根据结果2,我们能够清楚地分辨各景物,总体来说其视觉效果最好。这里需要强调,本文方法中使用的网络容量较DexiNed 缩减了13.6%,这意味着本文方法较DexiNed 使用更少的资源,却取得了更好的红外图像边缘检测效果。

图4 测试结果对比Fig.4 Comparison of test results

此外,将结果3与结果1对比,可见经过3个轮次的微调后,DexiNed 提取的红外图像边缘明显更细,这也反映出IR-BIPED数据集对提升红外图像边缘检测效果起到了一定的作用,下节将进一步研究该数据集的影响。

3.2 消融实验

下面通过实验来验证本文方法各组成部分的有效性。

在3.1节中,已经验证本文方法相对于DexiNed[14]的改进既减小了网络容量,又改善了红外图像的边缘检测效果。在本节中,将分别研究网络容量的缩减、损失函数的设计和模拟红外数据集各带来了怎样的影响。

网络容量的缩减。通过去除DexiNed[14]网络的最后一个主块来精简网络,将网络容量缩减了13.6%。显然,在此过程中损失了部分边缘信息。为了量化容量缩减给边缘检测性能带来的影响,将基础网络(baseline)和精简后的网络(simplified)在相同条件下各自从头开始训练3个轮次,发现两者的边缘检测准确度变化如表1所示。由此可见,经过3个轮次的训练后,精简后的网络与原网络准确度差别不大,甚至有轻微程度的提升。

表1 网络准确度对比1Table 1 Comparison of network accuracy-1

精心设计的损失函数。网络结构的精简势必会造成部分信息的损失,自然地,我们想到通过改进损失函数来提升性能。在精简后的网络模型中应用3.2节所述的损失函数后,同样将原网络和精简后的网络在相同条件下各自训练3个轮次,发现两者的准确度变化如表2所示。由此可见,精心设计的损失函数有效地改善了网络的性能,相比于原网络,精简后网络的准确度提高了约2.6%,利用更少资源达到了更好的效果。

表2 网络准确度对比2Table 2 Comparison of network accuracy-2

模拟红外图像边缘检测数据集。为了检验模拟红外图像边缘检测数据集——IR-BIPED是否对提升网络提取红外图像边缘的性能有所助益,测试了在IR-BIPED数据集上训练前后的改进网络,图5展示了测试结果。其中的红外图像来源于OSU红外数据集[24]。该数据集中的红外图像背景对比度低、边缘模糊,选用这些图像进行测试,能够让结果对比更鲜明。由图5可见,训练后网络的边缘提取结果明显更加清晰,显然,IR-BIPED数据集提升了模型的抗噪性能和对红外图像的适应性。

图5 在IR-BIPED数据集上训练前后的网络测试结果对比Fig.5 Network test beforeand after training on IR-BIPEDdataset

3.3 对比评价

我们选择了文献[3]、[5]、[11]、[12]中的方法与本文方法进行对比,并进行了定性和定量评价。

3.3.1 定性结果

前述几种算法的红外图像边缘检测结果如图6所示,测试红外图像来源于Terravic Motion 红外数据集,FLIR 红外数据集和OSU红外数据集[24]。由图可见,文献[3]检测出的边缘较细、定位较准确,但受噪声影响较大,整体观感较生硬;文献[5]受噪声影响较小,但检测出的边缘不连续、定位精度低;文献[11]和文献[12]提取的边缘连续、细节较为丰富,但边缘较粗、观感较差,文献[12]的效果优于文献[11];本文方法定位精度高,检出的边缘较细,且具有较好的连续性,细节丰富、清晰,人眼观感良好。总体来说,本文方法的边缘检测效果最好。

图6 不同边缘检测方法的结果对比Fig.6 Resultsof different methods

3.3.2 定量结果

由于缺少用于评价红外图像边缘检测效果的标准数据集,这里采用了SSIM[25]和FSIM[26]两个指标来定量评价红外图像的边缘检测效果。

SSIM是一种符合人眼视觉系统特性的图像质量客观评判标准,其具体形式为:

式中:x表示原图;y表示边缘图像;μx和μy分别表示对应图像的均值;σx和σy分别表示对应图像的方差;σxy表示x和y的协方差。SSIM衡量了两幅图像的相似度,其取值范围为[0,1],其值越大表示边缘检测效果越好。

FSIM 映射特征并测量两个图像之间的相似性。因为人类视觉系统(human visual system,HVS)是基于一些低层次特征来感知图像的,而相位一致性特征(phase congruency,PC)可以很好地刻画局部结构。同时由于PC 对于图像的变化具有相对不变性,这有利于提取图像中稳定的特征,但是有时图像的变化确实会影响观感,所以需要使用梯度幅值(gradient magnitude,GM)来弥补。FSIM 中使用了PC 和GM两个特征互为补充。FSIM 的计算较为繁琐,这里不再列出。FSIM 值越大表示边缘检测效果越好。

图7~10展示了图像1~4边缘检测效果的定量结果。由图可见,仅在图7中,本文方法的SSIM 和FSIM 值略低于文献[5]的方法,其余表现均明显优于其他方法。此外,综合来看,文献[11]和文献[12]的表现优于文献[3]和文献[5],这也在一定程度上表明了基于深度学习的方法相对于传统方法的优越性。

图7 不同方法在图像1 上测试后的定量结果对比Fig.7 Comparison of quantitative results of different methods on image1

图8 不同方法在图像2 上测试后的定量结果对比Fig.8 Comparison of quantitative results of different methods on image2

图9 不同方法在图像3 上测试后的定量结果对比Fig.9 Comparison of quantitative results of different methods on image3

图10 不同方法在图像4 上测试后的定量结果对比Fig.10 Comparison of quantitative results of different methods on image4

4 总结

本文研究了现有的各类红外图像边缘检测方法,并分析了红外图像边缘检测的难点和挑战,提出了一种基于深度学习的红外图像边缘检测方法,在DexiNed 的基础上,对网络结构和损失函数进行改进,缩减了网络规模、优化了网络性能;此外,还通过调整自然图像边缘检测数据集来近似模拟红外图像边缘检测数据集进行训练,进一步提高了网络对红外图像中边缘信息的提取能力。通过实验,我们验证了本文对于DexiNed 所做的一系列改进的有效性,并证明了本文方法相比于其他方法的优越性。

为将本文方法应用到实际生产和生活中,后续将研究算法的嵌入式实现,提升计算效率,以实现实时的红外图像边缘检测。

猜你喜欢

红外边缘损失
网红外卖
胖胖损失了多少元
闪亮的中国红外『芯』
8路红外遥控电路
TS系列红外传感器在嵌入式控制系统中的应用
玉米抽穗前倒伏怎么办?怎么减少损失?
一张图看懂边缘计算
菜烧好了应该尽量马上吃
损失
在边缘寻找自我