深度学习在遥感图像目标检测中的应用研究

2019-05-24黄金付发赵娜

无线互联科技 2019年1期

黄金付发赵娜

摘要：近年来深度学习在机器视觉领域应用非常成功，在图像的目标检测方面已经超越了人类。随着遥感技术向民用发展，遥感图像数据的研究和应用价值越来越大。文章利用深度学习的SSD卷积神经网络，对遥感图像中感兴趣的目标进行检测。遥感图像有包含信息多、目标较小且背景复杂等特点，针对遥感图像的特点，选取不同尺度的特征图进行融合，并对网络进行微调，提高检测精度。

关键词：深度学习；目标检测；遥感图像；卷积神经网络

深度学习是人工智能的重要部分，随着人工智能的发展受到世人的瞩目。神经网络是深度学习的具体表现，它是由数量众多的神经元组成的一个多层的神经网络。深度学习在机器视觉领域有广泛的应用，目标检测是机器视觉的重要研究内容。基于深度学习的目标检测技术是利用卷积神经网络[1]，自动学习检测目标的特征并对目标进行识别。在世界各大比赛和应用中证明了它在目标检测领域的强大能力。

随着遥感技术的发展，它从军事领域发展到民用领域。在城市规划、资源调查、环境监测等方面有着很大的发挥空间。遥感图像有着尺寸大、背景复杂、目标多且小等特点，在遥感图像中进行目标检测有着很多难度。为此，本文采用的经典的卷积神经网络[2]（Single Shot MultiBox Detector，SSD），相比其他基于神经网络的目标检测算法，具有速度快、准确性高、鲁棒性强等特点。但对小目标的检测不足，应用在遥感图像上的效果不好，本文对此网络作出改进以适应其在遥感图像上的应用。实验结果表明，调整后的网络检测效果不错，平均检测精度（mean Average Precision，mAP）达到0.819。

1 理论方法

SSD是一个单次深度神经网络，结合Faster-RCNN[3]和YOLO[4]的优点，使用单一的网络结构，并对整张图进行特征提取，和区域网络结构不同（没有类似RPN的额外网络结构）。最终的检测性能却超越了它们，以300×300的输入在VOC2007数据测试中，以59Fps的速度达到74.3%的 mAP。

SSD模型：SSD网络由前后两部分构成。前面是用于特征提取的卷积神经网络，我们称它为基础网络，后面部分是尺寸大小逐渐减小的卷积层，称它为额外网络。网络结构如图1所示。

SSD的输入是300×300×3的图像。基础网络使用截断的VGG[5]网络，对目标图像进行初步的特征提取。额外网络以基础网络的输出作为输入且尺寸逐渐减小，最后选取不同尺寸的特征图进行预测。在训练过程中，SSD算法会对默认框和真实框进行匹配，选取Jaccard值最大或者Jaccard值大于0.5的默认框。SSD在检测时会产生大量的默认框，为了消除重复没用的默认框，使用了非极大值抑制算法。

2 实验过程

2.1 实验数据和平台

本次实验的数据集总共有1 510张高分辨率遥感图像，分为汽车和飞机两类，汽车510张，飞机1 000张。把数据按训练集、验证集、测试集分为三大块，各占比例为70%，10%，20%。具体划分如表1所示。

相比于普通的图片，遥感图片尺寸较大，所包含的信息较多，目标在图像中占比较小，属于小目标，如图2所示。

实验配置：kears框架，后端为Tensorflow，显卡为NAVIDA tesla k20，内存为32 G，处理器：Genuine Intel（R）CPU 2.40 GHz，操作系统为Ubuntu16.04。

2.2 实验过程与结果

SSD卷积神经网络由基础网络和额外网络组成。在本次实验中，使用截断的VGG16作为基础网络用于对图像进行初步的特征提取。VGG16卷积神经网络是一个经典的网络，网络结构简单，卷积核大小是固定的3×3。额外网络是一个尺度不断变小的卷积神经网络，在基础网络产生的特征图上进行特征提取。

在卷积神经网络模型中，不同尺度上的特征图所表示的感受野不同，靠近底部的特征层提取的是局部、通用的特征，例如边缘、颜色、纹理等特征；而靠近顶部的特征图提取的是抽象的特征，所包含的细节信息少，对小目标的检测效果不足。为了提高检测率，我们抽取不同层的特征进行特征融合用于最后的检测。表2展示了抽取的特征层的输出尺度和连接该层的上一层。每一层提取的特征图尺寸大小不同、逐步减小，从底层具体的特征到高层抽象的特征都包含在内，适应不同尺度的目标以提高准确率。

本文对SSD的损失函数进行调整，默认损失函数的α=1，定位损失和置信损失在最后的总损失占比相同。提高定位损失在总损失中的占比，侧重卷积神经网络的目标位置提取。相应，我们降低Jaccard值，提高小目标的检测率。经过调整，我们使用mAP来对模型进行评估。实验结果如表3所示。

从表3可以看出，飞机的精度高于汽车，原因是在遥感图像中飞机相比汽车目标要大，在图像中属于易区分的目标。汽车在图像中占比很小，且与周边环境相似度高不易区分，给检测增加了难度。图3展示了两张不同类别的检测结果，左边是飞机、右边是汽车。可以看出置信度较低，是因为在训练期间调整了损失函数。

3 结语

本文主要探究深度学习中的SSD卷积神经网络在遥感图像上的应用。对遥感图像中的汽车和飞机两类进行检测，平均准确率为81.9%。结果表明，深度学习在遥感图像上的应用具有可行性且效果不错。由于训练的图片尺寸较大，与SSD网络输入大小相差太大，在特征提取的时候会把一些小特征忽略，使遥感图像中的小目标不易被检测到。以后的工作可以针对小目标进行，对遥感图像进行预处理并且调整网络结构，提升小目标检测率。

[参考文献]

[1]KRIZHEVSKY A，SUTSKEVER I，HINTON G E.ImageNet classification with deep convolutional neural networks[C].Vancouver：International Conference on Neural Information Processing Systems，2012：1097-1105.

[2]LIU W，ANGUELOV D，ERHAN D，et al.SSD： single shot multibox detector[C].Cham：European Conference on Computer Vision，2016：21-37.

[3]REN S，HE K，GIRSHICK R，et al.Faster R-CNN： towards real-time object detection with region proposal networks[C].Turkey：International Conference on Neural Information Processing Systems，2015：91-99.

[4]REDMON J，DIVVALA S，GIRSHICK R，et al.You only look once： unified，real-time object detection[C].Las Vegas：Computer Vision and Pattern Recognition，2016：779-788.

[5]SIMONYAN K，ZISSERMAN A.Very deep convolutional networks for large-scale image recognition[J].International Journal of Computer Vision，2014（3）：211-252.

[6]周敏，史振威，丁火平.遙感图像飞机目标分类的卷积神经网络方法[J].中国图象图形学报，2017（5）：702-708.

猜你喜欢

深度学习在遥感图像目标检测中的应用研究

猜你喜欢

杂志排行

无线互联科技的其它文章