APP下载

基于深度学习的高分遥感影像典型地物检测方法应用实践

2021-07-02孙广伟李博陈嘉浩张大富范俊甫

关键词:高分辨率精度神经网络

孙广伟,李博,陈嘉浩,张大富,范俊甫

(山东理工大学 建筑工程学院,山东 淄博 255049)

高分辨率遥感影像能够精细地表达丰富的地表信息,在自然资源普查、农作物估产、生态环境评价、气候变化分析、人类活动监测等领域具有巨大的应用潜力和发展前景,被广泛应用于国民经济建设的各个行业[1]。高分辨率遥感影像包含多种多样的复杂地物信息,传统的地物信息提取往往依靠大量的人工参与实现,费时费力且效率低下,成本昂贵。2006年,多伦多大学的Hinton等[2]提出了深度学习的概念。随着相关理论与模型的深入发展,基于深度学习的人工智能技术逐渐在机器人、语音识别、图像识别、自然语言处理和专家系统等领域得到了深入研究和广泛应用[3-4]。

深度学习模型需要建立包含大量样本的训练数据才能获得更好的计算效果。高分辨率遥感影像不仅具有庞大的数据量,同时也蕴含着丰富的地物信息,能够满足建立深度学习训练数据集的需要。2010年,Mnih等[5]首次将深度学习技术应用于道路信息提取。此后,深度学习技术在高分辨率遥感影像的地物识别、各类信息的提取、变化检测等方面得到了深入研究。近年来,基于卷积神经网络(convolutional neural network,CNN)的深度学习技术广泛应用于自动化遥感信息提取与地物识别,已成为高分辨率遥感影像处理领域的前沿与热点之一[6]。

随着计算机软硬件技术的发展,出现了一些经典的卷积神经网络模型与算法[7]。2014年以来,基于卷积神经网络的图像目标检测算法,包括R-CNN[8], Fast R-CNN[9], Faster R-CNN[10]等的two stage算法,以及YOLO[11]、SSD[12]等的one stage算法,在通用图像识别领域已经得到了较为广泛的应用。R-CNN、Fast R-CNN、Faster R-CNN等算法先生成许多默认的先验框,再使用卷积神经网络对目标进行分类。此类算法精度较高,速度较慢,其中Faster R-CNN算法精度最高[10]。YOLO是最早出现的单阶段目标检测方法,速度较快,但检测精度较低。SSD算法在保持YOLO算法的速度优势的同时,在目标类别的确定、位置信息获取等方面表现出与Faster R-CNN算法相当的精度优势[12]。相比之前的卷积神经网络的工作方式,单次检测器SSD提高速度的根本原因是消除了先验框的推荐以及后续的像素或特征重采样阶段,并且这种改进措施不会使得识别精度下降。在高分影像目标检测领域,对上述经典模型在面向多种地物时的计算速度与检测精度的综合比较尚不多见。

国内学者在基于深度学习的遥感数据处理领域进行了较为广泛和深入的研究。刘大伟等[13]利用深度学习技术实现了基于高分辨率遥感影像的地物分类,并与SVM等一些经典方法进行了对比,发现深度学习技术可以更准确地揭示地理对象的空间分布规律。高常鑫等[14]使用分层的方法建立深度学习模型,完成了对高分辨率遥感影像的高精度分类。郝晓慧等[15]、王卓等[16]采用深度学习技术实现了基于高分辨率遥感影像的道路网提取。因此,应用深度学习模型与方法解决高分影像中典型地物的自动检测问题,对充分挖掘高分辨率遥感影像的应用价值,提升高分辨率遥感影像处理的智能化水平具有重要意义。

为对经典卷积神经网络模型在高分辨率遥感影像的多种典型地物检测过程中的特征表现进行对比,本文基于Python语言和TensorFlow深度学习框架[17],采用Faster R-CNN、YOLOv3和SSD三种基于CNN的目标检测算法,实现了模型训练和对典型地物信息的自动检测。对上述三种网络模型的性能表现进行了比较和分析,相关结论能够为基于卷积神经网络的高分辨率遥感影像目标检测应用提供一定的参考。

1 实验设计

1.1 数据集

本文选用RSOD-Dataset数据集[18-19],该数据集由武汉大学团队于2017年发布,包括含有储油罐、飞机、体育场和立交桥四类地物的高分辨率遥感影像,空间分辨率为1.7 m;其中446张影像中包含4 993架各类飞机,189张影像中包含191个体育场,176张影像中包含180座立交桥,165张影像中包含1586个储油罐目标。将该数据集按照4∶1的比例生成模型训练集与测试集,RSOD-Dataset数据集中四种地物如图1所示。

图1 四种地物的示例

1.2 实验环境

本文实验是在Windows10操作系统上进行,编程语言及版本为Python3.7,编程环境为PyCharm2019.3,使用TensorFlow深度学习框架搭建地物检测模型并对数据集进行训练,所选深度学习框架版本为TensorFlow-GPU 1.14.0。使用CUDA加速模型训练,显卡为NVIDIA GeForce GTX 1080 Ti,显存为11GB。

1.3 模型训练

使用没有先验知识的空模型,通过数据训练,机器进行自主学习,生成检测相关典型地物的最佳参数配置模型。

每一行命令代表训练中的一次迭代,每一次迭代包含已经迭代的次数(Step)、损失值(loss,即预测值与真实值之间的误差)和每次训练所用时长。在训练过程中,会根据迭代次数自动生成日志文件,根据生成的日志文件,可以选择某个迭代次数生成的日志文件导出所需模型,训练过程中,使用TensorBoard对loss值进行可视化。

2 结果分析与讨论

2.1 实验结果

将建立的模型应用到高分辨率遥感影像典型地物的检测中,并分别对四种典型地物进行实验。实验时将Faster R-CNN和YOLOv3两个算法的IOU阈值设置为0.7,SSD的IOU阈值设置为0.5。模型训练的初始学习率[20](Initial_learning_rate)设置为0.000 1;批大小(Batch Size,即每次输入到神经网络中进行训练的样本数量)设置为5,最大迭代次数设置为200 00次,迭代过程中可手动停止,下次可以根据日志文件继续进行训练。实验的地物检测结果如图2至图5所示,分别表示飞机、立交桥、体育场和储油罐。三种算法的训练损失值如图6所示。

图2飞机的检测结果显示,Faster R-CNN和SSD算法均准确地检测出了飞机的位置,且精度均在90%以上,YOLOv3算法存在误检测的情况,且有一处飞机检测精度较低。图3立交桥的检测结果显示,SSD算法检测精度最高,Faster R-CNN算法检测精度其次,YOLOv3检测精度最低,且Faster R-CNN和YOLOv3都错误地将一个目标检测成了多个目标。图4体育场检测结果显示,三种算法均准确地检测出了体育场的位置,Faster R-CNN和SSD算法的精度高于YOLOv3。图5储油罐的检测结果显示,三种算法均准确检测出了储油罐的位置,YOLOv3的检测精度略低于其他两种算法,Faster R-CNN算法存在误检测现象。图6中,SSD算法和YOLOv3算法收敛效果最好,Faster R-CNN收敛效果较差。

图2 飞机的检测结果

图3 立交桥的检测结果

图4 体育场的检测结果

图5 储油罐的检测结果

图6 三种算法的训练损失

2.2 对比与分析

三种模型在自行划分的RSOD-Dataset测试数据集上的表现结果见表1,测试硬件环境为NVIDIA GeForce GTX 1080 Ti。

表1中Batch Size(批大小)表示每次训练时输入神经网络中样本的数量;Step 表示训练迭代次数;mAP表示均值平均精度,即各类别AP的平均值;FPS表示每秒帧数,数值越大代表处理速度越快。从表中数据结合四种地物检测结果图可以看出,当批大小和训练次数都相同时,SSD算法的检测精度最高,达到了86.62%,均高于Faster R-CNN算法的78.52%和YOLOv3算法的66.81%;且SSD算法在提升精度的同时,也提高了检测速度,FPS达到了60.26,是Faster R-CNN算法检测速度的11.18倍,是YOLOv3算法的2.35倍,使用SSD图像检测算法进行典型地物检测有更高的应用价值。

表1 SSD算法与Faster R-CNN算法和YOLOv3算法的比较

2.3 影响因素分析

1)多目标以及小目标对典型地物识别的影响。由于高分辨率遥感影像包含丰富的数据、复杂的场景,在检测目标过多以及目标较小的环境中使用SSD图像检测算法进行典型地物检测会导致检测精度下降,易产生目标遗漏的情况,如图7所示。图7中大部分飞机和储油罐被准确识别标注,但是因为小目标过多,造成典型地物识别精度下降,遗漏了几个正确目标,因此需要优化初始学习率等参数进行改善。

图7 模型漏检示例

2)训练数据的数量对典型地物识别的影响。依据卷积神经网络训练模型的基本原理,训练的数据集足够大,模型的泛化能力将会得到较大提升,对未知数据的预测效果更好[21]。

3)参数优化对典型地物识别的影响。通过调整训练迭代的次数,修改初始学习率和批大小等参数,逐渐优化模型,可降低模型的损失值。

3 结束语

目前用于遥感影像典型地物检测的算法,难以兼顾处理速度和检测精度。针对这一问题,本文提出基于高分辨率遥感影像和深度学习的目标检测算法技术,将高分辨率遥感影像的典型地物检测与卷积神经网络技术相结合,实现了对遥感影像中典型地物信息的自动提取,实验结果表明本方法有效的提高了高分辨率遥感影像中典型地物检测的处理速度和检测精度。将SSD算法、YOLOv3算法与Faster R-CNN算法进行对比,实验证明SSD算法在地物检测上的表现优于其他两种检测算法,在mAP指标上比Faster R-CNN算法和YOLOv3算法分别高出了8.1%和19.81%,检测速度分别是Faster R-CNN算法和YOLOv3算法的11.18倍和2.35倍。本方法只在光学遥感影像上进行实验,未考虑其他类型的影像数据,未来将考虑多源数据融合进行相关实验。

猜你喜欢

高分辨率精度神经网络
基于递归模糊神经网络的风电平滑控制策略
热连轧机组粗轧机精度控制
探讨高分辨率CT在肺部小结节诊断中的应用价值
高分辨率合成孔径雷达图像解译系统
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
基于DSPIC33F微处理器的采集精度的提高
基于Q-Learning算法和神经网络的飞艇控制
关于为“一带一路”提供高分辨率遥感星座的设想
以工匠精神凸显“中国精度”