APP下载

基于卷积神经网络的典型侦察目标检测方法研究

2023-01-11袁建虎徐显海

现代计算机 2022年20期
关键词:注意力精度特征

岳 磊,袁建虎,徐显海

(1.陆军工程大学野战工程学院,南京 210001;2.95979部队,泰安 271000)

0 引言

侦察巡逻是确保地区安全稳定的重要行动,是确保社会经济健康发展的重要保障,但是巡逻侦察环境复杂多样、巡逻地点交通不便、检测目标多样等问题增加了任务执行难度。传统巡逻侦察通过低近侦察,拍摄图像视频资料观察判断可疑区域,但视野十分有限且检测效率低,检测效果较差。现代巡逻侦察行动要求节奏迅速、反应快,减少非必要时间损失带来的影响。伴随计算机视觉在军事应用上的发展,传统检测精度低、检测难度大、实时性差等问题也随之突出。因此研究智能目标检测在军事侦察、边境治理、引导打击和反恐维稳等领域的应用具有重要意义。

执行侦察巡逻任务时,主要面临以下困难:①任务场景复杂:山岳丛林、村落、高寒山地、荒漠草原。②检测方式多样:采用抵近侦观察设备、无人机航拍和视频监控进行侦察图像采集。③检测目标种类多样:行人、车辆、牲畜、建筑等。

上述巡逻侦察任务中面临的问题十分具有挑战性,使得众多学者进行深入研究。近年来随着神经网络的深入研究,计算机计算性能和存储能力提升,采用深度学习进行目标检测已经广泛用于各个领域,在国家安全、军事、交通、医疗和生活等都是重要研究方向[1-2]。通过深度卷积神经网络能够有效改善传统检测算法深层特征提取不充分、泛化性差、受自然和人工干扰因素多的问题,同时提升检测精度及效率。

目前根据网络结构设计方式不同,现有的深度学习检测算法可以分为两类:一类是基于区域的两阶段(Two-Stage)检测算法,代表算法有R-CNN[3]、Faster R-CNN[4]、Mask R-CNN[5]等,两阶段算法主要是依据图像中被检测实际位置,提前选取候选区的方式进行训练。另一类是一阶段(One-Stage)检测算法,该类算法采用端到端检测网络,代表算法有YOLO(You Only Look Once, YOLO)[6-7]、 SSD(Single Shot Multibox Detector, SSD)[8]等。

一阶段算法使用回归思想,用回归的方式得出检测框类别及偏移量,并得出最接近真实值的检测框。郝旭政等[9]对行人特征进行加强表达。通对图像中的行人表达和分布进行分析,在保证检测算法检测速度的前提下,对网络中的残差模块进行了改进,使得YOLO算法获得了更强的表达能力。裴伟等[10]针对目标重复多次漏检以及小目标漏检的情况,以SSD为基准模型进行改进,将不同特征融合机制进行了融合,且通过实验证明了此方法具备较好的准确性和实验性。

针对侦察巡逻任务背景下被检测图像检测图像模糊、自然环境干扰造成检测困难的问题,本文在YOLOv5的基础上对原始标准网络进行改进,收集、标注、扩充相关实验数据集;在YOLOv5的骨干网络(Backbone)中引入双通道注意力机制[11](Convolutional Block Attention Mod⁃ule,CBAM)模块。

1 检测模型

1.1 YOLOv5算法结构

YOLOv5检测模型基本框架主要包括Input、Backbone、Neck、Prediction等四部分。输入部分:主要将图像调整为640×640的比例,并进行缩放、增强等处理;Backbone模块主要进行切片处理操作:将输入图像进行切片处理,便于模型的训练以及多种尺度的特征的提取;Neck模块完成多个尺度特征信息融合的功能,在这个部分将不同深度的特征信息进行融合,可以减少因特征提取而丢失的语义信息,从而能够使模型训练获得更多的训练信息,有利于算法精度的提升;Prediction部分由3个检测头组成,Bounding Box损失函数使用GIOU函数,如式(1)所示,类概率分类采用交叉熵损失函数。

1.2 双通道注意力机制模块

为了解决被检测目标与背景分离性较差、目标显著度低的问题,本文在YOLOv5网络模型中的残差块与卷积块中引入通道注意力和空间卷积块注意力模型[12-13]。

图1 双通道注意力机制模块

在CBAM模块中的通道注意力机制,采用Maxpool和Avgpool对特征信息进行增强,计算公式如下:

Mc表示CBAM模块中的通道注意力模块,MS表示空间注意力模块;H×W表示为特征图大小;特征图表示为F∈RC×H×W,σ为Sigmoid非线性激活函数;MLP(Multilayer Perceptron)为共享感知器;W0和W1

分别表示MLP中多层感知器中的隐藏层权重和输出层权重;Fcavg和Fcmax分别表示通道注意力机制的全局平均池化操作和最大池化操作。

因为添加通道注意力机制后的网络会使图像位置信息产生损失值,因此在此基础上再添加空间注意力模块。将特征图F∈RC×H×W输入空间注意力模块后,在通道维度对特征图进行平均池化和最大池化操作。进行信息增强,得到两个H×W× 1通道,并将这两个通道拼接在一起,然后完成卷积操作和Sigmoid激活函数操作,得到权重系数MS;最后,将权重系数与前一步的缩放特征进行特征相乘,就可以得到空间注意力特征。相关的计算公式如下:

2 算法改进

2.1 基于YOLOv5的改进模型

将样本数据集进行数据增强后,输入到网络中进行训练;在网络中增加双通道注意力机制部分,能够有效提取深层次语义信息,形成模型偏好特征,找到兴趣点。本文所提出检测算法如图2所示。

图2 改进检测算法框架

2.2 数据增强策略

在执行侦察巡逻任务时,由于环境多样常会出现自然因素导致的采集数据质量低的情况,这就要求检测模型具备较高的鲁棒性和泛化性。为解决这一问题,对检测数据集进行数据增强,采用Mixup方法模拟检测目标被遮挡的场景,即从训练集中随机抽取两张图像,对像素和标签进行加权;此外结合任务场景采用随机缩放、旋转、裁剪、高斯噪声、平移等方式进行样本扩充,改善了过拟合和样本数据量少的问题,如图3所示。

图3 对样本数据集进行扩充

3 模型训练及结果分析

本文实验所使用的软硬件环境如表1所示。

翻转课堂的教学效率提高,课堂富余时间较多,使我们可以根据教学内容多设计一些练习放到课内.作业设计一般要求在25分钟左右,以近年来的高考真题与模拟试题为主,有一定的坡度.

表1 实验算法训练环境配置

本文共整理了1800张典型侦察巡逻目标数据集,包含不同场景的行人和车辆。对原有样本进行增强后,将数据集扩充至6500张;使用la⁃bellmg工具对数据集进行标注,并按照8:1:1的比例区分训练集、验证集、测试集进行模型训练。

3.1 模型训练

模型训练过程:为防止过拟合和跳过最优解,将动量因子设置为0.937,并采用随机梯度下降法进行参数调整。Batchsize设置为32,Epoch训练500轮次,初始学习率为0.01,权重衰减0.0005,Mixup的重叠系数设置为0.7。待损失函数和精度都逐渐稳定时,得到算法最优权重。在图像预处理过程中,将图像大小调整为640×640后再输入网络中进行训练。

3.2 模型评价指标

为了验证本文所提算法改进的有效性,使用平均精度均值mAP(mean AP)和平均精度AP(Average Precision)作为衡量指标。相关表达式如下:

上式中:TP、FP和FN分别表示不同的意思。其中TP表示本身属于该类目标,并且能够被模型准确检测的实例数量;FP则表示本身不属于该类目标,但由于模型性能不足而被误判为该类目标的实例数量;FN表示负样本被错误检测为正样本的数量。AP为PR曲线积分,N为检测种类数量,mAP表示为多类别平均精度。IOU取0.5时mAP为mAP@0.5,IOU取不同取值的mAP为mAP@0.5:0.95。

3.3 实验分析

为了验证本文所提模型的有效性,在数据集上进行了训练和测试,训练结果如图4所示。

图4 改进mAP@0.5比较曲线

从实验结果可以看出,本文改进算法和原始标准算法在此数据集上都有较好的检测性能。相较而言,本文算法在Epoch至150轮次左右时,准确率上升至0.579,并最终在350轮左右时稳定在0.675;标准YOLOv5算法训练迭代Epoch至180轮次左右时,准确率上升到0.585,最终稳定0.643。为了检验本文算法的检测效果,将改进算法和原始标准算法进行了检测对比实验,相关检测结果如图5所示。

图5 各算法检测对比结果

第一组图像为原始标准YOLOv5网络模型的检测结果,由实验数据可知涉及行人、车辆,背景环境有丛林、荒漠,被检测物体尺度大小不一,且存在部分目标被遮挡或与背景高度相似的情况。但从结果可得,YOLOv5检测算法用于不同场景下的典型巡逻目标具有良好的检测效果。

第二组数据为本文改进算法检测结果。由结果可知被检测行人目标在复杂环境下特征表达能力得到提高,相较于原始检测算法,模型检测精度提高了3.25%。虽然被检测目标存在遮挡模糊且目标较小的情况,但本文算法仍能以较高准确率、较少的损失值,更接近于真实框。

4 结语

为解决在不同场景下典型侦察巡逻目标检测效果差,检测效率低的问题,本文引入了基于卷积神经网络的一阶段目标检测算法YO⁃LOv5。通过实验证明了:相较于其他检测算法,YOLOv5能够有较高的准确性和较低的漏检率,更适用于巡逻侦察任务。此外,本文以YOLOv5为基准模型,分析应用场景及目标会使检测算法存在因目标尺度不一、背景复杂、自然天气影响导致的较多漏检误检问题。针对这些问题,我们融合双通道注意力机制模块,使检测模型更专注有效特征;对数据样本进行了增强,增强了算法的鲁棒性。实验结果表明,本文算法在多种复杂环境下的测试,具有更好的检测以及实时性,较好降低了因目标多样、遮挡等情况造成的漏检和误检情况。但本文算法在检测车辆目标时检测精度较低,且因数据集限制,检测精度及召回率还需提升。随着后期研究增加和检测样本不断扩充,模型精度和泛化能力将进一步提升。

猜你喜欢

注意力精度特征
根据方程特征选解法
离散型随机变量的分布列与数字特征
让注意力“飞”回来
热连轧机组粗轧机精度控制
如何培养一年级学生的注意力
超高精度计时器——原子钟
不忠诚的四个特征
分析误差提精度
基于DSPIC33F微处理器的采集精度的提高
A Beautiful Way Of Looking At Things