APP下载

基于YOLOv5的公共场景宠物犬牵绳检测

2022-08-26耿帅帅廖涛刘唤唤

现代信息科技 2022年11期
关键词:宠物犬精度模块

耿帅帅,廖涛,刘唤唤

(安徽理工大学 计算机科学与工程学院,安徽 淮南 232001)

0 引 言

宠物犬在人们的日常生活中扮演着很重要的角色,然而人们带着宠物犬散步时,常常因为某些原因对宠物犬不牵绳,给其他行人的安全带来了很大的威胁。因此公共场景下对未牵绳宠物犬的监管力度应该加大。由于遛犬时间不定与巡查人力少等原因,人工检测难度较大,对基于网络的、高效的宠物犬牵绳检测变得愈发重要。因此急需实现基于网络的、高效的宠物犬牵绳自动动态的目标检测。

近些年来,随着计算机计算能力的提升与计算机视觉对图像、视频提取特征方式的改变,基于深度学习目标检测算法(如Faster R-CNN、SSD)的检测精度得到较大的提升且识别效果较好,目标检测算法在动植物检测方面有广泛的应用前景。

目前,主流的深度学习模型在动植物检测中取得了不错的效果,例如:杨等人提出一种融合坐标注意力机制的YOLOv4网络模型对奶牛面部进行识别,达到了不错的效果;权等人使用减少张量的YOLOv4模型对采集的农田苗草数据进行训练,实现了苗草的高效识别;吴等人在YOLOv5模型中引入跳转连接与注意力机制,解决真实近海环境下珊瑚礁底栖生物识别效果差的问题;刘等人设计了一种含有残差模块的darknet-20主干网络且融合多尺度检测模块,提升了复杂环境下番茄果实的检测精度。

然而在宠物犬牵绳方面的应用还存在以下问题:比如公开数据集噪点严重,可用样本较少;宠物犬毛发旺盛且与犬主人靠近,采集照片存在绳子被遮挡,检测难度高等。针对以上问题,本文在对公开数据集扩充的基础上,首先通过网络爬取了部分数据集,与筛选出的符合要求的公开数据集进行组合,构成了本文自制数据集;其次,本文通过修改骨干特征提取网络添加坐标注意力机制方法,提出了一种改进的YOLOv5模型,基于原YOLOv5的在宠物检测方面的缺陷,参考犬类牵绳数据在实际检测中存在的问题和需求,改进的YOLOv5模型在犬类目标识别与实时捕捉定位能较好的满足本文的需求。

1 相关工作

1.1 YOLOv5模型

YOLOv5模型是目前主流的一阶段深度学习目标检测算法,该模型主要是由输入端(Input)、主干网络(Backbone)、特征融合(Neck)、检测端(Detect)四部分组成,如图1所示。Input模块对输入的图片进行自适应缩放、拼接等操作,自适应地找出最优的锚框进行检测;Backbone模块的FOCUS、CBL、CSP1、SPP操作对图片不同尺度的特征进行提取与聚合,提炼出13×13、26×26、52×52三种尺度的特征图;Neck模块采用了FPN+PAN的网路结构对上层不同尺度的信息进行融合,FPN层自顶向下的对图片进行上采样从而与主干网络的特征进行特征融合,为了提高上层尺度信息的表现力,借助PAN结构把特征信息由下向上传递以达到上层尺度融合更多的特征,通过FPN+PAN的结构可以对主干网络和检测网络提取的特征进行聚合,提高网络特征融合的能力;最后,Detect模块根据上层的三种尺度的候选框对图像的特征进行预测,生成边界框、置信度以及定位识别。

图1 YOLOv5网络模型结构图

1.2 引入注意力机制SENET

为了提升模型对局部特征的关注程度,在模型的骨干特征提取网络中引入了通道注意力模型SENet模块,如图2所示。该模型结合了注意力机制的特点,强化了对主要特征的关注度,以期达到误检与漏检的目标。

图2 通道注意力模型

SENet由Squeeze、Excitation与Reweight三个子模块组成。其中,Squeeze是SENet的压缩模块,由一个全局平均池化Globe Average Pooling构成,主要负责对特征图的压缩以及提高感受野;Excitation模块使用两个全连接层以及一个权重调节激活函数对通道之间的相关性进行显式的建模,权重调节部件通过参数来为每个特征通道生成权重,这些特征参数也称为特征响应值,被显示的学习用以去抑制对当前模块不重要特征的权值以达到减小损失的效果;Reweight模块为模型的特征重定向层,能够对上层传输权重的结果进行通道上的定向加权,逐通道的进行赋值并对初始特征进行权值赋予,以此作为本模块的输出。

2 实验过程及结果分析

2.1 数据采集与预处理

宠物犬牵绳数据集一部分来自Kaggle竞赛猫狗图像数据2 000张,另一部分鉴于本文的检测环境为公共场景下对未牵绳宠物犬的识别,采用网络爬虫的技术爬取了特定公共场景(公园、马路、小区)下的图片2 000张与对此图片进行数据增强扩充500张。

由于公共场景遛宠物犬时间与天气状况不一,晴天、多云、阴天、下午、晚上等,因此,为提高模型对公共场景下检测宠物犬图像的鲁棒性,将图像进行色域调整,将HSV(Hue,Saturation,Value)颜色模型中的色调(H)、饱和度(S)、明度(V)进行调整,从而模拟出在不同天气与时间点的环境情况,如图3所示。用数据增强的方法获得500张。

图3 色域扭曲数据增强

实验的标注工具采用LabelImg对宠物犬数据进行人工标注,实验需要识别宠物犬是否牵绳,故总共设置两个标签,分别为:cord-dog(牵绳)、dog(未牵绳)。数据集共包含4 500张,训练集、测试集与验证集数量比例为8:1:1即3 600:450:450。其中训练集由1 600张kaggle竞赛数据图片和2 000张网络爬取的宠物犬图片组成,测试集和验证集分别由200张kaggle竞赛数据图片和250张网络爬取的宠物犬图片组成,如表1所示。

表1 宠物犬牵绳数据集分布

2.2 深度学习环境配置

实验所需的环境如表2所示。以相同的配置设置于对比试验模型的YOLOv5、Mobilenet-V2 YOLOv5网络,作为对照组网络。

表2 深度学习环境配置表

2.3 实验结果及分析

本次实验测试集共包含4 500张图片,其中宠物犬被牵绳检测的平均精确度为78.6%,宠物犬未被牵绳检测的平均准确度均值为82.9%,检测到宠物犬未被牵绳如图4所示。检测到宠物犬已被牵绳如图5(a)所示,检测到宠物犬被牵绳随后进入公共场景,进行牵绳识别如图5(b)所示。

从图4和5中可以看出对于正常的公共场景下宠物犬是否牵绳的检测识别,本文提出的算法取得了不错的检测效果,map值达到近80.7%。由图4可以看出,当宠物犬在公共场景下未被牵绳时,则可以使用YOLOv5准确检测识别。而由图5可以看出,当宠物犬被牵绳活动时,细小的绳索信息也可以被获取并抓取识别,本模型对宠物犬绳索粗细的信息可以较好的识别。

图4 宠物犬未被牵绳的检测示例

图5 宠物犬已被牵绳的检测示例

本文对YOLOv5模型进行改进,对公共场景下宠物犬是否牵绳进行检测的同时,与原YOLOv5、Mobilenet V2-YOLOv5网络模型进行对比实验。然后在测试集上分别对其进行训练测试评估,以参数量、模型大小、平均精度均值作map为模型的性能的评价标准,详细的对比实验数据如表3所示。

表3 改进YOLOv5 与其他算法对比实验结果

根据实验数据表的三组模型的测试信息可以看出,改进后网络模型YOLOv5的map值已经达到80.7%且参数量与模型大小为7 214 431、14.7 m,与原YOLOv5相比,改进YOLOv5网络在网络参数、模型大小增加少量的情况下平均精度的均值提升了1.5个百分点;相较于Mobilenet-v2 YOLOv5,改进YOLOv5网络在参数量、模型大小上稍大,但平均精度的均值有了显著的提升。通过以上实验数据对比可以得出,改进YOLOV5在参数量、模型大小没有显著扩大的情况下,精度得到提升,在宠物犬牵绳检测上具有较好的精度。

3 结 论

针对在公共场景下宠物犬袭击行人的问题,本文在公共安全领域引入基于深度学习的YOLO网路模型来对宠物犬是否牵绳进行检测,并借鉴SENet的特点对原始模型进行改进。改进的YOLOv5模型目标检测算法对宠物犬被牵绳检测的平均精度为78.6%,对未牵绳的宠物犬检测的map为82.9%。实验结果充分证明了本文的算法的平均精度对宠物犬是否牵绳检测具有较高的识别度,有助于提升在公共场合下人们对宠物的管理水平。

基于深度学习的目标检测方法应用于公共安全领域有着极大的研究价值以及应用前景。在接下来的工作中将重点对实际公共场景禁入目标的课题进行相关研究,并结合深度学习中的transform结构对模型进行改进,对公共场景禁入目标进行准确识别与检测。

猜你喜欢

宠物犬精度模块
基于不同快速星历的GAMIT解算精度分析
Module 2 Highlights of My Senior Year
Module 4 Music Born in America
美国宠物犬收养平台Good Dog正式上线,融资670万美元
近似边界精度信息熵的属性约简
宠物经济发展形势下我国宠物犬保险的设计与推行
电力系统短期负荷预测方法与预测精度
必修模块相关知识过关训练
浅谈ProENGINEER精度设置及应用
犬子宫蓄脓的诊治