APP下载

畜牧业动物图像目标检测改进研究

2021-10-24更桑吉安见才让

计算机时代 2021年10期
关键词:目标检测畜牧业

更桑吉 安见才让

摘要: 根据不同的放牧方式有多种畜牧业管理模式,文章通过研究和改进图像识别模型来提高畜牧业动物图像检测技术及畜牧业管理水平。选择YOLOv3-Darknet53模型作为对象进行研究和改进,通过k-means++算法重新进行聚类分析,提高YOLOv3-Darknet53模型对畜牧业动物图像目标检测的检测精度。实验表明,改进模型对畜牧业动物图像目标检测的精度达到86.179%。F特征值在yak上提高了1%,S特征值在yak和sheep上分别提高了0.2%、1%,mAP提高了0.3%。

关键词: YOLOv3; 畜牧业; 目标检测; 维度聚类

中图分类号:TP399          文献标识码:A    文章编号:1006-8228(2021)10-20-03

Research on the improvement of animal image target detection in animal husbandry

Geng Sangji, Anjian Cairang

(School of computer, Qinghai University for Nationalities, Xining, Qinghai 810007, China)

Abstract: According to different grazing methods, there are many animal husbandry management modes. This paper studies and improves the image recognition model to improve the animal husbandry image detection technology and animal husbandry management level. YOLOv3-Darknet53 model is chosen as the object to be studied and improved, by redoing the clustering analysis with k-means++ algorithm, the detection accuracy of YOLOv3-Darknet53 model in animal husbandry image target detection is improved. The experimental results show that the accuracy of the improved model is 86.179%. The F eigenvalue is increased by 1% on yak, the S eigenvalue is increased by 0.2% on yak and 1% on sheep, and the mAP is increased by 0.3%.

Key words: YOLOv3; animal husbandry; target detection; dimension clustering

0 引言

随着硬件设备和网络技术的不断发展,人们获取图像的渠道一直在增加,圖像的数据量也呈指数型增长,在一定程度上逐渐满足着研究者们对数据的需求量。图像本身自带着丰富的信息,并且图像可以直观地将信息内容展现出来,图像作为一种传播信息的介质已融入到我们的日常生活。利用深度学习图像处理技术自动从图像中定位目标,被广泛应用于交通、医学、身份认证等领域,并且扮演着很重要的角色。

目前青海省的畜牧业管理模式有单户放牧、连户放牧、雇人放牧等多种形式,草场面积和家庭的劳动力影响着畜牧的数量和品种,也影响着畜牧业管理的便利度,因此,人们所采取的管理方法也各不相同。不管采用何种放牧形式,都需要投入大量的财力物力去管理,若要改善管理畜牧业的管理安全和管理水平就要从传统的管理模式走向现代化管理模式,本课题通过研究和改进图像识别模型[1-2],来提高畜牧业动物图像检测能力及畜牧业管理水平。

1 卷积神经网络概述

卷积神经网络(Convolutional Neural Network,简称CNN)是一个在计算机视觉、自然语言处理、图像处理等领域得到普及应用的一种典型的深度学习网络架构,集中了感受野的思想。采用局部链接和权值共享降低模型的复杂度,且网络易于优化。在图像识别中卷积神经网络的这种特性表现的更加明显,它改变了传统的特征提取过程,能够自动提取图像的特征,对输入的信息具有高度不变性,缩放和倾斜的情况下也有一定的不变性。

2 感受野与池化

感受野(Receptive Field)在卷积神经网络中是个既基础又重要的概念,感受野表示在卷积网络中某一层输出的结果中一个元素对应输入层上映射的区域,即特征图(Feature Map)上的一个点所对应的输入图上的区域,再通俗点讲,就是例如人的视觉感受中对某个事物感受的区域大小,如图1所示。

如果某个神经元受到N*N的神经元区域的影响,该神经元的感受野就是N*N,因为该神经元反映了N*N区域的信息,特征图中某一位置的特征向量是由前层某固定区域的输入计算来的,那么这个区域就是这个位置的感受野。如图1中像素点5是由前一层2*2区域计算而来,而2*2区域又是前一层中5*5区域计算而得来,因此该像素的感受野是5*5,在一幅图像中感受野之外的图像像素不会影响特征向量,感受野越大,得到的信息就越有全局性。

3 YOLOv3网络结构

YOLOv3在Darknet-19上添加残差网络和卷积层将其扩充为Darknet-53全卷积特征提取网络,残差块共有23个并进行五次降采样操作。根据卷积核的步长设定改变张量的尺寸大小,图1-5网络结构图中特征提取网络的卷积步长为2,经过卷积操作后将输入图像缩小为原来的1/2的大小。步长为2的卷机操作总共有五次,输入图像在经过五次步长为2的卷积后,将特征图缩小为原来的1/32,因此,网络输入图像的尺寸大小应为32的倍数,如图2所示。

图2结构图中输入图像的大小为416*416,经过多层卷积后会降维到52和26,13,通过特征提取网络得到三个特征尺度,分别为1024*13*13、512*26*26、256*52*52。对应上图1-5右边的Convolutional Set,表示特征提取器的内部卷积结构,其中1*1卷积作用于降维操作、3*3卷积用于特征提取,多个卷积通过交叉达到特征提取器的最终目的。图2中Concatenate表示当前特征层的输入来自上一层输出的一部分,因此表明了每个特征层关联性,每个特征层都有一个输出即图2中Predict表示的部分,表示预测结果。

4 k-means聚类分析

“物以类聚”,其类的含义就是具有相似特征的集合,聚类指的就是把数据的集合根据研究的需求分组成多个类,同类的对象都是彼此相似的。从YOLOv2算法开始为了选取更理想的预测框,引入K-means算法进行聚类分析选出最理想的K个初始聚类中心,然后计算每个对象与K值的距离,按照最近原则进行邻近聚类,YOLOv2聚类为五个anchor值,它衡量的是覆盖率,因此使用交并比(IOU)方法来进行计算。建议目标的质量将直接影响预测框的准确与否,因此YOLOv3延续聚类分析方法的基础上做了相应的改进,其做法是设置三个预测尺度,每个预测尺度分配三个锚框值,以此将原本五个anchor值增加至九个锚框值,此操作对目标检测的精确度提供了进一步的提升。

下面将通过图3和图4对k-means与k-means++算法的思想进行对比。

5 k-mean++聚类算法对预测框的改进

本文以YOLOv3模型为研究基础为了改进建议目标(object proposal)对预测框准确的影响,引入k-means++聚类算法重新对数据集进行聚类分析[3],并选择了理想的anchor值。引发这一操作的原因是原YOLOv3的anchor值是根据COCO数据集80个类为对象而聚类得到的值,而本文使用的数据集(青藏高原畜牧业动物图像数据集)是依据青海地区采集的图像,与COCO数据集的目标有所差距,因此为了得到更适用于本实验数据集的anchor值引发了这一系列操作。

首先引入k-means++算法,然后在经过20多次反复操作最终选择平均出现率最高的两组数值作为本次实验的anchor值,其值为如表1所示,F(first),S(second)。

选择两组数据的原因是第一组数值的出现率为二十分之十三,第二组数值的出现率为二十分之七。因此分别将两组数值都作为anchor值进行训练,最终两组数值在测试中的表现为F特征值在yak上提高了1%,S特征值在yak和sheep上分别提高了0.2%、1%,mAP提高了0.3%,测试结果如表2所示。

6 结束语

YOLOv3是目标检测的研究领域中有着很大突破的一种算法,不管是在检测精度还是检测速度方面都拥有着很大的优势和贡献,虽然现阶段的目标检测技术已经在很大程度上成熟了,但仍处于探索的阶段,算法成熟了不代表没有缺点,因此目标检测算法还有许多的缺点和不足。本文以YOLOv3模型为核心,基于深度学习的畜牧业动物图像识别模型作为研究基础与对照目标,为了提高畜牧业动物图像的目标检测精度,进行了提升检测精度的研究和改进。

实验结果表明,本文改进的模型对畜牧业动物图像目标检测在AP和mAP评价指标上都得到了相应的提升。下步可考虑引入注意力机制[4-5]、简化网络[6-8]等方法,改进算法和网络结构,以提高畜牧业动物图像的目标检测的精确率、速率和模型的泛化能力。

参考文献(References):

[1] 譚俊.一个改进的YOLOv3目标识别算法研究[D].中华科技大学,2018.

[2] 韩伊娜.基于深度学习的目标检测与识别算法研究[D].西安科技大学,2020.

[3] 王沣.改进yolov5的口罩和安全帽佩戴人工智能检测识别算法[J].建筑与预算,2020.11:67-69

[4] 刘丹,误亚娟,罗南超,郑伯川.潜入注意力和特征交织模块的Gaussian-YOLOv3目标检测[J].计算机应用,2020.40(8):2225-2230

[5] 徐诚极,王晓峰,杨亚东.Atttention-YOLO:引入注意力机制的YOLO检测算法[J].计算机工程与应用,2019.55(6):201306

[6] 徐利锋,黄海帆,丁维龙,范玉雷.基于改进DenseNet的水果小目标检测[J].浙江大学学报(工学版),2021.55(2):377-385

[7] 张伟,庄幸涛,王雪力,陈云芳,李延超. DS-YOLO:一种部署在无人机终端上的小目标实时检测算法[J].南京邮电大学学报(自然科学版),2021.41(1):86-98

[8] 程叶群,王艳,范裕莹,李宝清.基于卷积神经网络的轻量化目标检测网络[J/OL].激光与光电子学进展. https://kns.cnki.net/kcms/detail/31.1690.TN.20201229.1435.008.html.

猜你喜欢

目标检测畜牧业
映像畜牧业
畜牧业也要打好“翻身仗”
映像畜牧业
映像畜牧业
映像畜牧业
映像畜牧业
视频中目标检测算法研究
行为识别中的人体运动目标检测方法
移动机器人图像目标识别
基于背景建模法的运动目标检测