APP下载

基于改进单次多目标检测器的果面缺陷冬枣实时检测

2022-03-16李颀陈哲豪

江苏农业学报 2022年1期
关键词:冬枣

李颀 陈哲豪

摘要: 为实现果面缺陷冬枣实时检测,并解决缺陷的尺寸与位置不同影响检测精度的问题,提出一种基于改进单次多目标检测器(Single shot multibox detector,SSD)的果面缺陷冬枣实时检测方法。以陕西大荔冬棗中的虫蛀、轮纹和木质化3种缺陷果和正常果为研究对象,在数据采集设备下采集实际分拣图像,然后通过数据增强由400张扩充至2 000张。改进SSD,建立MobileNetV3-SSD模型,为实时检测奠定基础;引入改进感受野块(RFB)可实现模型多尺寸提取冬枣缺陷特征的能力;用空间注意力模块(SAM)代替挤压和激励通道注意力模块(SE)增强模型定位冬枣缺陷特征的能力。试验结果表明,本研究模型在果面缺陷冬枣数据集上的表现均优于目前先进目标检测网络模型(RetinaNet和EfficientDet-D0),该模型对4类冬枣的整体检测精准性(mAP)达到91.89%,检测速度达到1 s 40.85帧。因此本研究模型较好地平衡了实时性和精准性,可应用于果面缺陷冬枣分拣流水线。

关键词: 冬枣;果面缺陷;实时检测;单次多目标检测器;多尺寸;空间注意力模型

中图分类号: TP391.4 文献标识码: A 文章编号: 1000-4440(2022)01-0119-10

Abstract: In order to realize the real-time surface defect detection of winter jujube and solve the problems that different sizes and positions affected the detection accuracy, a real-time surface defect detection method of winter jujube based on improved single shot multibox detector (SSD) was proposed. Three kinds of defective winter jujubes(worm, wheel-pattern and lignification) and normal winter jujubes from Dali(Shaanxi province) were taken as the research objects. The actual sorting images were collected by data acquisition equipment, and then expanded from 400 to 2 000 by data enhancement. The SSD was improved, and MobileNetV3-SSD model was established to lay the foundation for real-time detection. The introduction of improved receptive field block (RFB) could realize the ability of model to extract the defect feature of winter jujube at multiple scales. Spatial attention module (SAM) was used to replace squeeze-and-excitation (SE) block, so the ability of the model to locate the defect feature of winter jujube was enhanced. The test results showed that the performance of the proposed model on the dataset of defective winter jujube was better than the current advanced target detection network models (RetinaNet and EfficientDet-D0). The averall detection accuracy of the model for four types of winter jujube was 91.89%, and the detection speed was 40.85 frames per second. Therefore, the model established in this study can balance the real-time performance and accuracy, and can be applied to sorting pipeline of winter jujube with surface defect.

Key words: winter jujube;surface defect;real-time detection;single shot multibox detector;multi-scale;spatial attention module

2020年陕西大荔冬枣产量超5×105 t[1]。庞大的产量带来了巨大的果面缺陷冬枣分拣量,而人工应对巨大分拣量时精度骤降且效率低下[2-3]。此外采后冬枣常温下易失水的缺点会导致其品质受损,所以需要尽快完成分拣以冷藏保鲜,可见实现果面缺陷冬枣实时检测至关重要[4-5]。

常规的果面缺陷检测方法包括传统机器学习和深度学习两类。Lu等[6]使用主成分分析获得苹果第一主成分图像,基于类内方差法分割图像,根据非零像素判断苹果损伤,准确率为84.20%。孙世鹏等[7]利用降维算法确定冬枣损伤处一致的特征波长,经处理获得一致波长灰度图,并用支持向量机分类,检测准确率为81.80%。

显然传统机器学习的精度与所提取的果面缺陷特征息息相关。但是冬枣果面缺陷尺寸不一且位置随机,传统机器学习的精度也会因特征提取难度的升高而下降[8]。然而深度学习能够挖掘到人类难以发现的有效特征,从而在果面缺陷检测任务中脱颖而出。

薛勇等[9]使用GoogLeNet自動提取苹果果面缺陷特征,对测试样本检测准确率达91.91%。费琦琪等[10]利用CNN自主提取冰糖橙缺陷特征,对测试样本检测准确率达96.67%。李小占等[11]通过改进VGG网络训练哈密瓜表面缺陷检测模型,检测准确率为93.50%,静态下处理单幅图像需0.7 s。虽然深度学习在上述任务中表现出色,但是卷积神经网络的巨大计算量导致模型实时性受限。因此果面缺陷目标检测模型的实时性和精准性的平衡问题亟待解决。

综上所述,本研究以产自陕西大荔的虫蛀、轮纹和木质化3种果面缺陷冬枣和正常冬枣为试验材料,提出基于改进单次多目标检测器(Single shot multibox detector,SSD)的果面缺陷冬枣实时检测模型,对缺陷果和正常果进行实时检测,使检测模型兼具实时性和精准性。

1 果面缺陷冬枣实时检测模型

1.1 SSD目标检测网络

单位时间内检测果面缺陷冬枣个数是决定模型实时性的主要因素之一,这就要求选择的网络能应用于图中存在多个冬枣目标的检测任务,因此果面缺陷冬枣实时检测模型应选择目标检测网络。目前目标检测网络分为单阶段检测网络和双阶段检测网络。双阶段检测网络原理是先获得若干个建议框,最后在建议框中筛选出预测框。而单阶段检测网络则跳过获得建议框的阶段,直接获得预测框。因此单阶段网络相较于双阶段网络的实时性有一定提升。Liu等[12]学习YOLO的回归理念,提出先验框预测机制,使SSD具有出色的实时性和精准性。

1.2 MobileNetV3主干网络

VGG16的计算量高达14.2 G FLOPs,因此VGG16作为主干网络与SSD搭配存在计算量过大的缺点,这会减缓果面缺陷冬枣实时检测模型的检测速度[13]。但是检测果面缺陷冬枣的速度是决定模型实时性的另一个主要因素,为了进一步加强模型的实时性,本研究用MobileNetV3代替VGG16作为主干网络与SSD搭配。

一方面MobileNetV3通过使用深度可分离卷积代替大量标准卷积,有效压缩了果面缺陷冬枣实时检测模型的计算量,因而模型的实时性得到加强[14]。

深度可分离卷积与标准卷积的区别是,前者将后者的卷积操作分为2步来执行:

(1)对输入特征图各通道应用一个滤波器进行深度卷积但不合成特征图。

(2)利用逐点卷积计算输入特征图的线性组合构建输出特征图。

深度可分离卷积由深度卷积和逐点卷积两部分组成[15]。深度卷积和逐点卷积的计算量分别如公式(1)和公式(2)所示。

NDepthwise=DK×DK×M×DF×DF(1)

式中NDepthwise是深度卷积计算量,DK是输入特征图大小,M是输入特征图通道数,DF是输出特征图大小。

另一方面,MobileNetV3通过使用倒残差模块,提高模型学习冬枣果面特征的效率,减少模型冗余计算。

倒残差模块由扩张层、深度可分离卷积层和投影层组成。其设计思路是:为了深度可分离卷积层在高维度特征图中学习到更多冬枣果面缺陷特征,通过使扩张层中的扩张系数factor=6升高特征图维度,为了有效降低模型向下传递特征图时的计算量,又通过投影层压缩特征图维度。

本研究将MobileNetV3的池化层及其之后的卷积层删除,然后与SSD拼接组成MobileNetV3-SSD。MobileNetV3-SSD将第13个倒残差模块和池化层之前的卷积层的输出作为预测特征层,最后通过预测特征层和SSD附加层得到预测结果(图1)。

1.3 改进感受野块

本研究借助OpenCV库的ContourArea函数计算冬枣果面缺陷面积与果面总面积的比例来分析冬枣果面缺陷尺寸。由图2可以看出,虫蛀、轮纹和木质化的尺寸位于6个区间内,分别是(0,0.05],(0.05,0.10],(0.10,0.15],(0.15,0.20],(0.20,0.25]和(0.25,0.30],然而单尺寸感受野无法胜任提取不同尺寸冬枣果面缺陷特征的任务[16]。

针对上述问题,本研究将改进的感受野块(Receptive field block,RFB)引入果面缺陷冬枣实时检测模型,让模型从3个尺寸提取冬枣果面缺陷特征,旨在提高模型分类果面缺陷冬枣的精度[17]。

RFB是一种模仿人眼群体感受野(Population receptive field,pRF)的仿生卷积结构,该结构通过标准卷积和空洞卷积模拟pRF尺寸与偏心率的正相关实现特征图感受野[18-19]。为了获得3种尺寸的冬枣果面缺陷特征,引入模型的RFB设置为3个分支卷积结构,其中每个分支由卷积核大小不同的标准卷积和膨胀率不同的空洞卷积组成,前者用于模拟不同尺寸的pRF,后者用于模拟不同偏心率的pRF。由图3可以看出,空洞卷积核的膨胀率随着标准卷积核的尺寸增大而增大,两者的变化关系则复现了pRF的尺寸与偏心率的关系。最后RFB各分支输出的特征图都将叠加到一起,以实现多尺寸果面缺陷特征融合。

为了减轻引入RFB对模型实时性的影响,本研究对RFB进行改进:将3×3标准卷积拆分成并联的1×3标准卷积和3×1标准卷积;将5×5标准卷积拆分成串联的1×5标准卷积和5×1标准卷积;同时用深度可分离卷积代替标准卷积实现空洞卷积,最后得到改进的RFB模块(图4)。由于在浅层特征图中更容易提取到尺寸普遍偏小的冬枣果面缺陷特征,本研究将改进RFB模块嵌入MobilenetV3-SSD的第13个倒残差模块和分类定位预测层之间。

1.4 空间注意力模块

通过观察图5中3类果面缺陷出现的位置,发现缺陷可能处于果面边缘,也可能处于果面中央,甚至遍布果面。针对缺陷在冬枣果面上任意分布的问题,本研究引入空间注意力机制帮助果面缺陷冬枣实时检测模型确定果面缺陷的位置,继而提高模型定位冬枣果面缺陷位置的精度。

倒残差模块中采用了挤压和激励模块(Squeeze-and-Excitation,SE),SE属于通道注意力机制,该机制利用各通道特征图之间的关系来提取冬枣果面缺陷特征,最后生成基于果面缺陷特征的通道注意力特征图。可见通道注意力机制有利于提高模型提取果面缺陷特征的能力[20]。但是冬枣果面缺陷位置不确定影响了模型定位果面缺陷冬枣的精度。解决这个问题需要增强模型定位冬枣果面缺陷的能力,而空间注意力机制恰好能改善模型的定位能力,因此本研究用卷积层注意力模块(CBAM)中的空间注意力模块(SAM)取代SE[21-23]。

如图6所示,本研究将倒残差模块中深度可分离卷积层的输出作为SAM的输入特征图,SAM首先通过F推导出空间注意力特征图MS(F),然后MS(F)与F进行哈达玛积运算,求得输出特征图F′,最后SAM的输出作为投影层的输入。

式中F′是输出特征图, MS(F)是空间注意力特征图,F是输入特征图。

执行哈达玛积运算的目的是为F中出现冬枣果面缺陷特征的位置分配相应的关注度。

如图7所示,为了推导MS(F),首先需要通过最大池化和平均池化整合F的通道信息,生成平均池化特征图(FSavg)和最大池化特征图(FSmax),2种池化操作的目的是凸显冬枣果面缺陷部位特征[24];然后叠加FSavg和FSmax,生成叠加特征图FSconcat;最后FSconcat依次经过7×7标准卷积和sigmoid激活函数处理生成空间注意力特征图[MS(F)]。

式中MS(F)是空间注意力特征图,F是输入特征图,FSavg是平均池化特征图,FSmax是最大池化特征图。

2 果面缺陷冬枣实时检测模型训练

2.1 果面缺陷冬枣数据集建立

2.1.1 数据采集 采集时间为2020年7-11月,采集地点为陕西中农厚朴农业科技有限公司。果面缺陷冬枣数据集以陕西大荔冬棗为数据采集对象。数据集由3类果面缺陷冬枣和正常冬枣组成。如图8所示,数据集通过数据采集设备完成采集工作,其中电荷耦合器件(Charge coupled device,CCD)工业相机使用杭州海康威视数字技术股份有限公司生产的MV-CE013-50UC相机,最大分辨率为1 280×960,即1.30×1010像素。采集时冬枣随机摆放,同时CCD工业相机在自然光照下以俯视视角采集图像。

2.1.2 数据集预处理及生成 原始数据集共400张图像,本研究使用LabelImg标注数据,标注文件格式参照Pascal VOC。

为了提高果面缺陷冬枣实时检测模型的检测精度和泛化能力,本研究使用Python库函数Imgaug对数据集进行数据增强[25]。考虑到图像内的冬枣果面特征不会因观察方向的变化而改变,并且为了增强模型在不同光照下的鲁棒性,本研究使用上下翻转、左右翻转、镜像翻转和亮度增减4种方法实现数据增强。在Imgaug的帮助下,标注框会随着数据增强而变换,避免再次绘制。

经过增强,数据集共2 000张图像,按8∶1∶1的比例划分为训练集、验证集和测试集。

2.2 试验环境

试验硬件环境选择Inter(R) Xeon(R) CPU E5-2637 @3.50 Hz和NVIDIA GeForce RTX2070 SUPER 8 G;操作系统为Windows Server 2008 R2 Enterprise 64bit;软件环境选择Python3.6.7和Keras 2.1.5。

2.3 模型训练

本研究模型训练运用迁移学习策略,需要在Pascal VOC07+12数据集上训练得到预训练模型。鉴于丰富的Pascal VOC07+12数据集中必然有数据与本研究数据存在关联,因此迁移学习能把学到的模型参数应用于本研究数据集训练,达到加快并优化训练的目的,避免人工初始化参数直接在数据集上训练,导致模型表现不佳[26]。

另外模型训练还运用了冻结训练策略,即主干网络MobileNetV3的模型参数不会随着模型训练而更新。冻结训练可以有效避免模型过拟合。本研究将前50次训练设为冻结训练阶段,输入图像大小统一修改为300×300,批数据量为16,学习率为0.000 5。第50次以后训练进入解冻训练阶段,批数据量减半,学习率降为0.000 1。其中学习率下降以验证损失为标准,当验证损失经过3次训练不下降,学习率减半。训练使用自适应矩估计优化器,β1=0.900,β2=0.999。Adam优化器可预防学习步长过小导致模型收敛缓慢的问题。

2.4 模型性能评价指标

由于果面缺陷目标检测模型在实际应用中需要平衡实时性和精准性,因此试验中模型性能的优劣以这2个性能为衡量标准。每秒帧数(FPS)可表示模型对果面缺陷冬枣检测的实时性,平均精度(AP)可表示模型对各类冬枣检测的精准性,mAP可表示模型对4类冬枣的整体检测精准性。因此本研究将FPS、AP和mAP作为评价指标。

计算AP需求得精度(p)和召回率(r),p和r计算公式如公式(7)和公式(8)所示。

p=TPTP+FP(7)

r=TPTP+FN(8)

式中TP表示分类正确的正样本数,FP表示分类错误的正样本数,FN表示分类错误的负样本数。

AP和mAP的计算公式如公式(9)和公式(10)所示。

AP=∫10p(r)dr(9)

mAP=∑ni=1AP(i)n(10)

式中n表示冬枣果面类别数,故n=4;AP(i)表示第i类冬枣果面的平均精度。

3 结果与分析

3.1 不同主干网络对模型性能的影响

为了分析MobileNetV3对模型检测冬枣果面缺陷速度的影响,本研究对SSD分别搭配VGG16和MobileNetV3的性能进行比较试验。由表1可知,当主干网络由VGG16更换为MobileNetV3后,模型计算量减少了43.16 MFLOPs。庞大计算量的减少优化了模型性能,mAP仅损失1.98%,FPS获得81.22%的提升,达到41.30。因此将MobileNetV3作为主干网络可为果面缺陷冬枣实时检测模型的实际应用奠定基础。

3.2 不同尺寸感受野对模型性能的影响

为了分析应用多尺寸感受野对模型分类冬枣果面缺陷精度的影响,并避免MobileNetV3作为主干网络对试验的干扰,本研究对VGG16-SSD的引入是否改进RFB的性能进行试验,即试验SSD分别应用多尺寸感受野和单尺寸感受野对模型性能的影响。试验结果如表2所示,改进的RFB后,模型对正常冬枣、虫蛀冬枣、轮纹冬枣和木质化冬枣的AP分别提升了0.39、2.23、2.06、1.32个百分点,mAP提升了1.50个百分点。同时改进的RFB为轻量级卷积块,将其引入模型后,模型计算量仅增加2.75%,FPS仅下降3.20%,说明模型的实时性基本不受影响。

此外多尺寸感受野的应用对于正常冬枣的分类精度提高不明显,原因是相对于果面缺陷冬枣,正常冬枣的果面不存在多尺寸果面特征,因此多尺寸感受野更适用于提取不同尺寸的冬枣果面缺陷特征。

如图9所示,应用单尺寸感受野的模型忽略了果面上存在小尺寸轮纹的冬枣,导致分类错误。而应用多尺寸感受野的模型可以从多个尺寸提取冬枣果面缺陷特征,因此对果面上存在不同尺寸缺陷的冬枣分类无误。

3.3 不同注意力模块对模型性能的影响

为了分析应用空间注意力机制对模型定位冬枣果面缺陷精度的影响,本研究对MobileNetV3-SSD使用不同注意力模块进行比较试验。试验结果(表3)表明,当注意力模块由SE更换为SAM后,模型对正常冬枣、虫蛀冬枣、轮纹冬枣和木质化冬枣的AP分別提升了2.63、2.27、3.34、3.18个百分点,mAP提升了2.85个百分点。同时由于删减掉CBAM中属于通道注意力机制的CAM,仅将SAM引入模型,模型计算量降低了42.58%,FPS提升了3.70%。

模型对正常冬枣的AP提升的原因是正常冬枣的果面特征单一且分布规律,易被模型定位,因此SAM可提高模型定位正常冬枣的精度。

如图10所示,应用通道注意力模块的模型无法定位轮纹特征,导致轮纹冬枣定位不准确。而应用空间注意力模块的模型具备定位轮纹特征的能力,因此对轮纹冬枣定位无误。

3.4 不同改进组合对模型性能的影响

本研究分别从主干网络、感受野尺寸以及注意力模块3个方面对SSD进行改进。SSD为表4中的模型1。在上述试验中不同改进单独与SSD的组合分别记作表4中的模型2至模型4。如表5所示,模型1~模型4 4个模型的性能较好,为了分析所有改进与SSD组合对模型的影响,本研究将所有改进与SSD组成的模型记作模型5,并与其他4个模型进行性能比较试验。

由表5可知,模型5表现出众,该模型以MobileNetV3为主干网络,同时引入改进RFB并选择SAM取代SE完成组合。在实时性上,模型5的FPS达40.85,仅与检测速度最快的模型4相差1.98。在精准性上,模型5的mAP位列各模型之首,达到91.89%。模型5有效平衡了模型的实时性与精准性之间的关系,足见所有改进共同作用的有效性,因此本研究将表现最优的模型5作为本研究提出的冬枣果面缺陷实时检测模型。

图11为本研究模型在测试集上的表现。

3.5 本研究模型与目前先进目标检测网络性能对比

为了分析本研究模型的性能,本研究将所提出的模型与目前先进的目标检测网络RetinaNet和EfficientDet-D0在果面缺陷冬枣数据集上进行比较试验。为保证比较试验的可靠性,2种比较模型均按本研究模型训练方式进行训练。由表6可知,本研究模型的mAP和FPS均排在首位,其中比EfficientDet-D0的mAP和FPS分别高出3.65个百分点和7.15。经分析,EfficientDet-D0采用双向特征金字塔网络(BiFPN)结合特征加权策略,这有利于模型重视与冬枣果面缺陷尺寸相符的特征,忽略冗余特征,EfficientDet-D0的性能略优于RetinaNet[27]。

从图12可知,各模型在训练过程中收敛迅速,且验证损失均在第70次训练中便趋于稳定,这得益于迁移学习策略和Adam优化器的应用。同时由于训练中使用冻结训练策略,各模型训练趋于稳定时验证损失与训练损失相近,第100次训练的验证损失均低于训练损失,未出现过拟合现象。

4 结论

本研究针对实时检测在果面缺陷冬枣分拣中的重要性以及果面缺陷尺寸不一、分布随机影响检测精度的问题,对SSD进行改进:SSD通过搭配MobileNetV3,从检测速度方面提高本研究模型的实时性;SSD通过引入改进RFB和SAM从分类和定位两方面提高本研究模型的精准性。通过对比试验,本研究模型的有效性得到验证,mAP达到91.89%,FPS达到40.85。在组合不同改进的模型中,本研究模型平衡实时性和精准性的能力最强。在与目前先进目标检测网络模型的对比中,本研究模型比EfficientDet-D0的mAP和FPS分别高出3.65个百分点和7.15,比RetinaNet的mAP和FPS分别高出4.52个百分点和12.75 。因此本研究模型可以为果面缺陷冬枣实时检测提供技术支持。经实测,本研究模型 1 h分拣量可达4 t。

参考文献:

[1] 王春焕,王 莹,张梦辉. 大荔县冬枣产业发展建议[J].陕西林业科技,2021,49(2):97-99.

[2] 侯鹏帅,刘玉乐,宋 欣,等. 基于智能视觉识别的冬枣分选检测系统设计[J].中国农机化学报,2020,41(3):109-114.

[3] GENG L,XU W,ZHANG F,et al. Dried jujube classification based on a double branch deep fusion convolution neural network[J].Japanese Society for Food Science and Technology,2018,24(6):1007-1015.

[4] NTURAMBIRWE J F I, OPARA U L. Machine learning applications to non-destructive defect detection in horticultural products[J].Biosystems Engineering,2020,189:60-83.

[5] BHARGAVA A, BANSAL A. Fruits and vegetables quality evaluation using computer vision: a review[J].Journal of King Saud University-Computer and Information Sciences,2021,33(3):243-257.

[6] LU Y, LU R. Development of a multispectral structured illumination reflectance imaging (SIRI) system and its application to bruise detection of apples[J].Transactions of the ASABE,2017,60(4):1379-1389.

[7] 孫世鹏,彭 俊,李 瑞,等. 基于近红外高光谱图像的冬枣损伤早期检测[J].食品科学,2017,38(2):301-305.

[8] JU J, ZHENG H, XU X,et al. Classification of jujube defects in small data sets based on transfer learning[DB/OL].(2021-01-30)[2022-01-15].https://link.springer.com/article/10.1007/s00521-021-05715-2.

[9] 薛 勇,王立扬,张 瑜,等. 基于GoogLeNet深度迁移学习的苹果缺陷检测方法[J].农业机械学报,2020,51(7):30-35.

[10]费琦琪,施 杰,夏 敏,等. 基于CNN的冰糖橙分级系统[J].江苏农业学报,2020,36(2):513-519.

[11]李小占,马本学,喻国威,等. 基于深度学习与图像处理的哈密瓜表面缺陷检测[J].农业工程学报,2021,37(1):223-232.

[12]LIU W, ANGUELOV D, ERHAN D, et al.SSD: single shot multibox detector[M]. Amsterdam,The Netherlands:Proceedings of the European Conference on Computer Vision,2016.

[13]徐先峰,赵万福,邹浩泉,等. 基于MobileNet-SSD的安全帽佩戴检测方法[J].计算机工程,2021,47(10):298-305,313.

[14]HOWARD A, SANDLER M, CHU G, et al. Searching for mobilenetv3[M]. Soual,Korea:International Conference on Computer Vision,2019.

[15]CHOLLET F. Xception: deep learning with depthwise separable convolutions[M]. Hawaii,United States:Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2017.

[16]黄林生,罗耀武,杨小冬,等. 基于注意力机制和多尺度残差网络的农作物病害识别[J].农业机械学报,2021,52(10):264-271.

[17]王春山,周 冀,吴华瑞,等. 改进Multi-scale ResNet的蔬菜叶部病害识别[J].农业工程学报,2020,36(20):209-217.

[18]LIU S, HUANG D, WANG Y. Receptive field block net for accurate and fast object detection[M]. Munich,Germany:Proceedings of the European Conference on Computer Vision,2018.

[19]WANDELL B, WINAWER J. Computational neuroimaging and population receptive fields[J].Trends in Cognitive Sciences,2015,19(6):349-357.

[20]HU J, SHEN L, SUN G, et al. Squeeze-and-excitation networks[M]. Salt Lake City,United States:Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2018.

[21]高钦泉,黄炳城,刘文哲,等. 基于改进CenterNet的竹条表面缺陷检测方法[J].计算机应用,2021,41(7):1933-1938.

[22]WOO S, PARK J, LEE J, et al. CBAM: convolutional block attention module[M]. Munich,Germany:Proceedings of the European Conference on Computer Vision,2018.

[23]CHEN L, ZHANG H, XIAO J, et al. SCA-CNN: spatial and channel-wise attention in convolutional networks for image captioning[M]. Hawaii,United States:Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2017.

[24]ZAGORUYKO S, KOMODAKIS N. Paying more attention to attention: improving the performance of convolutional neural networks via attention transfer[M]. Paris,France:International Conference on Learning Representations,2017.

[25]TSUCHIYA H, FUKUI S, IWAHORI Y, et al. A method of data augmentation for classifying road damage considering influence on classification accuracy[J].Procedia Computer Science,2019,159:1449-1458.

[26]余小東,杨孟辑,张海清,等. 基于迁移学习的农作物病虫害检测方法研究与应用[J].农业机械学报,2020,51(10):252-258.

[27]TAN M , PANG R , LE Q V. EfficientDet: scalable and efficient object detection[M]. Virtual:Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2020.

(责任编辑:陈海霞)

2707500783266

猜你喜欢

冬枣
陕西大荔县: “摇钱树”上挂满“金蛋蛋”
我爱家乡的冬枣
冬枣时节
冬枣深加工 延伸产业链
冬枣好吃但不要吃多
设施冬枣大有可为
好冬枣 吃起来
冬枣生物保鲜技术探究
鲜吃冬枣保肝护心
快乐采摘行