基于深度学习的四种阔叶材材种辨识研究＊

2022-11-10杨霄霞高宜生葛浙东刘晓平周玉成

计算机时代 2022年11期

王涛，杨霄霞，高宜生，葛浙东，刘晓平，周玉成

(1.山东建筑大学信息与电气工程学院，山东济南 250101；2.山东建筑大学建筑城规学院)

0 引言

木材辨识技术广泛应用于材种鉴定、木质家具检验、木结构古建筑保护领域[1]。传统的木材辨识方法主要基于木材微观结构特征（显微结构参数）和宏观结构特征（颜色、气味、纹理等）确定木材所属科、属、种。宏观特征识别木材容易取样和观察，但准确率较低[2]；微观解剖特征辨识木材准确性较高，但制作木材切片的周期较长，对检测人员的专业水平要求较高。

图像分割技术或传统的机器学习对木材特征提取困难且复杂耗时，深度学习能自主学习木材特征，更准确、高效地实现木材检测[3-4]。近年来，计算机视觉技术应用到木材辨识中，如木材检测，效率高且成本低[5-6]。刘英等[7]将卷积神经网络应用于木材缺陷检测中，采用非下采样剪切波变换预处理和线性迭代聚类方法对木材缺陷进行分类，辨识准确率为98.6%。刘嘉政[8]等提出的13 层树种图像识别模型，对训练集和测试集的识别正确率分别为96.78%、91.89%，在未参与训练的验证集上取得了96%的平均准确率。KURDTHONGMEE[9]采用SSD MobileNet网络自动检测橡胶树木材横断面图像中的木材髓心，正确率为87.7%，性能优于YOLOv3 目标检测网络。HE 等[10]使用激光扫描仪从600 块红松和樟木中收集木材的节子、裂纹和霉斑缺陷图像数据集，训练并验证改进的DCNN 模型识别木材缺陷准确率为99.13%，检测用时1.12s。HU 等[11]用已标记的木材缺陷、木材纹理和木材类别的四个木材图像数据集训练ResNet18 深度学习网络模型，实现木材缺陷识别与木材分级，准确率最高达到99.5%。本文采用CT 技术采集多张阔叶材微观图像，基于YOLOv3 和SSD 对四种阔叶材导管图像进行分类识别，旨为阔叶材的材种辨识提供一种新的方法和依据。

1 材料与设备

本文阔叶材样本分别为大果紫檀（Pterocarpusmacrocarpus）、刺猬紫檀（Pterocarpus erinaceus）、阔叶黄檀（Dalbergia latifolia）和绒毛黄檀（Dalbergia frutescens var.tomentosa），四种阔叶材分别取自缅甸、非洲、印尼、巴西。样本规格为3mm×3mm×25mm，阔叶材CT 微观图像尺寸为512px×512px，CT 图像的分辨率为2μm，每种阔叶材1000 张微观图像，其中800 张图像作为训练集，200张图像作为测试集。

选择阔叶材微观图像有效区域，根据每个材种管孔的分布和排列特点，进一步选择阔叶材微观特征，如表1 中红、绿色矩形框所示。用LabelImg 软件标记特征后，根据类别赋予拉丁文名标签，生成的xml文件记录微观图像长、宽、高等信息，再将合并的四种阔叶材训练集xml 文件转换成VOC 数据集，用于YOLOv3和SSD训练网络。

表1 四种阔叶材横切面微观结构

本文使用德国布鲁克公司生产的SkyScan1272 型显微CT采集阔叶材微观图像，服务器安装Windows10操作系统，使用NVIDIA Quadro RTX 8000显卡，显存48GB，基于Anaconda 开发环境建立TensorFlow 深度学习框架，并采用Python 开发语言编程，PyCharm编译器调试。

2 方法

2.1 YOLOv3框架

YOLOv3可分为主干特征提取网络和预卷积运算两部分。YOLOv3同时具备高检测速率和高检测精度的优点，通过两次上采样完成多尺度检测，降低颗粒度，改善检测器对于小物体的检测效果[12]。

YOLOv3 选择Darknet53 作为主干特征提取网络[13]，具体如图1 所示。主干特征提取网络的主要功能是提取目标物体的特征，其实也就是不断卷积的过程。然后对输入的图片不断进行下采样的操作，将输入图片的高和宽不断压缩，将通道数不断扩张，从而获得一堆特征层（可表示输入进来的图片的特征）。并且使用残差网络，残差网络容易优化，能够采用增加深度的方法提高准确率。本文内部的残差块使用了跳跃连接，缓解深度神经网络中由深度增加导致的梯度消失问题。

图1 YOLOv3网络结构

然后，选取最后三个特征层，输入到第二部分的预测卷操作，三个特征层的尺寸分别为(52,52,256)、(26,26,512)、(13,13,1024)。本文利用上述三个特征层构建FPN 层，具体方式为将13×13×1024的特征层进行五次卷积运算，将得到的结果分别进行两种处理，一种是在二次卷积后进行分类预测和回归预测，另一种是在进行上采样后将特征层转换为26×26×256，然后与26×26×512 的特征层堆叠对比，其过程与13×13×1024 特征层的卷积运算方法相同。网络结构简单，YOLO网络的识别速度快，又因为检测是以整个图像作为输入，内部数据的联系相对紧密，这样就可以降低对背景的错误识别概率，同时网络的适应性较好，在测试集与训练集内的数据不完全相同时依然有较好的识别效果。

2.2 SSD基本框架

SSD[14]是一种One-stage目标检测算法，利用CNN提取特征后，采用不同尺度和长宽比的函数，对图像不同位置进行均匀密集抽样，同时完成目标检测和分类。

本文将VGG16的FC6和FC7层转化为卷积层，去掉所有的Dropout 层和FC8 层，增加Conv6、Conv7、Conv8 和Conv9，构建的SSD框架是对VGG 网络的修改，如图2所示。

图2 改进的VGG网络

2.3 精确度计算

四种阔叶材图像的辨识正确率指标分别为精确度（Precision）、召回率（Recall）、平均精度（Average Precision，AP）和平均精度均值（mean Average Precision，mAP）。

TP（True Positive）——正类判定为正类的数量；

FP（False Positive）——负类判定为正类的数量；

FN（False Negative）——正类判定为负类的数量；

Precision——样本中被正确判定为正例占预测为正例的比例；

Recall——样本中被正确判定为正例占实际为正例的比例。

深度学习网络框架，通常采用mAP作为精度检测的指标，即先计算每一种阔叶材的平均精度，然后再计算四种阔叶材平均精度的均值。

3 结果与分析

3.1 框架训练

YOLOv3 框架和SSD 框架均训练50 次，学习率设为0.0001，其中前者检测用时为1.185s，后者检测用时为0.608s。YOLOv3 和SSD 框架训练的损失曲线如图3 所示，YOLOv3 框架的Loss 值在1.60 附近收敛，SSD框架的Loss 值在0.48 附近收敛，经过25 次迭代后，YOLOv3、SSD 的损失函数曲线都逐渐收敛，并趋于平稳，验证了数据集设置的合理性。

图3 各框架训练损失

3.2 框架测试

四种阔叶材微观结构差异较大，如大果紫檀具有丰富的晶细胞，刺猬紫檀有单管孔和复管孔，单、复管孔较分散，阔叶黄檀具有直径较小的单管孔，绒毛黄檀同时具有单管孔和复管孔。采用YOLOv3 和SSD框架，选取收敛后趋于平稳的Loss 值识别四种阔叶材材种，评价指标如表2 所示。大果紫檀的平均精度在两种框架中是最高的，可知大果紫檀较其他三种阔叶材微观结构特征更易识别。相比较YOLOv3 框架，SSD框架对四种阔叶材的召回率较高且能够从数据集中检索更多的信息。

表2 各框架阔叶材辨识评价指标

YOLOv3和SSD框架对四种阔叶材的辨识结果如表3所示。YOLOv3框架对四种阔叶材辨识的mAP为91.57%，检测用时为1.185s。SSD 框架对四种阔叶材辨识的mAP 为91.17%，检测用时为0.608s，两者mAP数值相近，YOLOv3 比SSD 框架的mAP 略高，但SSD框架的检测效率更高。

表3 各框架对四种阔叶材的辨识结果

阔叶材的管孔尺寸、形态、分布具有较大差异性，所以本文试验采集四种阔叶材图像，大样本可以保证阔叶材辨识的正确率，使YOLOv3 和SSD 框架得到四种阔叶材较好的辨识效果。YOLOv3的辨识结果得益于残差网络、反卷积和多特征层的思想，更好的提取阔叶材微观图像结构特征，而SSD 网络结构更加简单，利用改进的VGG 网络提取特征，同样得到优秀的结果。SSD 框架物体分类与预测框的回归同时进行[15]，所以检测速度快，但其正、负样本（背景）极其不均衡，是一种均匀的密集采样，导致训练困难。