APP下载

基于卷积神经网络的家具木材图像种类识别*

2023-10-19苗宇杰祝诗平李俊贤马羚凯

林业科学 2023年8期
关键词:蜡油木材卷积

苗宇杰 祝诗平 普 京 李俊贤 马羚凯 黄 华

(西南大学工程技术学院 重庆 400716)

家具是日常工作和生活中的必备物品,且随着人们生活水平不断提高和居住环境逐渐改善,人们越来越倾向购买实木家具。涂饰木蜡油不仅可以滋养木材,防止木材开裂,增强木材表面硬度、光泽度和耐磨性,防水防污,对木材起到良好的防护和装饰作用(赵畅等,2016),而且也使得木材纹理能够更加完美地展示出来。然而,木材品种繁多、价格相差悬殊,经木蜡油涂饰后的木材表面与一些昂贵木材类似(陈宏伟等,2021),导致实木家具市场上经常出现以假乱真、以次充好的现象,严重损坏消费者利益。

传统木材种类识别主要通过肉眼或借助放大镜(10 倍)进行观察,还可通过年轮、木射线和髓心的形态做出判断,同时分析木材的物理特征,如颜色、质量和气味等(Wheeleret al.,1998),该方法主观性强,且费时、费力、效率低。在木材种类自动化识别领域中,一些学者基于木材显微图像展开研究,如Martins 等(2013)提出一种基于图像分割和多特征集的分类方法,用于识别数据库中112 种木材显微图像。也有一些学者基于光谱展开探索,如Nisgoski 等(2017)应用人工神经网络对近红外光谱不同波段进行检测,实现了对4 种木材的分类识别;Zhao 等(2016) 提出一种基于木材表面光谱特征的木材识别方案,对东北地区5种常见木材进行分类,准确率达95%。基于显微图像和光谱的识别技术,虽然取得了不错效果,但是设备昂贵、操作复杂,尤其在制作显微切片时会损坏木材,因此,这些方法更适合用于实验室分析,实际生活中对成品家具木材的种类识别并不合适。

近年来,基于宏观图像的木材种类识别,因其灵活性和可操作性受到越来越多关注,很多学者通过提取木材颜色特征(Zhao,2013)或纹理特征(Barmpoutiset al.,2018)识别木材种类。Souza 等(2020)在实验室利用砂纸打磨木材表面并使用Zeiss Discovery V 12 显微镜获取46 种放大10 倍的高分辨率(150 dpi)图像,提取图像局部二值模式(local binary patterns,LBP)纹理特征,通过支持向量机(support vector machine,SVM)分类器识别木材,准确率达97.67%。

上述方法提取木材特征均需人工完成,图像预处理和特征选择会消耗大量时间,而以卷积神经网络(convolutional neural networks,CNN)为代表的深度学习方法可自动提取特征并进行概率预测,目前已在图像识别、自然语言处理和文本分析等方面取得了不错效果;但CNN 需要大量的标记样本进行训练以及强大的图像处理器(graphics processing unit,GPU)加速学习(Hanet al.,2018),且复杂的CNN 深层网络还要花费大量时间调参。无论是训练一个大的网络模型还是收集大量数据都是一个耗时的过程,而迁移学习可以很好解决上述问题。在农业领域,已有很多学者将CNN 用于诸多方面(李鑫然等,2021;鲍烈等,2020),结果表明CNN 能够提供更好的性能,优于传统机器学习方法。

也有不少学者将CNN 用于木材缺陷检测(崔明光,2019;刘英等,2019;陈龙现等,2018)以及木材微观图像的种类识别(Heet al.,2020;Geuset al.,2020;李楠,2018),但基于木材宏观图像的种类识别研究还较少,尤其是经木蜡油涂饰后的家具木材种类识别未见报道。鉴于此,本研究基于AlexNet、ResNet34、MobileNetv2和MobileNetv3 这4 种比较成熟的CNN 对木材宏观图像的种类进行识别,与SVM 和人工神经网络(artificial neural network,ANN)识别结果进行比较,分析不同模型性能以及涂饰木蜡油后木材数据对模型性能的影响,并选择识别效果最好的模型设计木材宏观图像种类识别系统,有效提高木材种类识别速度和精度,以期为木材资源的合理利用、木材进出口贸易管理及消费者确定家具木材种类提供一种科学有效的方法。

1 材料与预处理

1.1 图像采集

图1a-d 为2020 年11 月21 日于重庆市九龙坡某家具厂拍摄,主要采集木材径切面和弦切面,未涂饰木蜡油木材(以下统称素材)红橡(Quercusspp.)、水曲柳(Fraxinus mandshurica)、榄仁木(Terminaliaspp.)和栾叶苏(Hymenaea cunrbaril)图像共2 914 张。于重庆北碚某家具卖场拍摄的涂饰木蜡油红橡和榄仁木图像(图1e、f)共966 张。

图1 木材图像示例Fig. 1 Examples of wood image

1.2 图像预处理

神经网络需要固定维度的图像,故所有图像调整为224 像素×224 像素×3 通道。各类别图像数据如表1所示。将RGB 图像转化为灰度图像,提取图像的LBP 和灰度共生矩阵(gray level co-occurrence matrix,GLCM)纹理特征,采用主成分分析(principal component analysis,PCA)对特征数据降维,获取99.9%的有效特征信息,特征由272 维降至44 维,建立木材图像特征数据库,作为SVM(核函数为径向基函数)和结构为44-100-4(输入层为44 个神经元、隐含层为100 个神经元、输出层为4 个神经元)ANN 的输入数据。

表1 不同木材图像数据数量Tab. 1 Number of different wood image data

2 试验方法

2.1 试验环境

硬件环境为Intel(R)Core(TM)i5-10200H CPU,主频2.40 GHz, 运行内存 16 G, GPU 为 GeForce GTX1650Ti,显存4 G。软件环境为CUDA Toolkit 10.0, CUDNN V7.4.1.5;Python 3.7.1;Torch1.9.0;使用PyTorch 深度学习框架在PyCharm 平台上构建模型。PyTorch 是一个高层神经网络API,提供各种激活函数、损失函数和优化器,可快速构建神经网络模型,操作简单,易于调试。

2.2 图像分类方法

卷积神经网络(CNN)是深度学习的代表算法之一,其通过权值共享与局部进行连接,可降低网络模型复杂度。目前,CNN 已在图像识别、自然语言处理等方面取得了成功,并陆续出现AlexNet、ResNet34、MobileNetV2 和MobileNetV3 等多种经典卷积神经网络架构。

AlexNet(Krizhevskyet al.,2012)是计算机视觉领域首个被广泛关注的深度卷积神经网络模型,为LeNet 网络的进阶版,主要由5 个卷积层和3 个全连接层组成,还包括局部响应归一化层Dropout 层。

ResNet34(Heet al.,2016)是由34 个卷积层组成的深度神经网络模型,包括32 个卷积层和2 个全连接层。与传统深度网络结构不同,ResNet34 利用残差学习思想,可训练更深的网络结构,同时避免梯度消失问题,能够极大提高训练效率和模型性能。

MobileNetV2(Sandleret al.,2018)引入deep-wise卷积替代ResNet34 的标准卷积方式,可大大减少卷积核的冗余表达,相较传统深度神经网络,具有更小的模型大小和更快的推理速度,同时保持较高的准确率。

MobileNetV3(Howardet al.,2020)在MobileNetV2的基础上引入注意力机制,通过该机制,网络可以学习使用全局信息选择性地强调信息性特征、抑制不太有用的特征,且引入能有效改进网络精度的h-swish激活函数(Howardet al.,2020):

另外,在网络末端使用平均池化操作更改计算量大的层,降低计算量的同时不造成精度损失。MobileNetV3 的基本网络结构单元(Howardet al., 2020)如图2 所示。

图2 MobileNetV3 bneck 结构Fig. 2 Structure of MobileNetV3 bneck

2.3 迁移学习

在木材种类图像识别领域,难以获取大规模数据集,CNN 模型在大型图像数据集ImageNet 上得到充分训练,拥有较好的图像分类识别能力(张瑞青等,2020)。本研究基于迁移学习,利用AlexNet、ResNet34、MobileNetV2 和MobileNetV3 预训练模型在ImageNet数据集上学到的大量知识,用于优化木材种类图像识别问题。

神经网络迁移学习主要有2 个应用场景:特征提取和参数迁移(吴茂贵等,2019)。特征提取指在经ImageNet 数据集训练好的网络模型上,修改或添加1个新分类器,新任务训练过程中,只训练新分类器,网络参数未进行训练,故训练速度较快,但识别精度较低。参数迁移则指在新任务训练过程中,对网络参数和分类器均进行训练。经ImageNet 数据集训练好的网络模型,针对多分类问题已经可以达到较高的识别准确率,所以使用自己的数据集通过训练调整网络模型的特征参数,能够很快适应新分类任务并获得较好的识别效果。本研究采用ImageNet 数据集训练好的多分类网络模型,并将模型最后一个分类器输出改为4,使用家具木材数据对网络模型进行训练,在训练过程中优化网络特征参数和分类器,以更好适应家具木材种类识别问题。

2.4 模型评价指标

对样本进行测试后分别计算精度(Precision)和召回率(Recall),以综合指标F1 得分作为精度和召回率的评估值,其中平均准确率=分类正确的数量/测试总数量,其他指标计算公式(Fabijańskaet al.,2021)如下:

式中:TP 为真阳性样本数量;FP 为假阳性数量;FN 为假阴性样本数量。

3 模型训练与结果分析

3.1 基于素材数据的最优分类模型确定

采用 AlexNet、 ResNet34、 MobileNetV2 和MobileNetV3 对素材图像进行建模,并将素材数据集按6∶2∶2 分为训练集、验证集和测试集。提取素材图像的LBP 和GLCM 纹理特征,经PCA 降维后,使用SVM 和ANN 进行分类。各模型分类结果如表2 所示。

表2 基于素材图像的不同网络模型学习结果Tab. 2 Learning results of different network models based on wood images coated without wood wax oil

结果显示,SVM 和ANN 的训练速度快于卷积神经网络,但其准确率均未超过80%。Souza 等(2020)采用立体显微镜得到放大10 倍的高分辨率木材宏观图像,能够获取更为细微的木材纹理信息,识别准确率较高。在深度学习网络模型中,AlexNet 训练速度最快,一次迭代时间仅21.69 s,但验证集准确率相对较低(82.61%),且模型较大(217 M)。ResNet34 的验证集准确率最高(90.45%),但训练时间较久,一次迭代用时74.13 s。MobileNetV2 与MobileNetV3 的训练时间较接近,其中MobileNetV3 的验证集准确率更高(89.25%),且模型较小,方便后期布置到嵌入式设备中。综合考虑准确率和训练时间,本研究选择MobileNetV3 作为识别模型,并在此基础上进行迁移学习和参数优化。

3.2 素材数据的建模与优化

基于素材图像的MobileNetV3 结构不同参数训练及验证结果如表3 所示,在试验1-12 中,将2 914 张素材图像数据按6∶2∶2 和2∶6∶2 分为训练集、验证集和测试集,对训练集数据进行扩充,并基于迁移学习优化模型。为验证迁移学习下数据集扩充对模型的影响,在试验13-18 中未对训练集进行扩充,将模型学习率分别设为0.01、0.001 与0.000 1 进行训练。不同学习率下2 种学习方式的验证集准确率与训练损失如图3 所示。

3.2.1 学习率对模型的影响 由表3 和图3 可知,学习率对各模型训练结果具有较大影响。试验9 中,学习率为0.000 1,基于迁移学习,模型识别准确率最高、训练损失最小、性能最优。在全新学习方式下,学习率为0.01 时,试验1 和4 的训练损失和验证集准确率均未得到有效收敛,且震荡幅度较大;学习率为0.000 1时,模型验证集准确率最低,较小的学习率容易使模型在训练过程中陷入局部最优;学习率为0.001 时,试验2 模型识别准确率最高达89.25%。在迁移学习方式下,随着学习率降低,模型验证集准确率反而升高。

3.2.2 迁移学习对模型的影响 在迁移学习方式下,因加载了预训练模型,模型前端各层网络均可获得较好的训练参数,模型刚开始训练时就能得到较好的训练结果。由图3 可知,迁移学习对加速网络收敛和提高验证集准确率均有明显促进作用。在全新学习方式下,试验3 学习率为0.000 1 时,训练初始阶段验证集准确率仅25%,训练损失0.92。经约100 个epoch后,训练损失得到收敛。在迁移学习方式下,试验9模型训练之初就已得到较低的损失值和较高的识别准确率,且网络收敛迅速,经5 个epoch 后,模型平均准确率达到峰值。

3.2.3 数据扩充对模型的影响 由表3 和图3 可知,数据扩充对模型训练结果具有较大影响。在全新学方式下,按照不同比例划分数据集,训练集包含数据集越多模型识别准确率越高,网络收敛效果越好。在试验1-6 中,按照6∶2∶2 划分数据集的模型识别效果较好,验证集准确率和训练损失均有效收敛。在试验7-12 中,按照不同比例划分数据集,并进行迁移学习。按照6∶2∶2 划分数据集,试验9 的识别效果最好,识别准确率达98.13%。在试验13-18 中,按照不同比例划分数据集,但未对训练集进行数据扩充,与试验7-12 相比,训练速度得到有效提升,但验证集准确率有所下降。在试验15 中,验证集准确率为96.56%,与试验9 相比,准确率降低1.57%。按照2∶6∶2 划分数据集,验证集识别准确率均较低。在迁移学习中,训练集数据量对识别准确率有较大影响,训练集数据量越多模型识别效果越好。

3.3 素材及涂饰木蜡油木材总数据的建模分析

为验证涂饰木蜡油木材图像对模型识别性能的影响,将涂饰木蜡油的红橡和榄仁木与素材红橡和榄仁木按1∶1 分别混合,并与剩下的2 种素材图像共同组成新的数据集。为避免因训练集数量改变对识别结果的影响,该数据集与未涂饰木蜡油时的数据一样,其中涂饰木蜡油的红橡和榄仁木均为362 张。将该数据集按6∶2∶2 分为训练集、验证集和测试集,并对训练集进行扩充。选用学习率为0.000 1 的MobileNetV3 网络模型,将涂饰木蜡油的木材图像与素材图像数据混合在一起进行训练,并进行迁移学习。结果(表4)表明,混有涂饰木蜡油的木材图像数据,在验证集上的准确率为97.25%,仅降低0.88%,模型识别准确率未有较大影响,准确率仍很高,且可准确识别出涂饰木蜡油的木材。

表4 不同数据类型的试验结果对比Tab. 4 Comparison of experimental results with different data types

3.4 模型检验

使用经迁移学习、学习率为0.000 1 训练得到的模型对混有涂饰木蜡油的木材图像测试集进行分类识别,通过混淆矩阵计算得到准确率、召回率和F1。由表5 可知,该模型对4 种家具木材分类的平均准确率为94.16%,准确率较高。分类性能(按F1 得分)从高到底依次为榄仁木、红橡、水曲柳、栾叶苏。由混淆矩阵可知,栾叶苏和水曲柳识别错误较多,主要是因为2 种木材在不同位置时颜色和纹理有些类似,低分辨率图像下较难区分。

表5 模型的混淆矩阵与分类性能Tab. 5 Confusion matrix and classification performance of model

为便于操作,应用Python 语言将脚本程序开发为图形用户界面。本研究采用2 种图像获取方式,一是调用OpenCV 摄像头拍照获取图像数据,二是利用PyQt5 的文件选择功能选择本地图像文件。载入图像后,在组件中显示,即可进行识别,使用训练好的网络模型进行检测。选择一张素材中的红橡木材图像进行检测,识别概率为100%,如图4a 所示;再选一张涂饰木蜡油的红橡木材图像进行检测,识别概率也为100%,如图4b 所示。

图4 可视化界面检测结果Fig. 4 Visual interface detection results

4 结论

1) 为快速识别常见家具木材图像种类,本研究对AlexNet、 ResNet34、 MobileNetV2 和MobileNetV3经典卷积神经网络与SVM 和ANN 传统机器学习模型进行建模分析。综合考虑模型性能,选用MobileNetV3 并基于迁移学习提出一种木材图像种类识别模型,该模型对素材的识别准确率达98.13%,为木材图像种类的自动识别提供了一种技术手段。但本研究只对4 种木材图像进行研究,种类相对较少,后续研究应补充木材种类获得更多的木材类别。

2) 本研究对混有涂饰木蜡油的木材数据进行训练并进行迁移学习,结果发现在素材中混入涂饰木蜡油的木材图像进行训练,验证集准确率为97.25%,对网络模型影响较小,验证集准确率仅降低0.88%,能够准确识别素材材种以及涂饰木蜡油的木材材种,这为木材加工过程中的工作人员以及购买实木家具的消费者确定木材种类、防止上当受骗提供了可能。

本研究模型在材种识别过程中仅适用于木材纹理清晰的图像,对涂饰封闭性油漆的家具木材图像并不能有效识别,因此对不同涂饰情况下的家具木材图像识别仍需进一步探索。

猜你喜欢

蜡油木材卷积
常减压装置蜡油热供系统改造研究与应用
橘子皮用来开发透明木材
基于3D-Winograd的快速卷积算法设计及FPGA实现
数字说
木材在未来建筑设计中的应用分析
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
原料加氢预处理对催化装置的影响
焦化蜡油络合脱氮-催化裂化优化加工工艺技术