APP下载

一种基于GoogLeNet卷积神经网络的木节缺陷识别方法

2021-08-23高明宇倪海明张博洋陈剑峰戚大伟牟洪波

森林工程 2021年4期
关键词:卷积神经网络

高明宇 倪海明 张博洋 陈剑峰 戚大伟 牟洪波

摘 要:为了能够对木节缺陷进行准确识别,减少木材的浪费,本研究在Pytorch深度学习框架的基础上,提出一种基于GoogLeNet卷积神经网络的木节缺陷识别方法。该方法利用GoogLeNet网络对朽节、干节和死节等7种云杉木节缺陷的RGB图像进行自动提取特征,不需要对图像进行预处理,即可实现分类识别,采用全局平均池化的方法来代替全连接层,减少网络的参量。同时为了防止网络的过拟合,在网络中使用Dropout机制。实验结果表明,利用该卷积神经网络对7种木节缺陷的识别率可以达到95.42%,在木节缺陷图像處理中,GoogLeNet模型能准确有效地识别木节缺陷。

关键词:卷积神经网络;GoogLeNet;木节缺陷图像;缺陷识别

中图分类号:S781.1; TP312    文献标识码:A   文章编号:1006-8023(2021)04-0066-05

A Method for Recognizing Wood Knots Defects Based on GoogLeNet

Convolutional Neural Network

GAO Mingyu, NI Haiming, ZHANG Boyang, CHEN Jianfeng, QI Dawei* , MU Hongbo*

(College of Science, Northeast Forestry University, Harbin 150040, China)

Abstract:In order to recognize the knots accurately and reduce the waste of wood, a method of recognizing the knots based on GoogLeNet convolution neural network based on the deep learning framework of Pytorch was proposed in this paper. This method used GoogLeNet network to extract features automatically from RGB images of seven kinds of spruce knots, such as decayed knots, dry knots and encased knots et al, so that classification and recognition can be realized without image preprocessing. Global average pooling was used to replace the fully connected layer, and the network parameters can be reduced. At the same time, in order to prevent over-fitting, Dropout mechanism was used in the network. The experimental results showed that, the recognition accuracy of seven kinds of knot defects using the convolutional neural network can reach 95.42%, and the GoogLeNet can identify the knots accurately and effectively in the image processing of wood knot defects.

Keywords:Convolutional neural network; GoogLeNet; wood knot defect image; defect recognition

收稿日期:2021-03-12

基金项目:中央高校基本科研业务费专项资金资助项目(2572020BC07);国家自然科学基金项目(31570712)

第一作者简介:高明宇,硕士研究生。研究方向为图像处理与模式识别。E-mail: gmy0523@foxmail.com

*通信作者:戚大伟,博士,教授。研究方向为生物图像信息处理与识别。E-mail: qidw9806@126.com

*并列通信作者:牟洪波,博士,副教授。研究方向为生物图像信息处理与识别。E-mail: mhb-506@163.com

引文格式:高明宇,倪海明,张博洋,等. 一种基于GoogLeNet卷积神经网络的木节缺陷识别方法[J].森林工程,2021,37(4):66-70.

GAO M Y, NI H W, ZHANG B Y, et al. A method for recognizing wood knots defects based on GoogLeNet convolutional neural network [J]. Forest Engineering,2021,37(4):66-70.

0 引言

森林资源作为地球生态的一部分,具有不可替代性[1]。木材缺陷的分类识别对于有效降低森林资源的消耗,提高木材加工业的自动化水平具有潜在的意义。

数字图像处理与人工智能算法相结合是木节缺陷检测与分类的常用方法。在深度学习被广泛使用之前,基于固定特征提取的分类识别技术一直受到广泛的应用。这些方法主要有Hu不变矩(Hu moment invariants)[2]、梯度直方图特征 (Histogram of Oriented Gradient,HOG)[3-4]、局部二值特征(Local Binary Pattern,LBP)[4]、灰度共生矩阵(Gray-level Co-occurrence Matrix,GLCM)[5]和尺度不变特征(Scale-invariant feature transform,SIFT)[6]等。尽管这些方法在计算机硬件性能不强的情况下,具有精准度高、资源利用率低等优点,但是这些方法通常需要人为的方式进行设计和提取,大大降低了识别的效率,不利于将成果向实际应用转化。卷积神经网络由于其具有自学习的能力,可以通过大量的数据进行训练,从而自动提取到图像中的特征。同时由于当前计算机硬件的提升,卷积神经网络可以更快速地进行训练,极大地提高了自动化识别的效率。

因此,本研究提出了一种基于Pytorch网络框架和GoogLeNet卷积神经网络的木节识别方法,以朽节(decayed knot)、干节(dry knot)、边节(edge knot)、死节(encased knot)、尖节(horn knot)、叶节(leaf knot)和健全节(sound knot)的图像作为数据集,对7种木节进行自动识别分类研究。

1 图像数据采集和处理

1.1 图像数据采集

实验数据集由芬兰奥卢大学电机系计算机实验室提供[7-9],数据集中包括朽节、干节、边节、死节、尖节、叶节和健全节,其中木节缺陷的RGB图像共3 136个,具体木节缺陷图片信息见表1。

1.2 图像预处理

由于所获取的木节图像的分辨率不同,同时为了计算机的CPU计算速度和显卡的可承受数据量,需要对数据集的图像统一缩小为85×85像素。木节缺陷数据集按6∶2∶2的比例分为训练集、验证集和测试集,分别包括1 885幅训练图像、636幅验证图像和615幅测试图像。

2 网络结构及训练

2.1 GoogLeNet

GoogLeNet是谷歌公司在2014年提出的一种深度学习结构[10]。为了解决之前的网络(如AlexNet等)由于网络层数增加而导致的过拟合、梯度消失和梯度爆炸等问题,GoogLeNet采用了一种全新的Inception结构,可以更高效地利用计算资源,在相同的计算量下能提取到更多的特征,从而提升训练结果。本文采用GoogLeNet网络,实现对7种木节缺陷图像的分类识别。

表2给出了GoogLeNet的网络结构和参数。木节缺陷图像输入网络后,首先经过卷积层、最大池化层和Inception层后,可以提取出图像的特征,通过训练,特征图被压缩成一维向量,最后使用softmax函数进行分类。

2.2 激活函数

为了实现网络的非线性化,本实验采用了收敛速度快、求梯度简单的ReLU (Rectified Linear Unit)激活函数[11-13],公式为:

f(x)=max(0,x)。(1)

式中:x为输入。

与传统的激活函数相比,ReLU在梯度下降和反向传播上具有更高的效率。ReLU是非饱和激活函数,因此当数值过大或过小时,导数不会接近于0,可以避免梯度消失。同时,由于小于0部分为0,大于0部分才有值,所以可以减少过拟合。

2.3 优化算法

Adam是一种基于训练数据的迭代更新神经网络权重的一阶优化算法,用来替代传统随机梯度下降(SGD)过程。Adam算法计算效率高,对内存的需求少,超参数通常不需要较大的调整,非常适合数据或参数较大的问题[14-18]。

2.4 损失函数

损失函数(loss function)或代价函数(cost function)是用来估计模型的预测值与真实值的不一致程度的函数,它是一个非负实值函数[19-20]。本文采用交叉熵函数作为本实验的损失函数,公式为:

C=-1n∑x[ylna+(1-y)ln(1-a)] 。 (2)

式中:C为Loss函数;n为样本数;x为输入;y为期望的输出;a=σ(z);z=∑ωjxj+b,z为神经元输出,ω为网络权重,b为网络偏置。

2.5 实验环境

本实验在Windows 10操作系统、16 G运行内存的环境下,使用Python语言,并基于Pytorch深度学习框架进行深度学习训练。本文的实验环境见表3。

2.6 评价指标

为了评价GoogLeNet的性能,在测试集结果中设定了准确率(Acc)作为模型的评价指标(混淆矩阵见表4)。评价指标定义为:

Acc=TP+TNTP+FN+TN。 (3)

式中:Acc为准确率;TP为将正样本预测为正样本;FP为将负样本预测为正样本;FN为将正样本预测为负样本;TN为将负样本预测为负样本。

3 结果及分析

实验的结果如图1所示。其中,图1(a)表示训练结果,图1(b)表示测试结果。横坐标代表迭代次数,纵坐标代表准确率。经过300次的迭代训练,训练集的损失值约为0.20,验证集的准确率为98.28%。

经计算,GoogLeNet在测试集的Acc为95.42%,从而看出,GoogLeNet在木节缺陷识别方面具有较高的准确率,这意味着GoogLeNet可以准确快速地识别收集到的木节缺陷。

优化算法对模型的性能至关重要。本文采用Adam优化算法对GoogLeNet网络进行了训练,并将其与SGD(随机梯度下降)和Adagrad进行了比较。图2为这3种优化算法的训练过程,其学习率为3×10-4。结果表明,采用Adam算法的模型具有最快的收敛速度。从图2的损失曲线可以看出,Adam算法收敛速度快,Adam和Adamax具有相近的收敛速度和识准确率,但是Adamax的识别性能和Adam比仍有一定的差距,同时Adam比SGD和Adagrad算法具有更强的稳定性。

图3为在实际应用中的识别结果。其中方框中为识别的缺陷,旁边为识别种类和概率。由图3可以看出,本文的方法(GoogLeNet)具有较好的准确率,因此在木节缺陷识别方面具有一定的实用价值。

4 結论

本文基于Pytorch网络框架,提出了一种基于GoogLeNet卷积神经网络的木节缺陷图像识别方法。通过GoogLeNet网络提取木节缺陷图像特征,减少了人工提取特征所需的时间,与传统的需要人工提取特征的神经网络模型相比,本方法在木节缺陷数据集上可以达到较高的识别精度。基于以上分析,GoogLeNet在木材无损检测和缺陷识别方面具有潜在的应用价值。

【参 考 文 献】

[1]刘旭升,张晓丽.森林植被遥感分类研究进展与对策[J].林业资源管理,2004,33(1):61-64.

LIU X S, ZHANG X L. Research advances and countermeasures of remote sensing classification of forest vegetation[J]. Forest Resources Management, 2004, 33(1): 61-64.

[2]MU H B, QI D W. Pattern recognition of wood defects types based on hu invariant moments[C]//2009 2nd International Congress on Image and Signal Processing. October 17-19, 2009, Tianjin, China. IEEE, 2009: 1-5.

[3]DALAL N, TRIGGS B. Histograms of oriented gradients for human detection[C]//2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR05). June 20-25, 2005, San Diego, CA, USA. IEEE, 2005: 886-893.

[4]WANG X Y, HAN T X, YAN S C. An HOG-LBP human detector with partial occlusion handling[C]//2009 IEEE 12th International Conference on Computer Vision. September 29 - October 2, 2009, Kyoto, Japan. IEEE, 2009: 32-39.

[5]MOHANAIAH P, SATHYANARAYANA P, GURUKUMAR L. Image texture feature extraction using GLCM approach[J]. International Journal of Scientific & Research Publication, 2013, 3(5): 1-5.

[6]TAREEN S A K, SALEEM Z. A comparative analysis of sift, surf, kaze, akaze, orb, and brisk[C]//2018 International Conference on Computing, Mathematics and Engineering Technologies (iCoMET). March 3-4, 2018, Sukkur, Pakistan. IEEE, 2018: 1-10.

[7]KAUPPINEN H, SILVN O. A color vision approach for grading lumber[C]// The 9th Scandinavian Conference on Image Analysis: Theory and Applications of Image Analysis II. 1995: 367-379.

[8]SILVN O, KAUPPINEN H. Recent developments in wood inspection[J]. International Journal of Pattern Recognition and Artificial Intelligence, 1996, 10(1): 83-95.

[9]KAUPPINEN H, SILVEN O. The effect of illumination variations on color-based wood defect classification[C]//Proceedings of 13th International Conference on Pattern Recognition. August 25-29, 1996, Vienna, Austria. IEEE, 1996: 828-832.

[10]曹富奎,白天,许晓珑.基于公路监控视频的车辆检测和分类[J].计算机系统应用,2020,29(10):267-273.

CAO F K, BAI T, XU X L. Vehicle detection and classification based on highway monitoring video[J]. Computer Systems & Applications, 2020, 29(10): 267-273.

[11]张有健,陈晨,王再见.深度学习算法的激活函数研究[J].无线电通信技术,2021,47(1):115-120.

ZHANG Y J, CHEN C, WANG Z J. Research on activation function of deep learning algorithm[J]. Radio Communications Technology, 2021, 47(1): 115-120.

[12]劉忠伟,戚大伟.基于卷积神经网络的树种识别研究[J].森林工程,2020,36(1):33-38.

LIU Z W, QI D W. Study on tree species identification based on convolution neural network[J]. Forest Engineering, 2020, 36(1):33-38.

[13]李佳欣,赵鹏,方薇,等.基于深度学习的多角度遥感影像云检测方法[J].大气与环境光学学报,2020,15(5):380-392.

LI J X, ZHAO P, FANG W, et al. Cloud detection of multi-angle remote sensing image based on deep learning[J]. Journal of Atmospheric and Environmental Optics, 2020, 15(5): 380-392.

[14]田睿,孟海东.基于Adam优化算法的深度神经网络岩爆预测模型[J].矿业研究与开发,2020,40(11):40-46.

TIAN R, MENG H D. Rockburst prediction model of deep neural network based on Adam optimization algorithm[J]. Mining Research and Development, 2020, 40(11): 40-46.

[15]閆壮壮,闫学慧,石嘉,等.基于深度学习的大豆豆荚类别识别研究[J].作物学报,2020,46(11):1771-1779.

YAN Z Z, YAN X H, SHI J, et al. Classification of soybean pods using deep learning[J]. Acta Agronomica Sinica, 2020, 46(11): 1771-1779.

[16]田佳鹭,邓立国.基于改进VGG16的猴子图像分类方法[J].信息技术与网络安全,2020,39(5):6-11.

TIAN J L, DENG L G. Monkey image classification method based on improved VGG16[J]. Information Technology and Network Security, 2020, 39(5): 6-11.

[17]赖菲,罗廷芳,丁锐,等.图像处理技术在木材表面缺陷检测中的应用[J].林业机械与木工设备,2021,49(2):16-21.

LAI F, LUO Y F, DING R, et al. Application of image processing technology to wood surface defect detection[J]. Forestry Machinery & Woodworking Equipment, 2021, 49(2):16-21.

[18]潘世豪,程玉柱,许正昊,等.基于分形理论的树皮图像特征提取方法[J].林业机械与木工设备,2019,47(2):7-11.

PAN S H, CHENG Y Z, XU Z H, et al. Feature extraction method of bark images based on the fractal theory[J]. Forestry Machinery & Woodworking Equipment, 2019, 47(2):7-11.

[19]赵鹏超,戚大伟.基于卷积神经网络和树叶纹理的树种识别研究[J].森林工程,2018,34(1):56-59.

ZHAO P C, QI D W. Study on tree species identification based on convolution neural network and leaf texture[J]. Forest Engineering, 2018, 34(1): 56-59.

[20]朱泓宇,谢超.基于可逆卷积神经网络的图像超分辨率重建方法[J].林业机械与木工设备,2021,49(3):20-25.

ZHU H Y, XIE C. Image super-resolution reconstruction method based on invertible convolutional neural networks[J]. Forestry Machinery & Woodworking Equipment, 2021, 49(3):20-25.

猜你喜欢

卷积神经网络
基于深度神经网络的微表情识别
卷积神经网络中减少训练样本时间方法研究
卷积神经网络语言模型研究
基于卷积神经网络的车辆检索方法研究
基于卷积神经网络温室智能大棚监控系统的研究
基于深度卷积神经网络的物体识别算法
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现
深度学习技术下的中文微博情感的分析与研究
基于卷积神经网络的树叶识别的算法的研究