APP下载

基于改进UNet的轨旁槽盖板状态检测算法

2024-03-09高仁柴晓冬郑树彬李立明戚玮玮

物流科技 2024年3期

高仁 柴晓冬 郑树彬 李立明 戚玮玮

文章编号:1002-3100(2024)03-0044-06

摘  要:针对当前高铁轨旁电缆槽盖板检测方法自动化程度和检查效率低等问题,提出一种基于改进UNet的槽盖板检测模型。在编码部分引入两种不同的残差结构,避免梯度消失等问题,同时融合SA注意力机制,抑制背景干扰,进一步提升槽盖板状态的检测能力。实验结果表明,该算法达到的MPA、MIoU分别为95.03%、90.88%。相较于UNet等其他分割网络,该算法能更好地分割出槽盖板区域。

关键词:槽盖板检测;残差结构;SA注意力机制;UNet

中图分类号:U216    文献标志码:A

DOI:10.13714/j.cnki.1002-3100.2024.03.011

Abstract: Aiming at the problems of low automation and inspection efficiency of current detection methods for trackside cable tray cover plate of high-speed railway, a detection model for tray cover plate based on improved UNet is proposed. In the coding part, two different residual structures are introduced to avoid problems such as gradient disappearance. At the same time, SA attention mechanism is integrated to suppress background interference and further improve the detection ability of slot cover plate status. The experimental results show that the MPA and MIoU achieved by this algorithm are 95.03% and 90.88%. Compared with other segmentation networks such as UNet, this algorithm can segment the slot cover area better.

Key words: slot cover detection; residual structure; SA attention mechanism; UNet

0  引  言

在电务轨旁设备检修任务中,电缆槽盖板的状态检测是一个重要的必检项目。如图1所示,方框内为电缆槽盖板,是一种铺设在轨旁电缆槽沟上的盖板,其主要作用是为了保护槽沟内通信、电力等。图2为不同槽盖板的状态图,图2(a)为正常状态;图2(b)为破损状态;图2(c)为丢失状态。目前,该检测项目主要是采用人工视觉检查的方式,该方式存在检查效率低、受天气影响等问题。部分线路采用了基于机器视觉技术的检测方式,但仍然需要人工参与,自动化程度有待提高。

传统的槽盖板图像检测方法为图像匹配算法。在图像匹配算法中,吕明珠[1]利用圖像处理理论,对印刷品缺陷的形状进行检测研究,结合尺度不变特征变换(SIFT)角点匹配和决策树,对印刷品的缺陷进行分类。刘泽等[2]利用动态的阈值分割算法和缺陷区域提取算法,对钢轨表面掉块、裂痕两类缺陷图像进行处理,准确提取缺陷位置区域。使用传统的图像匹配算法对槽盖板状态进行检测,算法鲁棒性差,受图片质量影响较大。图像匹配时候容易导致误检,形成大量误检图片。近年来,基于深度学习的卷积神经网络在计算机视觉领域取得极高成就[3],产生了许多基于深度学习的图像分割网络。例如全卷积神经网络[4](Fully Convolutional Networks, FCN)是语义分割发展的基础。UNet最初被运用到医学领域的细胞分割,Roy等[5]在UNet的编码解码过程中串联了3个SE模块来抑制背景干扰。Oktay O等[6]提出的Attention U-Net在跳跃连接层特征拼接前加入集成注意力,消除跳跃连接层中的其他干扰编码。Moradi等[7]提出了MFP-UNet,在UNet的上外接特征金字塔网络,再将特征串联,提高了网络分割能力。宫艳晶等[8]提出了融合ResNet的火焰图像分割法,提升了UNet在火焰图像上的准确率。Rahman等[9]提出了一种融合多注意力机制的UNet卷积神经网络,提高了分割的精确度。基于以上研究表明UNet分割网络已经不局限于医疗行业,应用场景十分广阔。

目前在电缆槽盖板状态检测领域,还未应用过基于深度学习的语义分割技术,本文根据电缆槽盖板图片的特征,针对原始UNet网络在样本较少且正负样本不平衡时,易产生过拟合、受到背景和噪声的影响导致特征提取能力差等问题,在UNet中引入了残差结构并融合注意力机制SA,提出改进UNet的电缆槽盖板状态检测算法,主要包括以下几点:(1)将UNet特征提取网络中的卷积层替换成BasicBlock;(2)在下采样中,在BasicBlock后加入BottleNeck;(3)在引入的BottleNeck上融合注意力机制SA;(4)采用Dice Loss+BCE Loss组成复合损失函数。

1  改进的UNet模型

1.1  传统UNet

UNet是一种基于全卷积神经网络(FCN)改进的网络模型[10]。如图3所示,该网络呈U型的对称结构,由编码器、跳跃连接、解码器等三部分组成。图3左侧为编码器,通过3×3的卷积层、ReLU函数、2×2最大池化层等下采样,提取图像的语义特征和上下文信息;右侧解码器进行2×2的反卷积操作,通过跳跃连接层,将反卷积后的结果和相应的特征图拼接,以恢复丢失的边缘特征并保留底层的位置信息,再进行上采样,还原图像分辨率,最终由1×1卷积调整通道数,输出分割图像[11]

1.2  基于残差模块与注意力机制的UNet改进

本文模型针对槽盖板图像边缘模糊、破损、形状不规律等特征在UNet网络基础上进行了改进:使用BasicBlock残差结构代替原始的卷积层,在下采样过程中加入Bottleneck结构并在Bottleneck后融合Shuffle注意力机制。图4为改进的流程框架。

1.2.1  残差结构

ResNet(Resdiual Network)是由He等[12]提出的残差网络模型,简化了网络的训练,使模型更容易被优化,并且提高了网络的精度。如图5(a)所示,残差结构[13]的短连接可跳过中间层,将两条路径结果叠加作为输出结果,将浅层特征传输到深层,在加深网络层数的同时减少额外的参数和计算复杂度,以解决由网络层数的增加而引发的训练问题。残差结构有两种,分别为图5(b)BasicBlock结构和图5(c)BottleNeck结构。由图5(c)可知BottleNeck通过第一个1×1卷积层降维,减少参数量,再由另一个1×1卷积层恢复维度,在减少计算量的同时保证精度。

传统卷积层在训练过程中为提升网络性能,一般采用加深网络层数的方法,随着网络层数的增加,会引发梯度消失,网络退化的问题。本文使用BasicBlock替换编码部分的卷积层,再将经BasicBlock后所得的输出特征作为BottleNeck的输入特征,输入到BottleNeck中以减少参数量、计算量,有利于构建更多的网络层数,提升网络性能,使主干网络能更好地提取槽盖板的区域细节特征。

1.2.2  Shuffle注意力

加入残差模块的UNet网络能更好地提取槽盖板的局部信息,但忽略了不同的像素类别、通道特征间的差异性,特征学习权重会影响槽盖板分割的效果。引入注意力机制,增加槽盖板状态的特征学习权重,获取更多槽盖板区域的特征信息,减少背景区域的学习权重,忽略其他无关信息[14]。由于使用Bottleneck减少了残差网络中的通道数,为更好地获取通道中的特征信息,在Bottleneck下方加入注意力机制SA(Shuffle Attention)[15],通过改变特征学习的权重。

图7是将SA融入Bottleneck中的结构图,在Bottleneck结构下方加入SA,将Bottleneck的输出特征输入到SA模块,得到更重要的特征信息。

结合了残差模块、注意力机制UNet模型结构图如图8所示,UNet下采样中加入BasicBlock、Bottleneck,更好地获取槽盖板状态的特征信息,并在Bottleneck下方融入SA注意力机制,在减少算力的同时,给图像特征分配不同的权重,减少槽盖板图片其他背景的干扰。

1.3  损失函数

图像分割算法中,常用的损失函数是二进制交叉熵损失函数(Binary Cross Entropy Loss, BCE),如式(3)所示。而槽盖板图像存在正负样本不均衡的情况,继续使用BCE Loss会使网络过拟合,降低训练效果。Dice Loss通过计算预测值和真实结果的相似度,解决正负类样本不均衡问题,式(4)为Dice Loss。由于预测值和和真实值存在偏差,导致网络训练不稳定,为加强网络对样本的学习,本文设计了复合损失函数,如式(5)所示。

2  实验结果与分析

2.1  数据采集及预处理

本文试验使用的数据集是高铁轨旁槽盖板图像,利用轨检车采集铁路旁的槽盖板图像。一共采集390张具有槽盖板的图像,按照比例9∶1的方式,训练集有351张图像,39张图像作为测试集,使用LabelMe软件对槽盖板图像进行手动标注,得到正常槽盖板和非正常槽盖板两种状态。图9为LabelMe软件准备数据集的界面。

2.2  实验细节

表1为实验使用的系统和软件设置。

表2为模型训练超参数设定。

2.3  评价指标

本文采用的模型性能评价指标为语义分割领域公认的像素准确率(Pixel Accuracy,PA)、类别平均像素准确率(Mean Pixel Accuracy,MPA)、平均交并比(Mean Intersection over Union,MIoU)、加权交并比(Frequency Weighted Intersection over Union, FWIoU)[16]

2.4  实验结果对比与分析

本文使用几种先进的语义分割模型和本文改进的模型分别对数据集进行训练和测试,得到不同模型的分割精度,进行对比实验。图10为不同模型训练的Loss曲线,比较了UNet、ResUNet以及本文模型,从Loss值的变化来看,本文改进的模型收敛速度更快。

表3为不同网络对槽盖板分割的评价指标结果,Res-UNet在各项指标上明显高于其他经典的语义分割网络,分割效果略差于改进的Deeplabv3-mobile,而本文改进后网络的各项指标都高于原始UNet和Res-UNet,相较于Res-UNet,PA、MPA、MioU、FWIoU分別提高了3.71%、5.77%、5.56%、3.74%;本文方法相较于分割效果较好的Deeplabv3-mobile,PA、MPA、MioU、FWIoU分别提高了1.89%、4.71%、7.16%、3.42%。

图11是不同网络分割效果图,各网络对第一列图片的分割效果相当,没有遗漏或模糊;在第二、第三列图片的分割结果中,原始UNet、PSPNet等算法存在漏检的问题。加入两种残差模块,解决了漏检的问题。但由于背景因素的干扰,加入残差的UNet把部分槽盖板区域错误地归类为背景,导致区域分割不完整、边缘不清晰的问题,而引入SA注意力机制能有效抑制背景因素干扰,更好地关注槽盖板区域的信息,使该网络分割的区域更完整,边缘划分更精确,达到了预期的优化目标。

3  结束语

本文针对轨旁电缆槽盖板状态检测的问题,提出了改进UNet 的语义分割模型,在UNet下采样过程中引入两种残差结构,解决了训练中梯度爆炸、网络退化的问题,能更多地获取槽盖板图像的特征。在残差结构上融合了SA后,增强槽盖板区域的关注度,提高了网络对槽盖板区域特征的提取能力,弱化背景噪声干扰。进一步加强了网络的分割效果。与原始UNet及其他几种分割算法相比,本文网络在分割精确度有较大优势。未来在使用中,将进一步扩充槽盖板图像数据集,优化网络结构,提高网络的检测效果。

参考文献:

[1] 吕明珠. 基于机器视觉的印刷品表面缺陷检测研究[D]. 西安:西安理工大学,2019.

[2] 刘泽,王嵬,王平. 钢轨表面缺陷检测机器视觉系统的设计[J]. 电子测量与仪器学报,2010,24(11):1012-1017.

[3] 高玉双. 深度学习在计算机视觉领域的应用发展探究[J]. 电脑编程技巧与维护,2020(9):125-127.

[4]  LONG J, SHELHAMER E, DARRELL T. Fully convolutional networks for semantic segmentation[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015,39(4):640-651.

[5]  ROY A G, NAVAB N, WACHINGER C. Concurrent spatial and channel squeeze & excitation in fully convolutional networks[J/OL]. (2018)[2023-03-20]. http://arxiv.org/abs/180302579.2018.

[6]  OKTAY O, SCHLEMPER J, FOLGOC L L, et al. Attention U-Net: Learning where to look for the pancreas[J/OL]. (2021)[2023-03-10]. https://blog.csdn.net/fujikoo/article/details/111462676.

[7]  MORADI S, GHELICH-OGHLI M, ALIZADEHASL A, et al. A novel deep learning based approach for left ventricle segmentation in echocardiography: MFP-UNet[J/OL]. (2019)[2023-03-10]. https://www.docin.com/P-2326647814.html.

[8] 宫艳晶,黄民,黄小龙. 基于改进ResNet-UNet的火焰图像分割方法[J]. 北京信息科技大学学报(自然科学版),2021,36(5):39-44.

[9]  RAHMAN M R U, CHEN H. Defects inspection in polycrystalline solar cells electroluminescence images using deep learning[J]. IEEE Access, 2020(8):40547-40558.

[10] 王明常,朱春宇,陈学业,等. 基于FPN Res-UNet的高分辨率遥感影像建筑物变化检测[J]. 吉林大学学报:地球科学版,2021,51(1):296-306.

[11] 殷晓航,王永才,李德英. 基于U-Net结构改进的医学影像分割技术综述[J]. 软件学报,2021,32(2):32.

[12]  HE K, ZHANG X, REN S, et al. Deep residual learning for image recognition[C] // Proceedings of the IEEE Conference on Computer Risionand Pattern Recognition, 2016:770-778.

[13] 李爱莲,刘浩楠,郭志斌,等. 改进ResNet101网络下渣出钢状态识别研究[J]. 中国测试,2020,46(11):5.

[14] 朱张莉,饶元,吴渊,等. 注意力机制在深度学习中的研究进展[J]. 中文信息学报,2019,33(6):11.

[15]  ZHANG Q L, YANG Y B. Sa-net: Shuffle attention for deep convolutional neural networks[C] // ICASSP 2021-2021 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2021:2235-2239.

[16] 于营,王春平,付强,等. 语义分割评价指标和评价方法综述[J/OL]. 计算机工程与应用:1-14[2023-02-24]. http://kns.cnki.net/kcms/detail/11.2127.TP.20221205.1515.002.html.

收稿日期:2023-03-17

基金项目:国家自然科学基金项目(51975347);上海市科技计划项目(22010501600)

作者简介:高  仁(1997—),男,江苏盐城人,上海工程技术大学城市轨道交通学院硕士研究生,研究方向:交通通信与智能信息处理;柴晓冬(1962—),本文通信作者,男,上海人,上海工程技術大学城市轨道交通学院,教授,硕士生导师,研究方向:轨道检测、图像处理。

引文格式:高仁,柴晓冬,郑树彬,等. 基于改进UNet的轨旁槽盖板状态检测算法[J]. 物流科技,2024,47(3):44-49.