APP下载

基于深度学习的输电线路杆塔鸟窝识别方法研究

2020-08-28欧进永杨渊时磊周振峰邱实

机电信息 2020年24期
关键词:特征提取深度学习

欧进永 杨渊 时磊 周振峰 邱实

摘  要:为实现输电线路杆塔中鸟窝的快速准确检测,提出一种基于RetinaNet深度学习模型的鸟窝识别方法,利用ResNet-50进行前期特征提取,通过FPN网络对前期标准特征进行加强,构建特征金字塔影像,以满足不同尺度大小的鸟窝目标检测,然后在特征金字塔的基础上构建了一个分类子网和回归子网,分别用于识别鸟窝和回归鸟窝的具体位置。通过与经典目标检测方法进行详细对比分析,利用F1-Score精度指标和检測速度指标对检测效果进行了量化分析,实验结果表明,所采用的鸟窝检测模型F1-Score指标可达0.932,优于其他三种经典方法,并能充分应对拍摄角度、遮挡等各种复杂场景问题。

关键词:深度学习;RetinaNet模型;特征提取;特征金字塔;鸟窝识别

0    引言

输电杆塔中鸟窝易引起线路跳闸、短路等。为有效解决该问题,多地电网公司采用无人机巡检或监控摄像头对鸟窝进行监测,这种方式主要依靠人工目视判读,主观性强、工作量大,易出现误检或漏检情况。

目前,国内外对影像目标自动检测做了大量研究。传统目标检测方法通过人工设计特征提取算子,如HOG等[1],然后利用SVM等分类器[1]根据所提取的图像特征进行目标检测,这种方法的检测精度依赖于特征提取是否有效,较为局限,泛化能力也较差。近年来,深度学习技术兴起,如RCNN模型[2]、YOLO模型[3]等。

本文选取RetinaNet模型[4]进行输电杆塔鸟窝检测,其由于具备独特的“焦点损失”特性,既有较快的检测速度,也有良好的检测精度,对输电杆塔中鸟窝有很好的检测效果。

1    RetinaNet目标检测模型

RetinaNet目标检测模型结构如图1所示,由ResNet特征提取网络、FPN主干网络、分类子网络及回归子网络组成。其中,ResNet网络用于前期特征提取;FPN主干网络将ResNet前期提取特征进行多尺度整合,生成特征金字塔为后续分类和回归做准备;分类子网络用于对目标类别做判断,回归子网络用于回归检测框位置。

1.1    ResNet特征提取网络

在ResNet网络中使用残差网络,可大大加深模型深度,提取更深层次特征,还能很好地防止模型过拟合、模型不收敛。ResNet应用了两种残差模块,一种是两个3×3卷积层相连的双层残差学习模块;另一种是1个1×1卷积层接3×3卷积层,再接1×1卷积层的三层残差学习模块。

1.2    FPN主干网络

FPN一共包括两个部分,第一部分是图像下采样操作,第二部分是图像上采样和横向连接操作。首先,对输入的ResNet特征图做5次连续卷积和池化操作,得到5幅尺寸大小递减的特征图C1、C2、C3、C4和C5,再对C5层做1×1卷积,得到M5特征图,对M5特征图进行反卷积上采样操作,使特征图尺寸变大,再加上C4经过1×1卷积后的特征图,得到M4特征图,以此类推,可得M3和M2,通过对M层所有特征图进行3×3卷积操作,可得到P2、P3、P4和P5特征图,这四幅特征图合起来即构成了影像特征金字塔。这种多尺度的特性对于情况复杂的输电线路鸟窝检测非常适合。

1.3    Anchors机制

在影像特征金字塔的每一层,分别设置322、642、1282、2562和5122像素尺寸大小的anchor(即搜索框),如果一个anchor与某个真实标签框的IOU大于0.5,则认为该anchor是正样本;如果在0和0.4之间,则认为该anchor为背景;如果在0.4到0.5之间,则后续训练时忽略该anchor。

1.4    分类子网络与回归子网络

(1)分类子网络。从影像特征金字塔获取W×H×256大小输入特征图,后接4个3×3尺寸大小卷积层,每个卷积层都用Relu激活函数进行激活,得到W×H×256大小特征图;再接1个3×3×(A×K)卷积层,得到W×H×(KA)大小特征图,其中K为类别数,A为anchor个数;最后利用sigmoid激活函数输出每个anchor的类别预测结果。

(2)回归子网络。与分类子网络同样得到W×H×256大小特征图;再接1个3×3×(A×4)卷积层,得到W×H×(4A)大小特征图,其中4代表预测框的四个角点与真实标签框间的相对偏移。

1.5    Focal loss损失函数

Focal loss损失函数通过重塑交叉熵损失,在原有交叉熵基础上乘一个因子,减少易分类样本权重,改善样本不平衡问题。假设pt是模型预测的属于目标的概率,其取值范围为[0,1],y表示类别标签:

pt=p      y=11-p   other                        (1)

常规交叉熵损失函数如式(2)所示:

CE(p,y)=CE(pt)=-ln(pt)       (2)

Focal loss实质上是常规交叉熵损失的改进算法,在其基础上乘一个因子,如式(3)所示:

FL(pt)=-∝t(1-p)γln(pt)     (3)

式中:∝t为平衡因子,取值为0~1;γ为调节因子,取值为0~5,通过改进,使模型可以更加专注于不易区分的样本,改善整体性能。

2    实验与分析

2.1    模型训练

本文实验所采用数据集来自无人机航拍和固定摄像头监控,为了使模型更快更好地收敛,文中利用预训练的ResNet50模型权重作为初始权重,学习率设置为0.000 01,批大小设置为2,一共训练了50个epoch。

2.2    模型测试

利用测试集对训练好的鸟窝检测模型进行測试,测试结果如图2所示。

从图2可知,不管是杆塔侧身、顶端还是塔身位置的鸟窝,不管鸟窝是位于影像中间还是影像边缘,不管是否有杆塔自身遮挡,本文模型都可准确、有效地检测出鸟窝。

2.3    算法性能分析

将本文输电线路鸟窝检测模型与经典的HOG+SVM算法、Faster-RCNN模型以及YOLO模型做了详细实验对比,利用F1-Score指标[5]及检测速度作为模型精度评价指标,对比情况如表1所示。

3    结语

本文利用RetinaNet深度学习模型对杆塔鸟窝进行检测,前期特征提取用了ResNet-50,构建FPN特征金字塔影像,将其作为整个RetinaNet的主干结构。实验结果表明,本文方法在测试集上的F1-Score精度指标优于HOG+SVM算法、Faster-

RCNN模型以及YOLO模型,且具有较快的检测速度。本文方法可充分应对鸟窝位于杆塔及实际影像中不同位置、不同拍摄角度的情况以及杆塔本身对于鸟窝的遮挡情况。

[参考文献]

[1] 徐渊,许晓亮,李才年,等.结合SVM分类器与HOG特征提取的行人检测[J].计算机工程,2016,42(1):56-60.

[2] GIRSHICK R B,DONAHUE J,DARRELL T,et al.Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation[C]//2014 IEEE Conference on Computer Vision and Pattern Recognition,2014: 580-587.

[3] REDMON J,DIVVALA S,GIRSHICK R B,et al.You Only Look Once:Unified,Real-Time Object Detection[C]//2016 IEEE Conference on Computer Vision and Pattern Recogni-

tion (CVPR),2016:779-788.

[4] LIN T Y,GOYAL P,GIRSHICK R,et al.Focal Loss for Dense Object Detection[J].IEEE Transactions on Pattern Analysis & Machine Intelligence,2017(99):2999-3007.

[5] 王朵.基于全卷积神经网络的遥感图像语义分割及变化检测方法研究[D].西安:西安电子科技大学,2018.

收稿日期:2020-06-28

作者简介:欧进永(1989—),男,贵州六盘水人,助理工程师,研究方向:输电线路运维管理。

猜你喜欢

特征提取深度学习
基于MED—MOMEDA的风电齿轮箱复合故障特征提取研究
基于曲率局部二值模式的深度图像手势特征提取
一种针对特定无线电信号的识别方法
基于模糊K近邻的语音情感识别
有体验的学习才是有意义的学习
电子商务中基于深度学习的虚假交易识别研究
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现