APP下载

基于改进YOLOv4的雾天变电站电力设备识别方法

2022-08-02熊凯飞樊绍胜

无线电工程 2022年8期
关键词:电力设备卷积变电站

熊凯飞,樊绍胜,吴 静

(长沙理工大学 电气与信息工程学院 电力机器人湖南省重点实验室,湖南 长沙 410114)

0 引言

隔离开关、绝缘子等电力设备是变电站变电设备的重要组成部分,实时地掌握其运行状态对电力系统的稳定运行至关重要[1]。目前,变电站主要采用的是人工巡检的方式,无法及时掌握变电设备的状态[2],这种方法不仅费时费力,且易受主观性的影响,复杂环境(如强雾霾天气)会影响检修人员的判断,因此复杂环境下变电站典型电力设备的识别定位成了智能变电站维护的重要一环[3-4],为后续的故障诊断研究奠定了基础。

雾天环境下的变电站电力设备检测分为2个阶段:去雾阶段和目标检测阶段。目前,雾天图片的去雾算法包括基于物理模型去雾、基于非物理模型去雾以及基于深度学习去雾3种。文献[5-8]中,基于物理模型去雾主要考虑光的散射和衰减以及雾的成像原理来建立模型,其视觉效果较好,去雾过程中没有增加额外的噪声,但是该方法场景限制严重且容易出现颜色失真等问题;文献[9-12]中,基于非物理模型去雾算法在一定灰度范围内,通过在特定灰度范围内调整雾图的空间灰度值分布来增强图像的局部和整体对比度,从而达到去雾效果,但是没有考虑图像质量降低的根本原因,导致去雾后的图像不够自然。基于深度学习去雾算法通过构建端到端的卷积神经网络来实现去雾,如AOD-Net[13]和DehazeNet[14],但以上网络都需要大量成对的数据集进行训练,间接增加了训练的难度。综上分析,本文选取基于Cycle-Dehaze[15]的深度学习去雾算法,无需成对的有雾和相应的无雾图进行训练,而是直接从有雾图像生成无雾图像,也无需估算大气散射模型的参数来进行有雾图像的去雾处理。

随着近些年深度学习目标检测的发展,越来越多的基于深度学习的目标检测算法被用于变电站电力设备检测。文献[16]利用Faster R-CNN目标检测算法对变压器等进行目标检测,检测的平均精度值达到90.61%;文献[17]采用YOLOv3算法,通过调整学习率等参数,实现了模型的快速收敛,电力设备的平均识别准确率为88.7%。但以上算法大都依赖于深层的网络,网络参数量较大、检测速度慢,且部署在巡检机器人上难以达到实时性的要求。目前,主流的轻量级目标检测算法往往对一些现有的网络进行压缩,对一些成熟的检测网络进行了裁剪,调整其网络结构,以牺牲检测性能为代价,来减少网络的参数量以提高速度,如YOLOv3-tiny[18]和YOLOv4-tiny[19]。

为了在保证精度不降低的情况下,减少模型的参数量而提高检测速度,本文以YOLOv4[20]目标检测网络为基础,用MobileNetv3[21]网络改进其主干特征提取网络,加强特征提取网络PANet中的3×3卷积,用深度可分离卷积替代,进一步降低网络的参数量,最后,在检测头中嵌入SE注意力机制,在实现模型轻量化的基础上提高变电站电力设备识别的精度,且部署在巡检机器人上可以满足实时检测的要求。

1 基于Cycle-Dehaze的图像去雾算法

Cycle-Dehaze图像去雾算法是Cycle-GAN[22]体系的增强版本,它无需估算大气散射模型中的参数,直接从有雾的输入图像生成无雾图像;无需成对的雾图和相应的Ground-Truth图像进行训练,并结合循环一致性损失和感知一致性损失来补充CycleGAN中的损失,前者确保了较高的PSNR值,后者则保留了图像的清晰度。该种损失主要的思想是比较特征空间而不是像素空间中的图像,因此Cycle-Dehaze在2个空间上将原始图像与重建的图像进行比较,从而生成视觉上更好的无雾图像。

1.1 CycleGAN的基本结构

CycleGAN结构如图1所示。

图1 CycleGAN结构Fig.1 Structure of CycleGAN

图1(a)中的X和Y代表2个数据域,其目的是将X域中的图像和Y域中的图像相互转换。CycleGAN由2个生成器G,F和2个判别器DX,DY构成。图1(a)中包含2组生成对抗网络,从正向来说,生成器G将X域中的图像x转换成Y域中的图片G(x),然后通过判别器DY来判断生成的图G(x)是否存在于Y域,反之同理。同时,为了保证图像x在被变换为Y域中的图像后能够与x具有对应关系,并防止X域中的所有图像被变换为Y域中的图像,引入了循环一致性损失。如图1(b)所示,通过循环一致性损失约束,图像从X域转换到Y域,然后再回到X域,得到的图像尽可能接近原始图像,这个过程是前向循环一致性。同样,反向循环的一致性如图1(c)所示。循环一致性的损失如式(1)所示:

(a) 标准卷积

(1)

式中,F(y)和G(x)分别表示反向生成器和前向生成器;F(G(x))和G(F(y))均属于重新构建的图像;x属于X域的图像;y属于Y域的图像。

1.2 Cycle-Dehaze去雾算法模型

Cycle-Dehaze去雾算法模型如图2所示。

图2 Cycle-Dehaze去雾算法模型Fig.2 Cycle-Dehaze algorithm model

图2所示的Cylce-Dehaze算法模型中,为了去雾,除了常规的生成器损失和判别器损失外,Cycle-Dehaze算法引入了感知一致性损失和循环一致性损失的组合,且循环一致性损失需要比感知一致性损失更高的权重。添加该组合损失后,该算法保留输入图像的纹理特征并生成唯一的无雾输出。判别器Dy的对抗损失表示为:

LDy=Ey~Pdata(y)[lgDy(y)]+

Ex~Pdata(x)[lg(1-Dy(G(x)))],

(2)

判别器Dx的对抗损失表示为:

LDx=Ex~Pdata(x)[lgDx(x)]+

Ey~Pdata(y)[lg(1-Dx(F(y)))],

(3)

循环感知一致性损失如式(4)所示,其中(x,y)不是成对的雾图和清晰图。

(4)

Lsum=Lcycle+γ·LPerceptual+LDX+LDY,

(5)

式中,γ表示循环感知一致性损失的权重。

2 变电站电力设备目标识别

2.1 改进的YOLOv4目标检测模型

针对当前的YOLOv4目标检测网络结构较为复杂、训练参数多且训练所需的配置高以及进行变电站巡检机器人实时巡检的每秒传输帧数(FPS)低的问题,用MobileNetv3轻量级网络结构改进YOLOv4主干特征提取网络CSPDarknet53,通过MobileNetv3网络中的深度可分离卷积大幅度减少主干网络的参数量,通过其中的倒残差结构进行通道扩增并进行单通道特征的提取以及多通道信息组合减少计算的复杂度;进一步使用深度可分离卷积代替PANet中的3×3的普通卷积降低模型的参数量,且将检测头嵌入SE注意力机制获得变电站电力设备更为丰富的语义信息和位置信息,提高检测精度。改进后的YOLOv4模型如图3所示。下文对图3所示的改进算法的网络结构进行详细介绍。

图3 改进的YOLOv4算法结构Fig.3 Structure of improved YOLOv4 algorithm

2.2 深度可分离卷积

基于卷积神经网络的模型构成复杂,所需的算力较大,难以部署到变电站巡检机器人上,因此构建轻量化的目标检测模型较为重要。本文所构建的变电站电力设备检测模型就是基于深度可分离的卷积神经网络搭建起来的。深度可分离卷积是一种可分解卷积的操作,即用深度卷积和逐点卷积代替原来的标准卷积。它将传统卷积分解为一个深度卷积和一个1×1的传统卷积,有助于减少模型参数、降低计算量。标准卷积和深度可分离卷积如图4所示。

图4(a)中标准卷积的过程是利用卷积核与各通道的输入特征图做卷积后相加再输出特征。标准卷积操作的计算量S1为:

(a) YOLOv4-tiny

(a) 原图

(a) 轻度雾去雾前

(6)

图4(b)中深度可分离卷积把传统卷积操作分解成一个3×3的深度卷积和一个1×1的传统卷积两步操作。深度可分离卷积操作的计算量S2为:

(7)

从式(6)和式(7)可以看出,深度可分离卷积通过解耦空间信息与深度信息,使模型的参数量大大减少,可以降低到标准卷积的1/N+1/Dk2。通常对于3×3的卷积核,用深度可分离卷积替换标准卷积后,计算量可以下降到原来的11.1%~12.5%。在本文中用深度可分离卷积改进YOLOv4中PANet的普通卷积,初步实现模型的轻量化。

2.3 检测头嵌入注意力机制

SE模块是SENet中提出的一种自动学习不通过特征的重要程度关系的结构,使网络更加关注信息量最大的通道特征,抑制不重要的通道特征。SE模块由压缩操作和激励操作组成,如图5所示。

图5 SE注意力机制模块Fig.5 SE attention mechanism module

压缩操作对每个通道进行全局池化操作,则通道权重Zc的计算公式为:

(8)

式中,Zc为第c个特征图uc的全局平均输出;(i,j)表示在大小为H×W的特征图上横纵坐标为i和j的点。

激励操作采用赋予权重、非线性操作的方法构建各个通道之间的关系:

Sc=Fex(Zc,W)=sigmoid(W2×ReLU(W1,Zc)),

(9)

式中,Sc为激活函数的输出,对应生成的通道注意力权重;W,W1,W2分别为全局平均池化、ReLU激活函数和sigmoid激活函数的权重。最后,对输入通道进行加权调整,加权表达式为:

(10)

2.4 基于MobileNetv3骨干特征提取网络

MobileNetv3是MobileNet网络发展的第3代,综合了MobileNetv1的深度可分离卷积、MobileNetv2的逆残差结构、线性瓶颈结构、轻量级SE注意力机制模块优化变电站电力设备特征表达,然后利用神经结构搜索来搜索网络的配置和参数,同时利用h-swish激活函数来改进swish激活函数,有效提高网络的精度,效果优于ReLU,达到减少网络的参数量、提高计算能力,以及更高精度的效果。MobileNetv3特征提取网络模块结构示意图如图6所示。

图6 MobileNetv3模块结构示意Fig.6 Structure of MobileNetv3 module

本文设计的轻量级主干特征提取网络MobileNetv3改进YOLOv4主干特征提取网络既保持了较强的特征提取能力,又降低了模型的复杂度、减小了计算量,进一步实现模型的轻量化,从而提高识别速度,有利于算法模型在变电站巡检机器人上的部署。

3 实验及结果分析

为了验证本文去雾算法以及改进的电力设备目标检测算法的有效性,提出的算法程序用Python语言编写,实验平台为Windows10,Keras以及Python3.7的编程环境。训练的数据集来源于变电站真实有雾图和无雾图共5 642张,每张图均含有需要识别定位的绝缘子、断路器、电压互感器、避雷器和隔离开关目标。首先,利用本文Cycle-Dehaze去雾算法对真实变电站有雾图片进行去雾处理,然后,利用本文改进的YOLOv4轻量级目标检测算法识别定位目标并实时显示在机器人上位机中。下面是本文具体的实验过程。

3.1 去雾结果分析

基于Cycle-Dehaze去雾算法,考虑到样本数据量的大小,将BatchSize设置为8,epoch设置为400轮,learning rate设置为10-3,采用Adam优化器。训练数据集来源于变电站巡检机器人所拍摄有雾图片和无雾图片5 642张。利用训练好的Cycle-Dehaze去雾模型对变电站雾天图片进行去雾处理,得到2种不同雾浓度下去雾处理前后的结果,如图7所示。

由图7不同雾浓度对比可知,在雾天的变电站环境下,经过去雾操作后的图片,变电站电力设备的轮廓更凸显,信息更加丰富,颜色更加饱和,可辨识度以及对比度更高。

为了从量化指标体现去雾算法的有效性,本实验部分采用峰值信噪比(PSNR)和结构相似性(SSIM)2个客观评价指标来评估去雾算法的性能。PSNR首先计算有雾图和无雾图的均方差(MSE),MSE越小,PSNR值越大,表示2张图的相似性越大。对一张H×W的图像,PSNR的计算表达式为:

(11)

(12)

SSIM表示2幅图的相似程度,分别从亮度、对比度和结构3个方面评价2张图的相似程度,结果越接近1表示图形越相似,图像的失真越小,其表达式为:

(13)

(14)

(15)

SSIM(X,Y)=l(X,Y)·c(X,Y)·s(X,Y),

(16)

式中,∂X,∂Y表示图像X和图像Y的方差;uX,uY表示图像X和Y的均值;C1,C2,C3为常数项;∂XY表示图像X和Y的协方差。

另外,选取基于物理模型、非物理模型以及深度学习去雾算法的代表,分别为暗通道先验法、直方图均衡化算法和DehazeNet算法进行对比测试,如图8所示。

从图8可以看出,基于暗通道先验法处理过后可以使图像在视觉效果上更清晰,但是图片整体变暗,如图8(b)所示;基于直方图均衡化去雾算法增强了图像的对比度,但是产生了较多的噪声,对后续的图像识别工作产生了较大的影响,在图8(c)上表现明显;基于深度学习的去雾算法较基于物理模型和非物理模型去雾表现较好,但是本文使用的Cycle-Dehaze算法较DehazeNet算法在图像质量上有着较为明显的提升,图像原本的亮度没有降低,且Cycle-Dehaze算法明显提升了图像的饱和度与色彩,如图8(d)和(e)所示,为后文的变电站电力设备的识别奠定基础。表1为1张带雾图片分别用4种算法处理前后的PSNR和SSIM指标对比。

表1 4种去雾算法处理前后指标对比Tab.1 Comparison of indicators before and after processing of four dehazing algorithms

由表1可知,经过4种算法分别处理过后,Cycle-Dehaze去雾算法的PSNR和SSIM值最高,PSNR值分别相对于暗通道、直方图均衡化和DehazeNet高3.502,2.863,1.391 dB;对于SSIM值,Cycle-Dehaze算法最接近于1,表明使用Cycle-Dehaze去雾算法图像失真最小,去雾效果最好,图像质量最高。

3.2 电力设备目标检测

3.2.1 数据集与训练参数

本实验采用巡检机器人拍摄的真实场景变电站电力设备数据集进行训练,检测目标包括隔离开关(glkg)、断路器(dlq)、电压互感器(dyhgq)、绝缘子(jyz)以及避雷器(blq)。数据集为去雾处理后共5 642张图片再通过图像的翻转、对比度增强、裁剪和亮度增强等物理增强方法扩充至10 000张图片,其中训练集7 000张,测试集3 000张。用keras框架,通过Anconda搭建深度学习环境,使用改进后的YOLOv4网络模型进行240轮epoch的训练,图片批处理大小设置为8,输入的图片大小为416 pixel×416 pixel×3,学习率为0.001,根据上述训练参数进行训练,模型已收敛,其训练过程的损失函数如图9所示。

图9 改进的YOLOv4训练曲线Fig.9 Improved YOLOv4 training curve

3.2.2 去雾后在不同检测算法下的对比

在经过Cycle-Dehaze算法去雾处理的图片数据集上,基于改进的YOLOv4算法进行训练,经过240轮epoch的训练,模型训练已收敛,训练效果较好。为了验证改进后的YOLOv4算法的优越性,将其与SSD,YOLOv4-tiny和YOLOv4目标检测模型进行对比,结果如表2所示,评价指标采用mAP、检测帧率和模型参数量。

表2 多算法实验对比Tab.2 Comparison of various algorithm experiments

由表2可以看出,虽然本文算法在平均精度值上与原YOLOv4的mAP值较为接近,但模型的参数量下降了80.21%,模型的检测速度快了15.59帧/秒,提高了1.2倍;与SSD,YOLOv4-tiny相比,电力设备能正确被定位,出现漏检部分更少,平均精度值分别提升了5.1%,8.8%,其中相较于SSD算法,检测速度提高了45.08%。综上所述,在不减少更多精准度的情况下,本文改进的YOLOv4算法检测速度更快,实现模型轻量化,更有利于模型在巡检机器人的部署。不同检测算法检测结果可视化对比如图10所示。

3.2.3消融实验分析

为了更好地对比改进的YOLOv4中各个模块对检测效果的影响,对各个模块进行消融学习,结果如表3所示。

表3 消融实验分析Tab.3 Results of ablation learning

由表3可以看出,MobileNetv3代替YOLOv4主干特征网络CSPDarknet53后,虽然mAP值下降了4.8%,但检测速度提高了13.75帧/秒;在用深度可分离卷积改进PANet普通卷积后,mAP值下降1.4%,但是检测速度提升了3.11帧/秒;检测头嵌入注意力机制后,mAP值提高了5.3%。结果表明,引入MobileNetv3改进主干特征提取网络以及深度可分离卷积改进PANet中的普通卷积可大大提升检测的速度;检测头引入SE注意力机制可提高电力设备的识别精度。综上,在保证和YOLOv4精准度相当的情况下,本文的改进算法实现模型的轻量化,大大提高模型检测的速度。

3.2.4 算法模型部署

将本文算法部署到变电站巡检机器人上,巡检机器人上位机Qt界面显示如图11所示。结果表明,本文算法的去雾能力与检测定位速度均能满足变电站实时巡检的要求。

图11 机器人上位机Qt界面显示Fig.11 Qt interface display of robot host computer

4 结束语

本文将Cycle-Dehaze去雾算法和改进后的YOLOv4算法相结合,成功将算法部署到巡检机器人上,解决了雾天情况下变电站电力设备识别精度低、速度慢的问题。在去雾方面,利用Cycle-Dehaze去雾算法明显提升了图像的饱和度和色彩。在检测方面,通过设计轻量级目标检测模型,在保证精度的前提下,大大减少了参数量,提高了检测速度。改进算法在真实变电站雾天环境下的变电设备检测的mAP能达到92.5%,相比于YOLOv4算法,在保证精度的前提下,减小了模型的参数量,提高了状态检测的速度。

由于本文的数据集图片相对于COCO等一些大型数据集较少,学习到的雾天场景下的变电站各种电力部件的特征有限,有大量存在遮挡以及重叠的目标对象,对于这些对象定位的精准率有待提高。未来将进一步扩大数据集以及增加不同的雾天场景,从而扩大雾天环境下变电站巡检机器人的适用范围,提高稳定性。

猜你喜欢

电力设备卷积变电站
电力设备带电清洗作业的研究与应用
电力设备预防性试验的重要性与方法
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
变电站五防系统临时接地桩的设置
智能箱式变电站的应用探讨
电力设备预防性试验的重要性与方法微探
高压电力设备试验方法及安全措施的研究
从滤波器理解卷积