基于改进Faster R-CNN的变压器巡检图像数据挖掘研究

2021-07-28贺月常永娟

科技创新导报 2021年7期

贺月常永娟

摘要：随着我国电网智能化、信息化的建设与发展，电网中的电力设备通过长期的运维、检修和试验，积累了大量的各种形式的电力数据。其中，相比于主要以数值形式存储的结构化数据而言，电力设备巡检图像等非结构化数据，具有更广泛的应用场景和更高的价值密度，但由于不能被计算机直接识别和处理，其挖掘过程也存在更多的难点。本文提出基于改进Faster R-CNN模型的电力设备图像目标检测方法。以主变压器的巡检图像为例，考虑了主变压器各个部件的尺寸差异较大以及部件位置之间存在关联性的特点，对Faster R-CNN模型的结构进行了改进，有效提高了主变压器多部件类别和位置识别的准确率，为识别不同部件的缺陷和故障现象奠定了基础。

关键词：巡检图像变压器部件改进Faster R-CNN模型训练检测

中图分类号：TM73 文献标识码：A 文章编号：1674-098X（2021）03（a）-0133-04

Research on Image Data Mining of Transformer Inspection Based on Improved FAST R-CNN

HE Yue CHANG Yongjuan

（Information and Communication Branch of State Grid Hebei Electric Power Co.， Ltd.， Shijiazhuang， Hebei Province， 050013 China）

Abstract： With the construction and development of China's power grid intelligence and informatization， the power equipment in the power grid has accumulated a large number of various forms of power data through long-term operation and maintenance， maintenance and test. Compared with the structured data mainly stored in numerical form， unstructured data such as inspection images of power equipment have more extensive application scenarios and higher value density. However， because it can not be directly recognized and processed by computer， the mining process also has more difficulties. In this paper， a target detection method based on improved Faster R-CNN model for power equipment image is proposed. Taking the inspection image of main transformer as an example， considering the large size difference of each component of main transformer and the correlation between component positions， the structure of Faster R-CNN model is improved， which effectively improves the accuracy of multi component classification and location identification of main transformer， and lays a foundation for identifying defects and fault phenomena of different components.

Key Words： Inspection image; Transformer parts; Improved Faster R-CNN model; Training; Detection

在智能變电站建设中，随着巡检机器人的普及和大量变电站图像数据的积累，基于图像的电力设备状态自动识别方法逐步得到应用，例如隔离开关分合状态识别、瓷瓶异物识别等等。采用计算机视觉技术代替传统的人力巡检，可以有效提高巡检的频率和效率，并减少人工判断的主观性对准确率的影响。作为变电站最重要的设备之一，主变压器的稳定运行关系到变电站乃至整个电力系统供电的安全可靠[1]。因此，基于变压器图像的缺陷和故障识别有着重要的实用价值，而变压器部件的检测是其中的一个关键性环节。只有在准确检测出变压器各个部件的类别和位置后，才能够针对不同的部件可能发生的缺陷和故障类型，如储油柜渗漏油、呼吸器硅胶变色等，制定相应的识别算法，从而实现变压器缺陷和故障的自动识别[2]。

对于电力设备和部件的自动检测，基本思路是从现场获得包含待识别目标的图像，并进行特征提取和分析，再通过检测模型检测出图像中电力设备和部件的类别与位置[3]。较为直接的方法是基于模版的匹配算法，即在现场图像中将待识别目标人工框定出来并作为模版，再通过模板与新的图像各个区域的相似度计算，对新的图像中的目标进行匹配。这种方法受限于拍摄点的定位和拍摄角度的精度，准确率和稳定性难以保证[4]。本文以检测准确性较高的Faster R-CNN为基础，对模型结构进行改进，使模型可以动态地适应部件大小差异，同时充分考虑变压器部件位置的关联性，加入相对位置特征，进一步提高部件检测准确率。

1 用于变压器部件检测的改进Faster R-CNN

Faster R-CNN分为三个模块，即特征提取、建议框（proposal）生成和类别与位置检测。综合考虑准确率要求和数据集规模，特征提取部分的卷积神经网络（即Stage1-Stage5）采用ResNet-50结构。输入的图像首先通过ResNet-50网络被转化为一张特征图（feature map），然后将特征图输入区域建议网络（Region Proposal Network，RPN），生成n个建议框，每个建议框包括2个概率值（分别代表建议框内包含和不包含目标物体的概率）以及4个代表建议框位置的坐标值。最后，将特征图和从n个建议框中筛选出来的个建议框都输入兴趣区域池化层（Region of Interest pooling，RoI pooling）、全连接层（Full Connect，FC）以及softmax分类器或bounding-box回归器，从而输出每个建议框的k+1个概率值（代表包含k類目标的概率和只包含背景的概率）以及4k个坐标值（代表k类目标的坐标）[5]。

为了实现变压器部件的准确检测，在Faster R-CNN的基础上提出改进模型，如图1所示。改进主要包括两部分：一是将特征提取模块Stage2输出的浅层特征图也输入类别与位置检测模块，以提升对小目标的检测效果，并与原有的Stage5输出的深层特征图配合，动态地适应检测目标大小的变化;二是在建议框生成和类别与位置检测模块中都引入了部件之间的相对位置信息作为特征，并采用随机森林（Random Forest，RF）模型对概率和坐标进行修正，以提高部件检测的准确性[6]。

2 训练和检测过程

训练过程分为两部分。一是对神经网络部分进行训练，主要在所采用的四步训练法基础上进行修改，以适应双特征图;二是对随机森林模型进行训练，主要对相对位置特征出现各种缺失的情况进行训练，以提高模型对缺失值的鲁棒性。

训练完成后，利用改进FasterR-CNN进行变压器部件检测的过程如算法1所示，带星号部分将在下文进一步解释。

算法1 变压器部件检测算法

Input：一张图像，，置信度阈值*

Output：一个集合，包含k1个，每个包括一个部件类别的1个概率值和4个坐标值

将一张图像输入ResNet-50，生成特征图1和特征图2

初始化集合为空集

While的元素数目

将特征图1输入建议框生成模块*，生成n1个建议框

将n1个建议框、特征图1和特征图2输入类别与位置检测模块*，生成n1×k个box（忽略背景类别），每个box包括一个类别的1个概率值和4个坐标值，所有box形成集合boxes

删除集合boxes中类别已在出现过的box

将boxes中概率值最大的box作为

If的概率值<置信度阈值then

Break

Else将加入集合

End if

End while

带星号部分解释如下：（1）变量n1决定了输入类别与位置检测模块的建议框数量;置信度阈值决定了输出的的概率阈值;（2）集合里的每个都框定了一个图像中被检测到的变压器部件，包括其类别及概率值;（3）每个建议框在建议框生成模块和类别与位置检测模块中的相对位置特征由该建议框和各个的坐标生成。

3 算例分析

3.1 算例情况

选取某220kV变电站2016—2017年的2000张主变压器巡检图像作为实验数据集，每张图像的分辨率均为800（宽）×600（高），部分图像如图2所示。根据所采用的数据集中变压器的型式，选取变压器的本体储油柜、#1-#9散热器组、#10-#18散热器组、本体瓦斯继电器、本体呼吸器、有载开关呼吸器共6类尺寸差异较大的部件进行检测，并对所有图像中6类部件的位置进行标注。采用10倍交叉验证方法进行实验，再将所有测试图像汇总进行统计。

对于改进FasterR-CNN（简称FRCNN-improved）模型的神经网络部分，被选择输入类别与位置检测模块的建议框数目（即n1）在训练和测试过程中分别设置为2000和300，而RPN中采用尺寸分别为82、322、1282和5122的四种anchor，每种尺寸的anchor均包括2：1、1：1和1：2三种长宽比。同时通过参数寻优，设置模型的学习率为0.003，每批训练图像数量为8张，训练步数为50000步，由于数据集的每张图像都只包含一台主变压器，即每类部件最多只有1个，因此在所有模型中，对于同一张图像的每类部件，都只取1个概率值最高的检测框作为最终检测结果。评价变压器部件检测准确性的指标之一，采用目标检测任务中常用的指标mAP。虽然mAP能比较全面地评价模型准确性，但其计算比较复杂，需要通过多次改变置信度阈值获得多组查准率和查全率进行计算，工程意义不够明确。为了更直观地反映模型在实际工程应用中的效果，经过参数寻优，设定置信度阈值等于0.6，并统计各类部件的查准率（记为P）和查全率（记为R），以及总体查准率和查全率。另外，统计每张图像的平均检测耗时，采用Nvidia GeForce GTX 750 Ti GPU 进行训练和测试。另外，在判断某类部件的检测框是否正确标注时，采用检测框与ground-truth box的交集和并集的面积比（Intersection over Union，IoU）进行判定。当IoU>0.5时，认为检测框正确框出了部件。

3.2 算例结果

采用训练集图像对上述各种模型进行训练后，对测试集图像进行部件检测，对于mAP和总体的查准率、查全率，总体查准率和查全率均高于94%。可见，对于FasterR-CNN模型结构的两点改进，都有助于提高模型的检测准确性。由于在检测过程中需要通过迭代逐次生成final_box，故FRCNN-improved的检测耗时最多，但因为主变压器的巡检是定期任务，对实时性的要求不高，而每张图像2.1s的效率已明显高于人工对目标进行标定的效率，故模型可以满足实际工程的需求。

参考文献

[1] 傅世权.大数据时代下数据挖掘技术在电力企业中的应用探讨[J].信息记录材料，2019，20（11）：128-129.

[2] 汤伟，杨铖.基于数据挖掘技术的电力调度系统设计与实现[J].自动化与仪器仪表，2019（5）：55-58.

[3] 陈俊星.基于数据挖掘技术的电力设备状态评估[D].北京：北京交通大学，2019.

[4] 霍晓峰.数据挖掘技术在电力系统故障诊断中的应用[D].北京：华北电力大学，2017.

[5] 朱克东.智能电网环境下电力数据挖掘研究[D].南京：东南大学，2018.

[6] 皇甫汉聪，肖招娣.基于Apriori算法的电力系统二次设备缺陷数据挖掘与分析研究[J].电子设计工程，2019，27（5）：6-9，15.