APP下载

基于改进SVDD的绝缘子污秽检测方法

2019-09-11吴文海党帅涛

传感器与微系统 2019年9期
关键词:污秽绝缘子边界

孙 磊, 吴文海, 柯 坚, 党帅涛

(西南交通大学 机械工程学院,四川 成都 610031)

0 引 言

绝缘子作为电网系统的重要组成部分,由其表面污秽导致的污闪事故常对整个电网系统造成巨大经济损失[1,2]。国内外对绝缘子的污秽检测做出了大量研究,目前主要有:等值盐密法、红外图像检测法、紫外图像检测法、可见光图像检测等[3]。图像检测方法具有不断电、非接触等优点,其中可见光图像检测受到环境因素干扰小、工作条件广、鲁棒性好等优点备受关注[4,5]。在可见光图像中,室外绝缘子通过颜色差异描述其等值灰密,可有效表示污秽状况[6],自动化图像检测方法也因准确率高、响应快、安全可靠等优点成为该邻域研究热点,然而室外环境条件复杂,机器学习空间中的异常类样本数量相对较少,致使传统分类方法得到的分类超平面产生偏移,泛化能力下降。这导致待测绝缘子产生错误检测:非污秽目标检测为污秽,称为误检;污秽目标检测为非污秽,称为漏检。部分图像样本因处于区分边缘附近,难以准确分类,然而传统分类方法强行对其进行分类,导致了检测结果必然伴随不可避免的误检与漏检。误检与漏检均降低了绝缘子的污秽检测精度,实际工作中,应尽可能地降低漏检率。

支持向量数据描述(support vector data description,SVDD)作为一种经典的单分类方法,以支持向量机和统计学习理论为基础,具有坚实的理论支持和高效的学习能力[7]。但经典SVDD对离群点及异常点较为敏感,容易产生过学习;且其数据描述边界间隔为0,鲁棒性不高。针对此类问题,许多专家学者取得了诸多研究成果,文献[8,9]考虑到数据集本身的分布信息,构造了基于样本本身分布信息的模糊数据描述轮廓,改善了经典SVDD的数据敏感问题;Chen G等人[10]引入不敏感损失函数ε的概念,构造了一个ε间隔,在一定程度上解决了分类间隔为零的问题;Nguyen P等人[11]提出Distant SVDD,在SVDD的最小包围球的基础上最大化球心至原点的距离,文献[12]改进了Nguyen P[11]的方法,推广构建了最小二乘形式,提高了SVDD的泛化能力。

上述方法均对SVDD的局部缺陷进行改进,但缺乏整体考虑。为了解决典型样本不足的问题,设计一种双超球数据域描述模型,在SVDD最小化包围球的前提下优化一个最大超球,使其能够接收更多的样本,并把异常样本排除在外,以此避免对难以区分的样本进行分类决策,从而降低绝缘子的误检率与漏检率。

1 SVDD

对于n个训练样本x,SVDD寻找最小超球R使绝大部分样本处于该超球体之内,极少部分异常样本被排除在超球体之外,表达形式

(1)

式中a为超球中心;ε为松弛变量;C为正则化参数。

为改善数据描述性能通常引入核函数把原始数据映射到高维特征空间,并在高维特征空间中最小化包围球。

2 双超球数据域描述

传统的SVDD及其改进算法通过调整正则化参数来改变超球半径,必然导致更多的样本位于超球体之外(或内),增加了误检率(或漏检率),这是机器学习中最常见的两种错误。位于决策边界处的样本的决策信息与分割阈值相近,难以准确处理,这也是造成SVDD精度不足的主要原因。面对这种情况,尝试避免做出决策。

(2)

图1中,虚线轮廓为新生成的大超球轮廓,相比较于传统SVDD模型,双超球将原样本分隔为3个区域,大超球的存在使得小超球在尽可能包含所有样本的同时令绝大多数的异常样本被排除在大超球外,而原本容易造成分类误差的不确定性样本则被分隔在两个超球轮廓之间。

图1 二维DSHDD

为了进一步改善DSHDD方法的性能,引入一个反映样本本身分布信息的模糊因子ωi,构造模糊双超球数据域描述(fuzzy double hyper-sphere data description,FDHSDD),理论公式

(3)

模糊均值聚类(fuzzy means clustering,FMC)是在硬均值聚类的基础上引入模糊数学的概念,通过聚类的方法对样本进行软划分,建立样本与类别间的不确定性描述。

3 实验验证

为验证方法的有效性,选取206幅不同污秽情况的绝缘子图像(正常样本189幅,异常样本17幅)进行测试,比较SVDD与DSHDD性能的差异。实验环境为:Windows 10操作系统,Intel酷睿4核CPU,主频为3.3 GHZ,4 G内存,运行平台为MATLAB 2016。核函数选择高斯核函数,其中σ为核函数宽度

(4)

利用模糊支持向量数据描述(fuzzy SVDD,FSVDD)和FDSHDD对样本进行学习训练,通过10次10折交叉验证的网格搜索算法来获取优化SVDD与本文DSHDD方法的最佳参数。分别得到如图2、图3、图4的模型。

图2 FSVDD

图3 调整参数后的FSVDD

图4 FDSHDD

图2中,SVDD方法通过在特征空间最小化一个包围球,将绝缘子样本分割为两部分,其中超球边界内的样本被认为是无污秽或轻度污秽的正常样本,超球边界外的样本被认为是污染严重,需要维护处理的异常样本。然而0间隔的边界造成其附近出现大量的样本错判,即误检与漏检。为了降低漏检率,对SVDD参数进行调节以减小超球轮廓,如图3所示。漏检率降低的同时造成了误检率上升,导致了无意义的清洁维护工作,造成资源浪费。

DSHDD方法则通过建立双超球模型,在隔离正常样本与异常样本的同时,对部分无法准确分类的样本设置了“拒绝区域”,有效地降低了漏检率与误检率,如图4所示。

由表1可知,传统SVDD方法无法调和误检率与漏检率,而DSHDD则在牺牲了部分检测率的前提下,有效降低了误检率与漏检率。就检测精度而言,DSHDD方法更适用于实际工作的安全性与经济性,具备良好的分类检测效果。

表1 原始方法与改进方法性能对比

4 结 论

针对室外污秽绝缘子异常数据较多及SVDD方法鲁棒性不强等缺陷,本文提出一种基于SVDD改进的DSHDD模型,在SVDD最小超球外优化一个带参数的大超球边界使其尽可能地接收更多的样本,并把绝大部分异常数据排除在外,对于不能准确分类的样本避免决策,即将样本分类为正常区域、异常区域与拒绝区域。结果表明:该方法可以有效降低绝缘子污秽检测中的误检与漏检情况。

猜你喜欢

污秽绝缘子边界
基于Mask RCNN的绝缘子自爆缺陷检测
拓展阅读的边界
探索太阳系的边界
我不是一株草
GIS盆式绝缘子表面污秽模态分析检测方法研究
意大利边界穿越之家
污秽绝缘子安装并联间隙的雷电击穿特性分析
浅析输电线路绝缘子防污闪技术
论中立的帮助行为之可罚边界
基于相角差的绝缘子表面污秽受潮检测系统设计与仿真