APP下载

基于多层卷积神经网络的变电站异常场景识别算法

2018-07-28孟格格高强

电测与仪表 2018年5期
关键词:置信度识别率卷积

孟格格,高强

(华北电力大学 电气与电子工程学院, 河北 保定 071003)

0 引 言

在视频监控中,异常场景是不常发生的。因此,通过人工长时间监视图像信息,以便发现异常情况,但这样很容易产生疲劳,对一些异常情况也难以及时准确地做出判断,降低了视频监控系统的建设意义。实际中,应自动分析视频内容,检测实际场景中的异常事件,从而实现监控的智能化和高效化。在电力系统中,已建立了大量的视频监控系统,如何实现对变电站异常情况的自动检测,如输电线路或变电站冒烟、着火,限制、危险区域有人员进入等具有很大意义。国内外对异常场景的研究,更多的是针对特定问题提取特征描述,采用分层模型以及训练算法等[1]实现检测。通过机器学习使计算机模仿人类从实例中学习的能力进行数据分析和建模,使它能够对未知输出做出尽可能正确的预测[2]。文献[3]将模式识别技术应用在变电站视频监控中,实现了对无人值守变电站监控视频异常模式的识别。文献[4]将视频前后帧之间的相关性应用在视频监控中,提高对人脸识别算法的稳定性。

深度学习是机器学习中的一个新的研究领域,通过深度学习的方法构建深度网络来抽取特征是目前图像识别中得到关注的研究方向。卷积神经网络(Convolutional Neural Network,CNN)作为深度学习的一种,被广泛应用在图像识别中,当训练样本充足时,CNN在一些模式识别任务上表现出了优越的性能,但训练样本稀少时,难以达到预期的效果。因此研究卷积神经网络的小样本处理策略是非常必要的[5]。在监控场景下,绝大部分内容属于正常场景,对异常场景的检测属于小样本识别问题。在小样本情况下,文献[6]设计一种深度卷积神经网络结构,实现对火灾图像深层次特征的自动提取,并提出一种参数替换方法,大大提高识别率。文献[7]针对传统的基于稀疏表示的人脸识别方法,对类内变化鲁棒性不强的问题,从特征的层面入手,利用深度卷积神经网络提取对类内变化不敏感的人脸特征,然后通过稀疏表示对所得人脸特征进行表达分类。

在对正常、异常场景的识别中,两种场景识别错误对我们造成的影响是不同的,不能仅追求总体识别率。在允许对正常场景有一定误判的前提下,要求对异常场景的漏判率越低越好。多层、多级网络结构已经被提出且得到应用,如文献[8]将多个神经网络和不同特征提取方法有机地结合集成在一起,而构成多级神经网络结构,提高网络对样本的识别率,文献[9]通过第一级神经网络剔除无效数据,再将有效数据输入第二级神经网络得到更精准的声源坐标。但通过分层来更好实现对小样本识别的研究却很少,基于此,依据小样本信息,引入置信度的概念,提出多层卷积神经网络(Multilayer Convolutional Neural Network,M_CNN)模型,在上一层训练中难以识别的样本进入下一层,重新进行特征的提取以及识别。在MNIST手写体库上的实验表明,该模型在针对小样本识别问题时,具有更好的性能。最后,将该模型应用在变电站异常场景识别中,取得了良好的效果。

1 多层卷积神经网络模型

卷积神经网络分类器一般为全连接人工神经网络,其中,使用比较广泛的是softmax分类器。在多分类问题中,数据的类别标签y的取值为k个,对于给定的输入数据x,估算出对于每一个类别j(j=1,2,……,k)的概率值P(y=j|x)。即想估计x作为输入出现时,每一种分类结果出现的概率。

(1)

式中θ指网络训练好的参数。在卷积神经网络的输出层中,选取概率值最大的类别j作为分类的结果,在样本分类中,由于样本特征提取不完全或者网络参数调整不佳会导致误判。对于某输入样本而言,其属于某类别j的概率值越大,分类的准确性就越高。MNIST手写体库测试结果如下,图1代表错误识别样本的样本号以及对应的最大概率值,图2代表正确识别样本的样本号以及对应的最大概率值,图中横线均代表最大概率值的平均值。

图1 错误识别样本散点图

图2 正确识别样本散点图

由图1和图2可以看出正确识别样本其最大概率值的平均值要远大于错误识别样本最大概率值的平均值。说明样本特征空间离某类越近,越能被训练好的网络正确的识别。反之,若与任何一类的距离都较远,则不能被所训练好的模型识别。由此,根据网络对样本的输出信息并结合置信度的概念,设计一个置信度判决函数,满足判决条件的,直接识别输出,不满足条件的样本,进入下一层,用这些样本来训练新的网络结构,并进行识别判决。系统结构如图3所示。

图3 多层卷积神经网络结构图

2 置信度判决函数

文献[10]在CNN中加入置信度机制的研究,采用美国stanford大学统计学教授Efron提出的用于统计推断的方法Bootstrap来估计置信区间。文献[11]则指出,用Bootstrap方法产生的随机样本是有偏差的,在小样本情况时要慎用该方法。文章依据奈曼皮尔逊准则提出的统计学的假设检验中存在着两类错误,根据不同的情况,这两类错误对结果的影响也不同。在根据两类不同错误对检验结果的重要性的基础上,预先定下其中一类错误的风险概率,求出适当的判别界。在对正常、异常场景分类中,将正常场景识别为异常场景,属于“误判”,这时,人工只需忽略这些误判的情况,如果将异常场景识别为正常场景,属于“漏判”,将无法在第一时间去制止事故的进一步恶化。因此,要能够以非常高的置信度给出对异常样本检测的结果,即先给出置信度,根据置信度算出判决门限。根据奈曼皮尔逊准则,其漏判概率为:

(2)

式中ZT指判决门限;f(x)指概率密度函数。在实际中,对于小样本情况,很难得到概率密度的显式表达式,因而只能以其统计特性来确定最优门限值。假定网络对异常样本输出的最大概率值服从均值为μ,方差为σ2的正态分布,如果给定漏检率,则可反推得到门限值。在该模型中,如设定漏检率为0.01,根据正态分布查表可得:

ZT=0.504×σ+μ

(3)

实际中,网络对小样本输出值的分布未必严格服从正态分布,所以,将其门限值定义为:

ZT=0.504×σ+μ+ρ

(4)

式中ρ是修正量,对应不同类型样本,ρ的取值不同。

3 标准数据库的实验验证

MNIST手写体数据库作为常用的标准数据库之一,共包含70 000张0~9的图片,每类7 000张,图片的分辨率为28×28。为验证文中算法对小样本数据识别的有效性,通过以下实验来观察其算法的性能。网络训练过程如下:(1)初始化第一层网络参数,将训练集样本X作为CNN网络的输入,逐层训练得到网络的输出,由代价函数得到网络的误差,并通过反向传播算法进行权值的修正;(2)对训练集X的样本进行测试,并进行置信度判决,选出其中不满足置信度条件的样本组成新的训练集X1;(3)用X1训练第二层网络,重复(1)、(2)直到该层样本中的小样本识别率达到最好,得到M_CNN模型;(4)对测试集的样本进行分类,不满足该层网络置信度条件的样本进入下一层网络进行分类,统计各层错误识别样本之和,得到M_CNN模型分类的正确率,并统计各层对小样本图像识别情况,得到识别率。

从MNIST手写体库中选取三类样本,前两类样本数均为1 000,在第三类样本分别选50, 100, 150, 200的前提下,对整体测试集的识别率以及对小样本集的识别率比较如表1所示。

表1 小样本数量变化对识别率的影响

由表1可以看出,多层卷积神经网络模型从识别率而言,与传统CNN模型相差不大,但由于在每层训练时依据小样本信息设置置信度,将不满足置信度条件的样本送入下一层进行重新训练与识别,增大了对小样本的识别率。在实验中,传统CNN模型对小样本集的识别率随训练集中小样本数目的上升呈上升趋势,最后稳定在94%,而M_CNN模型对小样本的识别率能达到100%。尤其在小样本数目较少时,传统CNN模型对小样本识别较差但所提出的模型已能对小样本实现很好的识别。

4 变电站异常场景识别的研究

上述实验证明文中模型在针对小样本识别时是非常有效的。在变电站监控场景中,异常场景的出现属于小样本事件,下面将M_CNN模型应用于实际的变电站异常场景识别中。

4.1 变电站正常异常场景数据库的建立

采集不同变电站正常运行状态下的图像作为正常样本,变电站中线路出现冒烟、起火,禁区有人闯入作为异常样本,用于对变电站异常场景的识别。该数据库共有2 000个样本,包括1 500幅正常场景的图像和500幅异常场景的图像。库中部分正常场景和异常场景样本如图4、图5所示。

图4 部分正常场景样本

图5 部分异常场景样本

4.2 变电站异常场景识别的实验

4.2.1 识别过程

实验从1 500张正常场景照片中随机选取1 200来训练,剩下的300张作为测试样本,同样,从异常场景照片中随机选取400张来训练,剩下100张作为测试样本。将样本大小归一化为64×64,作为网络的输入。由于样本数较少,为保证每层训练集样本的个数,采用两层卷积神经网络结构,具体训练过程如下:(1)初始化网络参数,第一层、第二层网络结构分别为:2C-(2×2)S-4C-(2×2)S-100F;4C-(2×2)S-8C-(2×2)S-100F,用训练集样本x来进行第一层网络的训练;(2)对训练集样本进行测试,计算置信度,不满足条件的样本组成新的训练集x1;(3)用x1训练第二层网络,得到两层卷积神经网络模型;(4)对测试集样本进行分类,不满足第一层置信度条件的样本进入第二层网络进行测试,统计两层错误样本个数和对异常场景识别情况,计算识别率。

4.2.2 实验结果

在4.2.1参数的基础上,CNN模型和M_CNN模型对训练样本和测试样本的识别率如表2所示,其中,识别率均取自对网络训练至收敛时的结果。除此,为了验证M_CNN模型在识别小样本时的有效性,本实验将M_CNN模型与文献[12]的CConvNet模型、文献[13]的3_CNN模型和文献[14]的DCNN模型进行对比。对于3_CNN和DCNN,分别与文中的M_CNN模型相结合,在第一层中,采取3_CNN、DCNN模型的结构,不满足置信度判决条件的样本用于进行下一层网络的训练,形成多层卷积神经网络结构。其中,识别率包括对训练集和测试集的识别率,以及对训练集和测试集中异常样本的识别率。

表2 不同算法识别率比对表

由表2可以看出,不同模型对训练集样本的识别率均高于对测试集样本的识别率,对异常样本的识别情况也如此。在对训练集样本的识别中,单层模型(如CNN、CConvNet、3_CNN、DCNN)对异常样本识别较差,尤其是3_CNN模型,对训练集中异常样本的识别率仅有30.25%,M_CNN模型在针对样本数较少的异常场景识别时,表现出巨大的优越性(能实现对异常场景的100%识别),除此,M_CNN模型对训练集整体的识别率也要优于单层模型。在对测试集样本的识别中,M_CNN模型的识别率也明显优于单层模型,3_CNN+M_CNN模型对测试集整体识别率最高,可达到88%且优于M_CNN模型的识别率(86.25%),但由于其模型复杂,训练时间长,而且我们更关注的是对异常场景的识别,在多层模型的前提下,均能实现对异常样本的100%识别。

5 结束语

文中对变电站异常场景的识别进行了研究,结合奈曼皮尔逊准则,提出了一种针对提升小样本识别率的多层卷积神经网络模型,简称M_CNN模型。依据网络对小样本的识别情况,设置置信度判决函数,对不满足条件的样本,重新进行特征的提取以及网络的训练,更符合人在识别物体时的习惯。因此,M_CNN模型可以有效的提高对小样本的识别率。MNIST手写体库的实验表明,在小样本数较少时,M_CNN模型就能对小样本实现很好的识别。将M_CNN模型应用在变电站异常场景识别中,也达到了较好的效果。

猜你喜欢

置信度识别率卷积
硼铝复合材料硼含量置信度临界安全分析研究
基于3D-Winograd的快速卷积算法设计及FPGA实现
基于类图像处理与向量化的大数据脚本攻击智能检测
从滤波器理解卷积
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
正负关联规则两级置信度阈值设置方法
提升高速公路MTC二次抓拍车牌识别率方案研究
基于傅里叶域卷积表示的目标跟踪算法
高速公路机电日常维护中车牌识别率分析系统的应用
置信度条件下轴承寿命的可靠度分析