APP下载

基于轨迹图像与卷积神经网络的电缆早期故障识别

2022-09-21张毅斌李梦诗徐子弘张禄亮季天瑶陈子明

广东电力 2022年8期
关键词:周波扰动轨迹

张毅斌,李梦诗,徐子弘,张禄亮,季天瑶,陈子明

(华南理工大学 电力学院, 广东 广州 510641)

相比于架空线,电缆具有占地面积小、受天气因素影响小、美观等特点,目前越来越多地应用在城市配电网中[1-4];然而,电缆通常采用直埋、保护管和电缆沟等方式敷设,导致其运维和检修便利性都欠佳[5-6],因此如何有效且方便地监控电缆实时运行状态尤为重要。据统计,在排除人为破坏的因素后,电缆故障的主要原因是电缆主体及其附属元件的老化[7]。通常电缆因老化问题发生永久故障前会经历早期故障阶段,在此阶段,故障的主要表现形式为间歇性电弧放电[8]。文献[9]记录了电缆早期故障的现场波形,从现场波形中可以发现,电缆的早期故障通常会引起电流幅值的较大幅度扰动。

此外,文献[10]指出电缆的早期故障不会引起常规继电器的动作。如果将电缆早期故障引起的过流扰动与其他情况的过流扰动准确区分开来,就能够及时识别电缆的早期故障,进而可以在电缆发生永久性故障前安排电缆线路的检修,避免电缆发生非计划停电。

电缆的早期故障按照其持续时间的长短可以分为半周波早期故障和多周波早期故障,半周波早期故障的持续时间通常在1/4~1/2周波之间,多周波早期故障的持续时间为1/2~4周波[11]。目前,国内外针对电缆早期故障的识别问题已有许多研究。文献[12]首先利用自编码器对各种过流扰动电流信号进行降维,然后利用门控循环单元(gate recurrent unit,GRU)神经网络基于降维后的数据特征实现电缆早期故障的识别;文献[13]首先使用受限玻尔兹曼机提取原始数据的特征,然后借助堆叠自动编码器进行过流扰动的分类识别。以上2篇文献的数据特征提取都是通过神经网络自动进行的。在文献[14]中,研究人员使用小波变换完成原始数据中的特征提取工作,然后借助卷积神经网络(convolutional neural network,CNN)实现电缆早期故障的识别。文献[15]提出一种利用S变换进行特征提取,然后借助堆叠自动编码器进行电缆早期故障的识别方法。与以上方法不同,文献[16]没有通过线路的电流信号进行早期故障的识别,而是提出使用电缆屏蔽层电流信号来识别电缆早期故障的方法,借助阈值的设置识别早期故障的发生。

总结目前电缆早期故障的识别方法,可以发现电缆早期故障的检测识别大致分为2个步骤,步骤1是特征提取,步骤2是分类识别。在步骤1中,不同的研究采用的特征提取方法各不相同,一类是借助神经网络完成特征提取[12-13],另一类则通过信号处理的方式完成[14-15];而在步骤2中,有的采用了人工设定阈值的方式来进行[16],另一类则通过神经网络完成对特征的自动分类[12-15]。

本研究首先利用相空间重构(phase space reconstruction,PSR)技术重构电缆电流信号;然后根据重构结果绘制电流信号的相空间轨迹,获取电流信号的轨迹图像;最后,搭建用于轨迹图像分类识别的CNN,并利用轨迹图像训练网络,使网络可以根据输入的轨迹图像完成电缆早期故障信号的分类识别。为了验证所提方法的可行性,利用在PSCAD/EMTDC中仿真获得的数据进行评估。在评估测试中,首先测试所提方法对训练样本数量的依赖度,然后对比其他机器学习算法对轨迹图像和原始数据的识别能力,最后测试所提方法的鲁棒性。

1 理论背景

1.1 相空间重构

PSR是通过设定1个延迟参数和1个嵌入维度,将一维序列嵌入到高维空间中,进而挖掘一维序列中内在特征的数据重构方法[17-18]。例如,对于长度为N的时间序列x(t)={x1,x2,…,xN},在给定延迟参数τ和嵌入维度m后,可以将x(t)嵌入到指定的嵌入维度空间中得到X,

(1)

式(1)中L为重构后相空间中坐标的个数,其数值可以根据已知的延迟参数τ、嵌入维度m以及序列的长度N计算,即

L=N-(m-1)τ.

(2)

X中的各行可以用Xi表示,视为m维空间中的坐标。

1.2 卷积神经网络

1.2.1 CNN的基本结构

CNN的基本结构如图1所示,主要包括卷积层、池化层、全连接层3种结构。输入层通常为图片或数据矩阵;隐藏层为CNN的主体部分,作用是对输入数据的特征进行提取和计算分析;输出层则为应用场景要求的数据类型,分类问题输出的是类别,回归问题输出的是数值。

图1 CNN的基本结构

卷积层的主要结构是卷积核,卷积核以滑动扫描的方式在输入图像上提取图像特征,或在上一层输出的特征图上进一步分析特征图的特征。卷积层的数学表达形式为

(3)

式中:yl,j为第l层中第j个特征图;yl-1,i为第l-1层中的第i个特征图;n为第l-1层中特征图的总数;符号“⊗”代表卷积运算;vl-1,l,j为第l-1层和第l层之间第j个卷积核;bl-1,1为第l-1层和第l层之间卷积层的偏置;f(⋅)为激活函数,常见的激活函数包括sigmoid、tanh和ReLU等。

池化层采用1个特定大小的窗口按照设置的步长在特征图上滑动,提取窗口中特征数据的最大值或平均值,再根据得到的特征数据组成1个维度更小的特征图。

全连接层的作用是根据卷积层和池化层提取的特征数据,实现分类功能,其数学表达形式为

o=f(ycwc+bc).

(4)

式中:o为全连接层的输出;yc为输入全连接层的特征图;wc、bc分别为全连接层的权重、偏置。

1.2.2 优化CNN的方法

在实际应用中,ReLU激活函数的综合表现性能通常高于其他激活函数[19],因此通常将ReLU作为卷积层的激活函数,其数学表达形式为

(5)

在使用ReLU激活函数前通常会先利用批量归一化(batch normalization,BN)层将数据进行批量归一化。BN层可以让CNN加稳定,防止出现“梯度爆炸”和“梯度消失”的问题[20],其数学表达形式为

(6)

在全连接层之前还可以加入1个全局平均池化层,不仅可以增强特征图与输出结果的联系,还能达到降采样的功能,极大地减少全连接层的神经元数目[21]。

2 方法实现

基于轨迹图像和CNN的电缆早期故障识别方法的流程如图2所示。

图2 方法流程

首先,通过仿真获取半周波早期故障、多周波早期故障、电容投切、励磁涌流、负荷突增和永久故障的电流数据(长度为N的时间序列),并对仿真数据进行数据归一化处理,归一化的方式为

(7)

接着,借助PSR技术对各种过流扰动的样本进行数据重构,根据重构的结果绘制相应的轨迹图像;然后,设计搭建1个CNN,并从仿真数据中按照一定比例随机抽取部分样本作为训练样本来训练网络;最后,将其他未被用于训练的样本作为测试样本进行识别测试,检测CNN对早期故障的识别能力。

2.1 电缆早期故障仿真

本研究利用PSCAD/EMTDC搭建如图3所示的10 kV电缆仿真实验模型,图中:us为母线电压;is为母线流入电缆的电流;模块①用于模拟励磁涌流;模块②用于模拟早期故障;模块③用于模拟电容投切;模块④用于模拟永久故障;负荷突增的情况通过在线路末端接入新的负载来模拟。电缆全长4 km,为YJV22-8.7/15kV型号的3芯电缆,标称截面积为300 mm2。仿真时电缆导体的电阻率设置为1.84×10-8Ω·m,绝缘层相对介电常数设置为2.3。选用Frequency Dependent(Phase)Model模型作为电缆的仿真模型,该模型可以表征线路在全部频率范围内的特性,是目前较精确的传输线仿真模型[22]。

图3 电缆仿真模型

早期故障的仿真采用图4所示的电弧串接电阻的方式,可以通过改变串接电阻R的阻值大小,模拟不同老化程度下电缆发生的电弧。图4中:u为电弧模型两端电压;G为电弧电导。

图4 电缆早期故障仿真模块

本研究采用的电弧模型是基于介质击穿原理的电弧模型[23],模型中电弧电导

(8)

式中:g1、g2、u1、u2均为仿真实验中电弧模型的参数设置,g1=0.01 S,g2=0.2 S,u1=1 kV,u2=6.8 kV;k1、k2均为整定系数,可由g1、g2、u1、u2根据边界条件计算得到。

图5为电弧模型仿真获得的电流波形,其中电流数据已做归一化处理。由仿真波形可以发现电弧电流在过零点附近出现了明显的“零休”现象,符合实际电弧电流的表现特点[24]。

图5 电弧电流仿真波形

在模型搭建完成后,通过改变接入电缆仿真模型中的故障模块,模拟不同的扰动情况,并通过改变故障模块的接入位置,以及利用PSCAD/EMTDC中的Multiple Run元件,改变各个故障模块的接入时间,获得了3 000个过流扰动样本,每种过流扰动的样本数量为500。

图6是基于PSCAD/EMTDC仿真获得的电缆半周波早期故障、多周波早期故障、永久故障、励磁涌流、电容投切和负荷突增的电流波形。波形的采样频率为10 kHz,即每个工频周期的采样点为200个。观察仿真波形可以发现,电缆发生半周波早期故障或电容投切时,电流波形会经历约1/4周波时长的扰动过程,2种扰动的持续时间和幅值比较接近,因此电缆半周波早期与电容投切引起的过流扰动很容易混淆。对于多周波早期故障,其波形扰动的幅值以及扰动的持续时间,与变压器空载合闸时产生的励磁涌流的特征相接近,因此在识别多周波早期故障时需要区分励磁涌流。此外,本研究还对永久故障和负荷突增的过流扰动进行了仿真,以检验所提方法对其他扰动波形的区分能力。

图6 过流扰动波形

2.2 基于PSR绘制轨迹图像

在进行PSR前,根据式(7)首先对仿真获得的电流数据进行归一化处理,然后根据PSR的原理重构数据。本研究选定PSR的维数m为3(即三维空间内对获得的数据进行PSR),时间延迟τ选定为半个公频周期(即100个采样点),得到在三维平面内一系列的轨迹点坐标:

(9)

图7 空间轨迹及其投影

2.3 基于CNN的轨迹图像分类识别

本文设计搭建的CNN的主体结构见表1。限于表格篇幅大小,每个卷积层后的BN层和ReLU激活函数没有在表格中体现。表1中:卷积层的ain、aout分别为卷积层的输入、输出通道数量;全连接层的bin、bout则分别为全连接层输入、输出特征的数量;ks为卷积核或池化窗口的大小;s为卷积核或池化窗口移动的步长;p为填充的大小。最后一层的输出为1个索引为0~5的、含有6个元素的向量,向量的最大值所在的位置索引即为神经网络预测输入数据的所属类别。本研究将半周波早期故障、多周波早期故障等各种扰动按照图6中的顺序依次编排为0~5,输出的预测类别为0代表神经网络判断输入的轨迹图像属于半周波早期故障,以此类推,输出的预测类别为5则代表神经网络判断输入的轨迹图像属于永久故障。

表1 本文CNN的主体结构

RGB色彩模式是常用的颜色标准,图像中颜色信息用红绿蓝3种基本颜色叠加表示,图像的RGB通道包含了图像中各种颜色在红绿蓝3种基本颜色中的分量,3个通道分别对应3个像素矩阵﹝例如,对于图像中RGB值为(255,255,0)的黄色像素,通过RGB通道读取的该像素的结果为:通过蓝色通道获取的像素矩阵中对应位置的像素数值为0,通过红色通道和绿色通道获取的像素数值均为255﹞;因此,通常CNN在进行图像处理时,是根据图像的RGB通道读取图像的。而在本研究的应用场景中,空间轨迹在各平面的投影可以处理成单通道二值图像,即轨迹图像经过的像素点的值为1,没有经过的像素点的值为0。于是,在设计CNN时,依旧保留3个输入通道,但输入的图像不再是1幅普通的3通道图像,而是1幅由3个平面投影的轨迹图像经二值化处理后重组而成的图像,3个输入通道分别读取3个平面的轨迹图像。

在神经网络的训练过程中要用到损失函数来评价神经网络的预测精度,本研究采用“Softmax+交叉熵”的形式构成损失函数。

Softmax函数

(10)

式中oi为全连接层的输出o的元素。经过Softmax计算后,CNN输出转换为元素大小在0~1之间、包含j个元素且元素之和为1的向量,这样每个元素的数值可代表神经网络预测该数据属于对应类型的概率。接着,采用独热编码技术对输入标签进行编码,即对于包含j种类型的数据,编码后数据标签为包含j个元素的向量,向量中每1个元素代表1种类型,当数据属于第i种类型时,则向量中对应的第i个元素的值为1,其他元素的值为0。

理想情况下,对于属于第i种类型的数据,神经网络预测该数据属于第i种类型的概率为1,属于其他类型的概率为0,即预测标签P为包含j个元素且第i个元素数值为1、其他元素数值为0的向量,与其输入标签采用独热编码生成的向量L一致,即P=L。为了评价P与L的差异程度,可采用交叉熵kloss,j进行计算,其计算公式为

(11)

式中:li为输入标签独热编码生成的向量L的第i个元素;pi为预测标签P中第i个元素的数值。根据输入标签与预测标签的差异,再通过反向传播调整CNN中各层的权值和偏置等,进而缩小输入标签与预测标签的差异,形成更加准确的神经网络。

3 方法测试与讨论

为了全面验证所提方法在识别早期故障中的性能表现,引入了准确率A、精确率Pre、召回率Rec和F1值4个评价指标:

(12)

(13)

(14)

(15)

式(12)—(15)中:kTP为预测结果中预测为早期故障且实为早期故障的样本的数量;kTN为预测结果中预测为非早期故障且实为非早期故障的样本的数量;kFP为预测结果中预测为早期故障但实为非早期故障的样本的数量;kFN为预测结果中预测为非早期故障但实为早期故障的样本的数量。准确率、精确度、召回率和F1值这4个评价指标的值在0~1之间,指标越接近1,说明所提方法的性能表现越好。

此外,为了考察所提方法对过流扰动的整体分类识别性能,本文引入全局准确率Aglo,

(16)

式中:Ncor为测试样本中被正确分类到对应扰动类型的样本数;Ntot为全部的测试样本数。

3.1 训练样本数量对算法的影响

本文首先测试算法对训练样本数量的依赖度,依次按照0.5、0.25、0.1和0.05的比例从样本中随机抽取训练样本用于网络训练,采用全局准确率指标对算法进行考核,测试结果如图8所示。

图8 训练样本数量对算法的影响

由图8可以看出,利用所搭建的CNN能够准确分类各种过流扰动,进而实现电缆早期故障的识别。值得注意的是,算法可以在训练样本数量很少的情况下达到很高的全局分类准确度,当训练样本比例为0.05时,训练样本数量仅有150个,而测试样本数量为2 850个。

3.2 算法对比

为了进一步评估算法的性能,对比其他机器学习的方法与本研究的算法,对比时训练样本在全部样本中的占比为0.05。分别比较了支持向量机(support vector machine,SVM)、K近邻算法(K-nearest neighbor algorithm,KNN)和决策树(decision tree,DT)在相同训练样本和测试样本下识别早期故障的性能。实验分别测试输入为轨迹图像和按式(7)归一化后的原始数据时算法的表现。其中由于归一化的原始数据为一维时间序列,处理原始数据的CNN和处理轨迹图像的CNN在结构上稍有差异,具体而言,除了处理原始数据的CNN采用的卷积核和池化层均改为一维外,2个CNN其他参数设置相同,均含有BN层和全局平均池化层等结构。实验对比的结果见表2。

表2 不同算法的对比

从表2可以发现,整体而言,相较于直接输入原始数据,借助PSR绘制轨迹图像,再将轨迹图像作为分类依据,可以提升各种算法对电缆早期故障的识别能力。此外,无论输入是轨迹图像还是原始数据,CNN的表现性能都要优于其他机器学习的算法。具体到各种算法组合的表现性能上看,基于轨迹图像与CNN的算法表现最佳,其次是基于轨迹图像与SVM的算法。

3.3 鲁棒性测试

现实工作情况中采集的信号通常是伴有噪声的,本研究对原始数据添加不同比例的高斯噪声,模拟信噪比为30 dB、25 dB、20 dB和15 dB的采样环境,然后利用加入噪声后的数据进一步测试基于轨迹图像与CNN、基于轨迹图像与SVM的2种算法的鲁棒性,测试结果如图9所示,图中折线PSR-CNN为基于轨迹图像与CNN的算法测试结果,折线PSR-SVM为基于轨迹图像与SVM的算法测试结果。

图9 不同高斯噪声下的分类结果

由图9可以发现:无论在何种信噪比下,基于轨迹图像与CNN的方法均比基于轨迹图像与SVM的方法表现得更好;且基于轨迹图像与CNN的方法表现出了极高的鲁棒性,即使在信噪比仅有15 dB的情况下,F1值也能达到0.976 8。

4 结束语

本文提出了一种基于相空间轨迹图像与CNN的电缆早期故障识别方法,根据CNN的基本结构和优化方法,自主设计了用于轨迹图像识别的CNN,并利用PSCAD/EMTDC仿真获得的数据样本测试所提方法。测试结果表明,基于轨迹图像和CNN的早期故障识别方法仅需少量样本就能表现出很好的电缆早期故障识别能力。此外,在与其他算法的对比中发现,相较于直接用原始数据,借助相空间轨迹图像识别电缆早期故障可以达到更高的精度,这也从侧面说明了PSR技术具有挖掘数据内在特征的能力。而在对所提方法的鲁棒性测试中发现,算法具有极高的鲁棒性,能够在低信噪比的环境下准确识别电缆早期故障,具有在实际场景中推广应用的潜力。

猜你喜欢

周波扰动轨迹
一类受随机扰动的动态优化问题的环境检测与响应
一类五次哈密顿系统在四次扰动下的极限环分支(英文)
A Note on the Distance Signless Laplacian Spectral Radius
解析几何中的轨迹方程的常用求法
基于增强型去噪自编码器与随机森林的电力系统扰动分类方法
周波
带扰动块的细长旋成体背部绕流数值模拟
轨迹
轨迹
基于在线轨迹迭代的自适应再入制导