APP下载

基于WGAN-GP 的变压器故障样本扩充模型的构建与评价

2022-08-01锦,徐

光源与照明 2022年3期
关键词:梯度变压器神经网络

王 锦,徐 新

西安工程大学 电子信息学院,陕西 西安 710048

0 引言

变压器的运行状态严重影响电能质量和系统安全,及时准确地诊断其内部故障具有现实意义[1]。

油中溶解气体法(Dissolved Gas Analysis,DGA)是早期变压器内部故障应用最广泛的方法之一。随着智能技术的发展,很多学者在DGA 的基础上用模糊理论、专家系统、神经网络等方法进行变压器内部故障诊断[2],取得了显著的成果。许多学者[3-5]通过建立不同的网络模型,对变压器内部故障类型实现分类。训练的数据集中变压器故障样本数据少,正常样本数量多,基于神经网络的变压器故障诊断模型是在平衡数据的基础上进行研究。大多情况下,变压器的故障数据不易获取、占比低,导致正常样本与故障样本存在严重的不平衡问题,在数据集失衡的情况下,网络诊断模型误判率较高[6]。

生成对抗网络(Generative Adversarial Networks,GAN)作为非监督式的深度学习模式,以尽可能模仿与真实样本相同分布的数据为目的,具有充分拟合数据、训练速度快、生成样本锐利的优点[7]。因此,一些学者采用GAN 对原始数据集进行扩充,以获得尽可能多的故障类型样本。然而原始GAN 在训练过程中梯度不稳定,无法保证生成样本的质量,导致生成样本不符合真实样本分布或不满足整体分布。

针对上述问题,文章采用一种变体的生成对抗网络(Wasserstein Generative Adversarial Networks -Gradient Penalty,WGAN-GP)模型重构数据集,用新的数据集训练BP 神经网络。WGAN-GP 解决了GAN 模型不稳定问题,确保了生成样本的多样性,改善了WGAN 中为满足1-Lipschitz 连续性条件所使用的权值裁剪约束参数对网络的影响。仿真结果表明,利用生成对抗网络样本增强技术,重构数据集能有效提高模型故障分类准确率,减小BP 神经网络误差,具有一定可行性和可靠性。

1 WGAN-GP 基本理论

1.1 GAN

GAN 是一种基于对抗理论的生成模型,主要由生成器和判别器两部分组成[8]。训练过程中,生成器G构建满足联合高斯分布的映射空间Pr,使得输入噪声z拟合真实样本从而生成新的样本分布Pg。判别器将真实样本和生成样本同时作为输入,区别样本真假,找到使生成器和判别器代价函数最小的位置,达到纳什均衡。

GAN 完成对抗训练的目标函数如下所示,整个优化过程视为最大-最小化问题。

式中:Pr为真实数据概率分布;Pg为生成数据概率分布;G(z)表示生成数据;D(x)为判别器网络输出。优化过程中,判别器的目的是让优化过程取最大值,即真样本的概率接近于1,假样本的概率接近于0。生成器的目的是让优化过程取最小值,即真样本为真的概率趋近于0,假样本为真的概率趋近于1。要求生成数据的判别值对生成的G(z)数据判别为真实样本的概率D(x)尽可能小,而要求对真实数据x判定为真的概率D(x)尽可能大。即logD(x)尽可能小,log {1-D[G(z)]}尽可能大。

1.2 WGAN-GP

GAN 利用KL 散度和JS 散度计量样本分布的距离,当生成样本和真实样本分布存在明显差异时,当Pg(x)=0 时,KL 散度会趋于无穷大,JS 散度变为常数,导致GAN 在训练过程中出现梯度消失现象,不利于生成器学习真实样本分布,使模型训练停滞不前,出现梯度消失、模型坍塌等现象。因此,在GAN 模型中引入Wasserstein 距离,确保梯度平滑,使真实数据与生成数据重叠少或没有重叠,依然能够度量二者之间的距离,提供有意义的梯度信息,解决GAN 训练数据不稳定和模式崩溃的问题。其中Wasserstein 距离的定义如下:

式中:γ∈Π (Pr,Pg)为所有可能组合的联合分布(Pr,Pg)集合;x为真实样本;y为生成样本;x-y为真实样本与生成样本间的距离。

虽然WGAN 的训练不需要使判别器和生成器达到纳什平衡,只要判别器训练良好,生成器就能生成真实样本,避免梯度爆炸。但WGAN 中采用Lipschitz权值裁剪限制判别器子网络的权值参数范围,使得网络参数十分极端,很大程度上限制了网络性能,减弱了神经网络的拟合能力。而且权值裁剪的范围以专家经验为主,通过人为确定方式设定网络参数,容易导致参数设置不恰当,重新导致梯度爆炸和梯度消失现象。因此,WGAN-GP 引入梯度惩罚(Gradient Penalty,GP)项,改善WGAN 中为满足1-Lipschitz 连续性条件所使用的权值裁剪约束参数对网络的影响,梯度惩罚定义如下:

式中:λ代表惩罚系数;χ代表整个样本空间分布,即生成样本和真实样本分布总和;∇D(x)代表判别器的梯度。

目标函数表达式如下:

WGAN-GP 保留WGAN 中梯度更新的优点,引入梯度惩罚策略改善参数分布极端的弊端,保证梯度的稳定更新,有效地解决了梯度爆炸的问题。因此,WGAN-GP 模型能够提供有更具意义的梯度信息,稳定训练生成器和判别器,提升网络性能,输出最优样本。

2 基于WGAN-GP 的变压器故障样本扩充模型

2.1 WGAN-GP 故障样本生成模型设计

原始GAN 采用层间全连接的多层感知器,构建生成器和判别器,全连接网络中存在大量参数影响训练速度,而基于WGAN-GP 的变压器故障样本生成模型中用卷积层代替全连接层,通过卷积核权值共享的概念减少模型参数。其主要步骤如下:

(1)人为划分数据集,确定少数类样本,将其作为WGAN-GP 故障样本生成模型的训练集;

(2)根据判别器、生成器、数据维度设置WGANGP 模型参数;

(3)用不平衡数据集训练WGAN-GP 模型,得到训练好的判别器和生成器模型;

(4)给训练好的WGAN-GP 模型一个随机噪声作为输入,得到一组新的故障样本;

(5)通过t-SNE 数据降维对生成样本进行可视化操作,观察样本分布情况,判断生成样本与真实样本是否具有相同分布;

(6)重复步骤3~步骤5 扩充不平衡样本集,使其与正常类别数据数量相同,解决数据集不平衡问题,重构数据集。

2.2 模型建立与参数选择

使用Python Tensorflow 建立故障数据生成仿真模型,从公开发表的文献中收集数据,低能放电、高能放电、中低温过热、高温过热故障样本数量各20 组,正常样本数量100 组,其中140 组作为训练集,其余作为测试集,故障样本随机分布。

通过公式(5)可知,

对数据集中特征气体(H2、CH4、C2H2、C2H4、C2H6)含量进行归一化处理,避免数据量纲不同影响模型训练速度。选择Leakyrelu 作为WGAN-GP 故障样本生成模型的激活函数。输入数据,后判别器的设计结构包括3 个卷积层、2 个Batch_normalization 层和1 个全连接层。

此次实验由于样本数量少,为避免实验过程中出现判别器过度训练,将所有生成样本均判别为假,设置每次迭代过程每训练2 次生成器,训练判别器1 次,并且在迭代3 000 次后每100 次输出一次结果作为生成样本,完成样本扩容。

3 结果分析

样本扩容后,由于每组数据都具有5 个维度信息,从数字很难判别生成样本的质量,因此利用t分布邻域嵌入数据降维技术对高维的故障样本数据进行降维可视化处理,通过样本分布分析判断生成样本是否满足研究要求。

3.1 生成样本分析

文章以H2、CH4、C2H2、C2H4、C2H6特征气体作为变压器的故障特征,利用t-SNE 数据降维技术,通过WGAN-GP 网络对4 类故障数据进行数据扩充,将5 维数据映射到2 维空间,对故障数据进行聚类和可视化。为保证生成样本接近原始样本,对数据进行预处理时按照特征量逐列进行归一化操作。并且对WGAN-GP生成样本进行反归一化时,也按照当前特征量的最大值和最小值进行操作,得到最终的生成样本。将生成样本与真实样本进行数据集重组前,同样先通过t-SNE数据降维技术分析生成样本与真实样本是否具有相似的样本分布,确保重构的数据集中生成样本所具有的故障特征能够为故障分类器的训练提供有效信息。各故障类别生成样本与真实样本对比如图1~图4 所示。

图1 低能放电故障

图2 高能放电故障

图3 中低温过热故障

图4 高温过热故障

为准确体现数据扩充技术对故障诊断准确度的影响,使实验具有对比意义。研究在不改变测试集的前提下仅对训练集进行数据扩容,将每种故障类型训练集由15 组扩充到80 组,保证重构数据后故障样本与正常样本的训练集数据量均为80 组。

由于变压器油中溶解气体和故障类型的复杂关系,故障数据中存在个别异常数据,具体表现为可视化后与样本中心点距离较远。虽然这类样本对生成样本存在一定影响,但WGAN-GP 丰富了生成样本的多样性,并未出现生成样本高度重合现象。总体生成样本较好地模仿了真实样本分布,因此重构的数据集可以满足分类器学习故障特征所需。

3.2 基于BP 神经网络的变压器故障诊断

文章采取随机划分数据集的方式,从180 组中随机抽取40 组数据作为测试数据,其余140 组数据作为训练数据。五种故障特征气体归一化后的故障样本数据作为BP 网络的输入,对应的五种变压器故障类型经过编码后作为模型输出。根据变压器样本类型和经验确定各层神经元数量为5-15-5 的BP 网络诊断模型。其中,Sigmoid 函数作为神经网络的激活函数,加入softmax 层对网络输出值进行转换,网络模型的训练目标为1×10-5,学习率为0.01,最大迭代次数为500 次。

采用140 组真实样本和400 组重构数据样本训练BP 神经网络,不同数据集下变压器故障诊断误差及诊断结果如图5、图6 所示。

图5 基于不同数据集的BP 神经网络误差曲线

图6 基于不同数据集的BP 神经网络分类结果

实验表明,BP 神经网络具有处理变压器故障数据的能力。然而,数据集不平衡问题导致BP 神经网络无法充分学习少数类样本的故障特征,导致故障诊断模型的分类准确度不高,均方误差大、故障分类的精度较低,无法满足预期要求。采用重构数据集训练BP神经网络,有效减小计算误差,提升模型分类准确率,其均方误差和准确率分别为1.848%和80%。结果表明,WGAN-GP 生成故障数据后重构的数据集能丰富故障特征信息,改善真实数据集不平衡的缺陷,提升故障诊断模型的性能。

4 结论

针对变压器故障数据少,样本数量不平衡导致神经网络的故障诊断模型正判率低的问题,文章提出用变体的生成对抗网络WGAN-GP 扩充故障样本平衡数据集的方法。采用重构数据集训练BP 神经网络,提高了网络的诊断性能。仿真结果表明,数据集不平衡时对神经网络诊断性能的影响较大,验证了WGAN-GP扩充变压器故障数据集的可行性。

猜你喜欢

梯度变压器神经网络
带非线性梯度项的p-Laplacian抛物方程的临界指标
基于递归模糊神经网络的风电平滑控制策略
10KV变压器配电安装柜中常见问题分析
理想变压器的“三个不变”与“三个变”
神经网络抑制无线通信干扰探究
一个具梯度项的p-Laplace 方程弱解的存在性
基于神经网络的中小学生情感分析
基于AMR的梯度磁传感器在磁异常检测中的研究
变压器光纤测温探头的安装固定
基于数字虚拟飞行的民机复飞爬升梯度评估