APP下载

基于多分辨奇异值分解包和随机森林的电能质量扰动分类研究

2023-10-09张家宁罗月婉郭林明杨晓梅

计算机应用与软件 2023年9期
关键词:波包特征值特征提取

张家宁 罗月婉 郭林明 杨晓梅

1(四川大学电气工程学院 四川 成都 610065)

2(成都飞机设计研究所 四川 成都 610041)

Random forest

0 引 言

随着光伏发电和风力发电等新型能源以及电动汽车充电桩等非线性负载在电网中的接入,电网中的电能质量问题日益严重[1]。为了满足用电设备日益精密化的用电需求,需要对电能质量的单一和复合扰动进行准确识别,从而进行进一步的抑制和改善。

电能质量扰动(Power Quality Disturbances,PQD)[2]的分类本质是对存在PQD问题的信号先进行时频域的变换进而特征提取,再通过特征选择和分类进行故障信号的辨识。常见的用于PQD信号时频域变化的方法主要有短时傅里叶变换(Short-Time Fourier Transform,STFT)[1]、经验模态分解(Empirical Mode Decomposition,EMD)[3]、S变换(S Transform,ST)[4]、变分模态分解(Variational Mode Decomposition,VMD)[5]、离散小波变换(Discrete Wavelet Transform,DWT)[6]和小波包分解等。以上方法均被证明在一定使用条件下有较好的PQD问题分类能力,但是也存在一些不足:STFT对信号的瞬态特征捕捉效果欠佳;EMD存在易产生虚假分量的弊端;VMD计算复杂度较高,导致算法计算负担重等。其中,小波包分解使用常用的小波基Daubechies小波、Haar小波、Symlets小波和Coiflets小波等,通过多层分解将原信号进行多分辨率分解从而实现信号中特征信息的精细提取并完成分类识别[7]。但由于小波包的小波基选取对分类效果影响较大,对小波基的选取研究还有待进行。另一方面,近年来奇异值分解(SVD)在信号处理、滤波算法设计和特征提取等领域均被广泛应用[8],多分辨率SVD(Multi-Resolution SVD,MRSVD)被证明在微弱信号定位和复杂型号的弱故障特征提取领域效果均优于小波包的处理效果[9]。

鉴于此,本文受小波包分解信号的启发,提出一种基于多分辨SVD包分解与随机森林结合(MRSVD-RF)的PQD扰动识别算法。首先以多分辨SVD为工具,用类似小波包分解的形式,对PQD信号进行三层SVD包分解,再通过对分解后的分量子信号进行特征提取构成特征集,最后结合使用随机森林模型进行PQD信号的分类。实验表明,本文提出的算法对单一和复合扰动的PQD问题都有较好的分类效果。为了验证本文算法的优越性,本文还对比了基于小波包分解的特征提取与随机森林结合(Wavelet Packet and Random Forest,WP-RF)算法,并对不同的特征提取方式、分类器选取和特征值数量对PQD问题分类的影响都进行了讨论。

1 基于多分辨率SVD包的PQD信号分解

本文提出的MRSVD信号分解算法是受小波包算法启发,使用递归分解的形式将信号进行多层SVD分解从而实现多分辨率分析。通过对分解后的分量信号提取具有更高时频分辨率的特征信息,完成对信号的精确分类识别。本文算法的信号分解方式参考小波包分解信号的方式,为阐明MRSVD分解算法的步骤,先行对小波包分解算法的思想进行说明。

1.1 小波包变换的信号分解分析步骤

小波变换是一种对信号进行时频分析的变换方法,为了对信号进行有效的时频域分析,小波包在小波变换的基础上使用多分辨率分析的方法将信号的高低频成分进行分解,通过构造低通滤波器和高通滤波器,得到原始信号的低频系数(Approximate Coefficients)和高频系数(Detail Coefficients)[10]。与小波变换只分解低频系数不同,小波包变换将每层分解得到的新的低频系数和高频系数继续分解,这样通过多层次、多频带地将信号进行划分,使算法兼顾信号的时频分辨率,凸显子信号中的信号特征。小波包实现信号多分辨率分解的步骤如下。

图1 基于小波包变换的信号分解示例图

通过图1所示的结构对信号进行三层分解,实现了对信号的高低频成分的细化体现。由图可知,在对信号进行高、低频段分解后,第三层的子信号和原始信号关系如式(1)所示,经过小波包分解后的信号利用滤波器的共轭矩阵,同一层的子信号可以通过求和得出原始信号,是小波变换方法的优势之一。

f=fw(AAA)13+fw(DAA)23+fw(ADA)33+fw(DDA)43+fw(DDA)43+

fw(AAD)53+fw(DAD)63+fw(ADD)73+fw(DDD)83

(1)

以上对小波包分解算法实现原始信号的树形分解过程进行了说明,为实现多分辨率SVD分解信号方式提供了参考意义。

1.2 利用SVD包变换的信号多分辨率分解原理

为了实现对PQD信号的分解,本文由1.1节小波包分解得到启发,以SVD分解为工具,通过利用原始电压信号构造矩阵,使用类似于小波包分解树的信号分解方式,将PQD信号进行了多分辨率分解。经过分解后的分量子信号在扰动辨识时,可以从信号中获取更多的特征信息。本文对电压信号进行分解和处理,实现PQD问题的分类,多分辨率SVD包变换的PQD信号处理原理如下。

设电压信号为U(t),经采样后得到离散信号U(n),表示如下:

U(n)=[U1,U2,…,Un,…,UΖ]

(2)

式中:Z表示采样总点数。

SVD分解需要以矩阵为计算对象,矩阵的构造方法直接影响SVD对信号处理的效果,为了对信号进行SVD分解,首先需要将信号U(n)构造成二维的Hankel矩阵形式:

(3)

对矩阵H进行SVD分解,有:

H=UΣVT

(4)

式中:U∈R2×2与V∈R(Z-1)×(Z-1)为两个正交矩阵Σ=diag(αi),i=1,2,为一个大小为2×(Z-1)的对角矩阵且有α1≥α2,α1与α2对应矩阵H的两个奇异值。

通过SVD分解,可以获得一大一小两个奇异值,可以设想,如果由二者分别求得两个新的分量信号,再以两个新的分量信号为基础重新构造行数为2,形如式(3)的矩阵,就可以实现对第二层子信号的SVD分解,具体的分量信号重构与分解算法如下。

已知对由原始信号U(n)构造的矩阵SVD分解后的结果如式(4)所示,为了进行下一层SVD分解,将矩阵H用列向量u1∈R2×1和v1∈R(z-1)×1重写,重写后的矩阵H1与H2和矩阵H的关系如下:

(5)

H=H1+H2

(6)

式中:u1和u2分别为矩阵U的第1列向量和第2列向量;v1和v2分别为矩阵V的第1列向量和第2列向量。令H1=α1u1v1T,H2=α2u2v2T,此时H1对应原信号SVD分解后较大的奇异值,体现原信号的近似信号,H2对应原信号SVD分解后较小的奇异值,用以体现原型号中的细节信号,第三层信号的分解结果便由矩阵H1和H2的重构矩阵得来,方法如下:

显然,此时矩阵Hi和矩阵H均为两行Z列的矩阵,以矩阵H1为例,将其表示为:

(7)

通过类似于求两行Hankel矩阵的逆变换的形式,即将矩阵的第一行元素与最后一列元素进行组合的方式进行待分解子信号的重构,记为f1,则有:

f1=[h1h2…hz-1hz]i=1,2

(8)

显然,分量信号fi的数据元素完全继承于H1,即与奇异值α1相对应,是第一层SVD分解后原始信号近似信号的体现。同理,用同样的方式对矩阵H2进行重构可以得到反映原始信号细节信息的分量信号f2。至此,完成了对原始信号求取第一层分量子信号的任务,对应的分量子信号分别体现了原始信号的逼近信号和细节信号。

图2 基于SVD包变换的信号分解示例图

为了区分各层子信号的成分,使用字母a和d对子信号成分进行了标注:图中d表示细节信号;a表示近似信号;上角标序列号表示分解的层数(即尺度);下角标序列号表示在该尺度的分解下子信号的序号数。通过上述方式的分解,原始信号在不同尺度下被分解为多个子信号。多分辨SVD包分解相较于小波包分解的优越性在于分解过程不会产生相位失真,因此在使用子信号对PQD信号进行辨识时能够反映原始信号中扰动成分的真实大小。同时,此方法保留了小波包分解法满足叠加原理的优点,原始信号的还原可以通过简单的子信号求和得到,各尺度信号之间的关系如式(9)所示。

f=fs(a)11+fs(d)21=

fs(aa)12+fs(da)22+fs(ad)32+fs(dd)42=

fs(aaa)13+fs(daa)23+fs(ada)33+fs(dda)43+

fs(dda)43+fs(aad)53+fs(dad)63+fs(add)73+fs(ddd)83

(9)

为了直观地体现SVD包分解对近似信号和细节信号的表现能力,对一段包含了信噪比为35 dB的高斯白噪声,存在暂降幅值为0.6 p.u的电压暂降PQD信号进行SVD包分解,如图3所示。由图可知,在对信号进行两层SVD包分解后,信号信息在近似信号和细节信号中已有了明显体现,细节信号还指示了扰动的起止点,并且通过SVD分解实现了对PQD信号的降噪处理。

图3 两层SVD包分解电压暂降信号实例图

2 基于多分辨率SVD包分解的电能质量扰动识别

利用本文1.2节提出的MRSVD包对PQD信号进行分解为PQD问题分类的研究提供了特征提取基础。本文提出的基于MRSVD包分解的PQD扰动识别算法步骤为:首先对PQD信号进行三层SVD包分解,再对分解后的子信号进行特征提取并作为分类器的输入,选取随机森林模型作为分类器,进行PQD问题的分类识别。

2.1 信号特征值提取

在信号分类过程中,输入分类器的特征值提取数量越多,对各类扰动识别的精度也会更高,但特征值数量的增加会使算法计算负担变重,经过对特征信号提取的最优化研究,本文对原始PQD信号经过三层SVD分解的8个子信号提取了包括信号均值、标准差、有效值、峰值因数、偏度、峭度等6个特征,特征值提取方法如下:

已知fi=[hi,1hi,2…hi,Z]为经过三层SVD包分解后产生位于第三层的八个分量信号,各特征值的提取方法为:

(1) 信号均值F1,fi,反映信号的平均波动幅值。

(10)

(2) 信号有效值F2,fi,反映信号的集中程度。

(11)

(12)

(4) 信号的峰值因数F4,fi,即信号峰值与有效值的倍数,式中rms(fi)为子信号的均方根,即信号的有效值,峰值因数可以反映信号的突变程度。

(13)

(5) 信号的偏度F5,fi,可以反映信号的不对称程度。

(14)

(6) 信号的峭度F6,fi,是信号的四阶矩平均,可以反映信号中的冲击特征,式(13)与式(14)中的σ为信号的标准差。

(15)

2.2 随机森林分类模型

随机森林模型是一种以决策树为基础分类器的并行集成学习模型,通过Bootstep重采样技术[11],解决了决策树模型易发生过拟合的问题。随机森林的预测结果由多颗决策树各自独立的投票结果决定,决策树的组合使得数据集的并行训练成为可能。通过少数服从多数的方式进行分类结果投票,使得随机森林模型具备分类效果好、泛化能力强等特点。

随机森林并不是使用所有的变量来分割树节点,而是在每个节点处选择变量的随机子集来获得节点的最佳分割。这样随机化的主要目的是去除相关的决策树,使得所有树的集合具有较低的方差。构造随机森林的方法一般包括以下主要步骤[12]:

(1) 在原始数据中提取出n-tree个样本子集。

(2) 利用每个样本子集生成决策树,在树的每个节点,随机选择变量M进行分裂。继续增长树,使得每个终端节点的节点数不小于节点的大小。

(3) 采用投票机制统计n-tree个决策树的结果进行分类。

随机森林模型被普遍认为是具有高精度运算结果的分类模型,本文选取随机森林模型作为分类器进行PQD问题分类,提出基于多分辨SVD包分解与随机森林结合的PQD识别算法。

3 电能质量扰动识别实验结果

本文以多分辨SVD为工具,在小波包分解的启发下提出一种用于进行PQD问题分类辨识的MRSVD-RF算法,为了验证算法的有效性,本节以多种PQD信号为对象进行仿真实验。同时,为了验证MRSVD信号分解方法较于小波包分解法在PQD问题分类上的优越性,本文还对基于小波包分解的特征提取与随机森林结合(WP-RF)的算法进行了实验,并通过对比体现了MRSVD-RF算法在分类精度等方面的优势。

实验所用的信号由MATLAB仿真软件按照IEEE电能质量扰动标准[13]生成,信号类型共包含了正常波动的正弦信号、6种常见的单一扰动信号以及9种复合扰动信号,其中包括:d0(正常)、d1(暂降)、d2(暂升)、d3(中断)、d4(谐波)、d5(脉冲)、d6(震荡)、md1(暂降&中断)、md2(暂降&谐波)、md3(暂降&震荡)、md4(暂升&脉冲)、md5(暂升&震荡)、md6(暂升&谐波)、md7(谐波&震荡)、md8(暂降&脉冲)、md9(谐波&脉冲)。信号分别添加了不同程度的高斯白噪声,部分复合扰动信号展示如图4所示。

图4 信噪比为30 dB的复合电能质量扰动信号展示图

3.1 MRSVD-RF算法实验结果

本文对包含了正常扰动、单一扰动和复合扰动的16类信号随机各生产1 000条数据,选取其中800条为训练数据,200条为测试数据进行PQD问题分类实验,在实验过程中依次添加了噪声信噪比为30、40和50 dB的高斯白噪声以测试算法在噪声环境下的分类能力。实验中先用本文1.2节阐述分解方法进行原始信号分解并选取第三层SVD分解后的8个子信号,对子信号提取2.1节阐述的6个F1~6特征向量,使一条PQD信号对应48个输入特征,采用MRSVD-RF算法对每一类扰动的识别准确率分别进行分析,结果如表1所示。

表1 MRSVD-RF算法对每类扰动的识别准确率(%)

如表1所示,本文提出的MRSVD-RF算法识别准确率随着噪声信号的增大而减小,同时对复合扰动的识别能力低于大部分单一扰动识别的准确率,主要的识别错误集中发生在暂降、暂升信号及其混合信号中,但均表现出了较好的识别能力。

3.2 MRSVD-RF算法与WP-RF算法的对比实验

本文提出的MRSVD算法借鉴小波包分解的方式对原始信号进行分解并提取特征,因此有必要将本文算法和WP-RF算法进行结果对比,小波包分解过程和小波基选取参考文献[14],WP-RF算法的特征向量求取方法和3.1节中MRSVD算法相同,在分解层数和提取特征子信号个数相同的情况下, MRSVD-RF算法与WP-RF算法对相同PQD信号的分类效果如表2所示。

表2 特征提取方式不同时算法识别准确率的效果对比(%)

表2中实验结果是多次实验结果取平均值得出的平均识别准确率。由实验结果可知,在PQD问题分类研究中,MRSVD-RF算法识别效果较好,小波包分解的方式虽与SVD包相似,但在提取的特征量和分解的信号量都是一致的情况下,SVD包的分解效果要优于小波包的效果。可见,基于多分辨率SVD包分解的算法可以更好地获取信号中扰动特征,较小波包分解可以更精细地挖掘信号的细节变化。

3.3 MRSVD算法使用不同分类器的对比实验

为了验证本文选择的随机森林分类器的优越性,将基于本文提出的MRSVD方法提取的PQD信号特征输入极限学习机(Extreme Learning Machine, ELM)与K-近邻(K-Nearest Neighbor,KNN),分别组成MRSVD-ELM算法和MRSVD-KNN算法进行分类识别。ELM是一种网络学习算法,它在单隐层前馈网络的隐层节点的激活函数无限可微时,随机确定节点的偏置与输入权值,并且可以快速得到输出权值,因此该算法具有较好的学习速率,并且也避免了陷入局部最优的风险[15]。KNN是一种基于统计的分类算法,通过测量未知样本的K个近邻数,统计K个近邻大多数属于的类别,KNN的原理较简单,在分类和模式识别方面有广泛的运用[16]。对ELM和KNN的参数设置参照文献[15-16],三种分类模型进行扰动识别的平均识别准确率如表3所示。

表3 分类器不同时算法识别准确率的效果对比(%)

由表3可知,在使用MRSVD算法进行分解后,使用不同的分类器对识别结果的影响较大,MRSVD-KNN算法的扰动识别结果与MRSVD-ELM算法相差不大,其中ELM的分类效果略好于KNN算法,但是对比RF分类器均有较大的分类精度差距,且ELM和KNN分类器的参数设置较RF分类器更为复杂,实验表明,本文选取RF分类器的分类效果要明显好于其他两个分类器。

3.4 特征值选取的对比实验

根据本文3.1节阐述的对输入分类器的特征值求取方法可知,MRSVD-RF算法中用于分类的特征值数量,是信号分解后子信号数与针对每条子信号求取特征向量个数的乘积,分解后子信号的个数与使用MRSVD算法分解的层数相关,为了说明MRSVD-RF算法的性能与特征值数量的关系,本节分别通过减少分解后子信号个数和增加对子信号提取特征值的种类来实现特征值数量的减少和增多,分解子信号的减少通过降低MRSVD算法分解层数实现。

(1) 增加提取特征值的种类及数量。

在2.1节提取的6个特征值的基础上,再增加两个特征值:信号的能量F7,fi及信号的能量熵F8,fi。其计算方法分别如下:

(16)

(17)

在对信号进行了三层MRSVD分解后,对第三层8个分量信号分别提取不同的特征值,即一组提取6个F1~6特征向量,共48个输入特征;另一组提取8个F1~8特征向量,共64个输入特征。实验结果如表4所示。

表4 特征值数量增加时识别准确率对比(%)

(2) 减少提取特征值的数量。

在保持2.1节介绍的提取的6个特征值不变的基础上,减少MRSVD分解的层数,只对信号进行两层分解,并提取第二层分解得到的四个分量信号进行特征提取,在不同噪声环境下实验结果如表5所示。

表5 特征值数量减少时识别准确率对比(%)

由表4和表5可知,MRSVD-RF算法的分类准确率和提取特征值数量是正向相关的,值得一提的是,仅依靠经过两层SVD分解的4个子信号依然可以完成对PQD信号的有效分类识别,但随着噪声水平的升高,算法的准确率会大幅降低。通过定性的分析可以得出随着SVD分解层数的增加,子信号对原始信号的反应更加全面。同时,随着特征提取种类和数量的增加算法分类效果也得到优化,但这同时造成了更大的计算负担。本文通过实验法选取了8个分量求取6种特征值的组合,使得算法在尽可能小的计算负担下完成精准的PQD扰动分类辨识,但是如何通过定量的分析,使算法在算法准确率与计算量之间达到平衡,仍需要进一步探究。

4 结 语

本文受小波包分解算法的启示,为PQD问题识别研究提出了一种新的MRSVD-RF算法,以类似小波包分解的方式对信号进行MRSVD算法分解,并对分解后的分量信号进行特征提取,最后采用随机森林模型对扰动进行分类。

本文通过实验证明了MRSVD-RF算法的有效性,且其分类效果优于基于小波包分解的WP-RF算法,可以实现对单一和复合扰动的PQD信号分类,是一种有效的PQD分类算法。本文还对影响算法分类效果的分类器选取以及特征值数量进行了研究,通过控制变量实验证明了本文选取分类器模型和特征值方法的优越性,但是还缺乏对特征值数量以及分解层数对算法性能影响的定量分析,后续的研究方向应在如何搭建模型进行分析,从而在算法的计算量和分解层数、特征值数量选取中寻找平衡点进行研究。

猜你喜欢

波包特征值特征提取
一类带强制位势的p-Laplace特征值问题
单圈图关联矩阵的特征值
基于小波包Tsallis熵和RVM的模拟电路故障诊断
基于Daubechies(dbN)的飞行器音频特征提取
Bagging RCSP脑电特征提取算法
基于小波包变换的电力系统谐波分析
小波包理论与图像小波包分解
基于商奇异值分解的一类二次特征值反问题
基于MED和循环域解调的多故障特征提取
关于两个M-矩阵Hadamard积的特征值的新估计