APP下载

基于VMD-PCA-SVM的电能质量扰动辨识

2021-12-14胡汉铖刘明萍张镇涛汪庆年

实验室研究与探索 2021年10期
关键词:降维边际特征向量

胡汉铖,刘明萍,张 震,张镇涛,汪庆年

(南昌大学信息工程学院,南昌 330031)

0 引言

近年来随着光伏发电、风电等间歇式、分布式新能源的并网以及大量冲击性、波动性、非线性负荷的投入,给电网造成一系列电能质量的问题,例如暂态振荡、闪变和谐波污染等。为选取妥善合理的措施改善电能质量,必须对扰动信号进行正确、有效的辨识,这是开展电能质量检测的前提和关键。

电能质量扰动辨识[1]主要包括特征提取与模式识别。特征提取是指提取扰动信号的特征量,通常采用信号分析法。常用的分析方法有短时傅立叶变换(short-time Fourier transform,STFT)[2]、小波变换[3]、S变换[4]及希尔伯特黄变换(Hilbert-Huang transform,HHT)[5-6]等。这些方法拥有良好的检测效果,但也存在某些问题。STFT由于结构中缺少可变窗口,难以分析突变信号;小波变换的问题在于如何准确选取合适的基函数;S变换的难点在于如何确认窗函数的宽度;HHT 变换由经验模态分解(Empirical mode decomposition,EMD)[7]与HHT 构成,其中EMD 存在较严重的端点效应、模态混叠问题。Dragomiretskiy等[8]独创了变分模态分解(Variational mode decomposition,VMD),相较EMD 方法,它很好地克服了端点效应和模态混叠的缺陷,且计算效率更高、分解层数更少、鲁棒性更好。因此,引进VMD算法对HHT变换进行改进,并应用于特征提取。

模式识别指的是将特征选择所产生的特征向量进行识别分类。当今主流的方法有人工神经网络[9]、支持向量机(Support vector machine,SVM)[10]和随机森林[11]等。人工神经网络具有数学灵活性,但也存在麻痹现象,学习速度不快;随机森林因为采取了集成算法,其精度比大多数单一算法高,但当随机森林中决策树的数量过多时,训练所需的时间和空间会较大;SVM是一种有监督的机器学习模型,具有优良的范化能力,但输入参数过多,容易发生特征混叠,导致误判。因此,引入主成分分析法(Principal component analysis,PCA),该方法能够将特征向量进行降维投影,提取更加敏感的低维特征信息,将其与SVM 结合,能有效提升辨识精度,避免特征混叠等情况。

综上所述,文中提出一种基于VMD-PCA-SVM 的电能质量扰动辨识方法。引入VMD 改进HHT 算法,用于分析扰动信号,得到边际谱作为特征向量,将特征向量用PCA降维,用SVM 分类器进行分类识别。通过比较分析,仿真试验表明该方法的可靠性和准确性。

1 算法原理

1.1 VMD分解

VMD是一种全新的以HHT、维纳滤波为基础的自适应分解法。原信号通过VMD 搜索约束变分模型的最优解,可被分解为若干组带有稀疏特性的本征模态函数(Intrinsic mode function,IMF)分量。区别于EMD算法,IMF分量被设定为调幅-调频信号[8]:

式中:φk为瞬时频率的积分,即相位;Ak为瞬时幅值。假定各个IMF分量具有有限带宽与中心频率,且估计带宽最小,那么可得约束模型:

式中:K为IMF 的个数;δ(t)为冲激响应;f为输入信号;ωk为中心频率。将惩罚因子α与拉格朗日算子λ相结合,把式(2)中的约束模型转变为非约束模型:

使用交替方向乘子求解式(2)中“鞍点”,可得uk和ωk。对uk,ωk,λ在频域上更新:

式中,τ为更新因子。

VMD算法迭代求解的过程如下:

(1)初始化{uk}、{ωk}、λn和n;

(2)根据式(4)~(6)更新{uk}、{ωk}、λn;

(3)循环更新直至:

式中,r表示阈值。经过上述过程,VMD 分解得k个IMF分量。

VMD算法的核心在于构造变分问题,寻找变分最优解,明确每个IMF 分量的带宽与中心频率,使得分解得到的各IMF的带宽之和最小,实现信号的有效分离。相比于EMD算法,它有更完整的数学理论作为支撑,从原理上克服了模态混叠与端点效应的问题[12]。

1.2 VMD-HHT边际谱

借助HHT对VMD 分解所得的各个IMF 分量进行有效处理,原始信号可表示为:

式中,ωi、ɑi分别为信号的瞬时频率和瞬时振幅。

由于x(t)是关于时间和瞬时频率的函数,故可以表示为:

式中,H(ω,t)为HHT谱,对其积分,得到边际谱:

边际谱有效展示了电能质量扰动信号的幅值随瞬时频率的变化情况[13]。常用的功率谱只是能反映信号某一频率存在的可能性,而边际谱则可以说明某一频率是否真实存在,表征某特定频率在不同时刻所对应的幅值(或能量)之和。此外,边际谱与常用的功率谱相比,分辨率和准确性显著提高,能够有效地抑制能量泄漏。鉴于边际谱的上述优点,故将其作为特征向量。

1.3 PCA算法

PCA是一种使用较为广泛的数据降维算法[14]。其目的是朝数据变动最多的方向投影,抑或是说朝重构误差最小的方向投影。PCA降维分析的步骤如下:

步骤1假设Xm×n是一个m×n(m≥n)矩阵,计算矩阵Xm×n样本协方差矩阵Sn×n。

步骤2计算Sn×n的特征向量对应特征值x1,x2,…,xn,特征值按照从大到小排列。

步骤3依据特征值大小计算Sn×n的第i列向量贡献率θi以及前r维矩阵累计贡献率Θr:

步骤4依据Θr的大小明确投影矩阵的维数r,其中Θr最少为70%,通常取85%~95%之间。

步骤5投影矩阵Sn×r由矩阵Sn×n取前r维得到,将需要降维的矩阵Xm×n与之相乘,获得降维后的矩阵Tm×r:

PCA通过数据降维,找出变化大(即方差大)的特征向量,去除变化小(即方差小)的特征向量,得到最有效的数据特征向量。

1.4 SVM分类原理

SVM通过核函数的引进,将低维空间中的线性不可分样本受非线性映射投影至高维空间中,变为线性可分样本。在分类时,SVM 的中心思想在于建造一个超平面用作决策曲面,使负、正样本的边缘距离最大化[10]。其原理如下:

定义样本集{(xi,yi),i=1,2,…,N},xi为输入向量,yi为类别标记,xi∈Rn,yi∈{+1,-1}。分类时,设存在分类界面:

式中:ω为权重向量;b为偏置向量。样本点与分类界面距离为:

最优分界面应该满足D最大,因此可转化为二次优化问题:

引入拉格朗日函数求解:

式中,αi为拉格朗日乘子。则得到对偶问题:

最后可得最优分类函数:

当处理非线性问题时,采用核函数K(xi,x)替代点积(xi·x),最优分类函数为:

2 VMD-PCA-SVM 辨识模型

鉴于VMD 的优势,故将其代替EMD,对HHT 变换进行改进。边际谱能够准确有效表征信号频率的能量分布,故将其作为特征向量。选用PCA对边际谱特征量开展降维处理,有效减少了边际谱特征量的冗余信息并降低特征向量的维度,实现了二次特征处理。将PCA所生成的特征向量对SVM 分类器展开训练,建立VMD-PCA-SVM辨识模型,如图1 所示。

图1 VMD-PCA-SVM辨识模型

该模型的主要步骤如下:

步骤1使用仿真软件生成电能质量扰动信号,分成两组用来进行训练和测试。

步骤2将训练信号进行改进HHT,PCA降维,然后对SVM分类器展开训练。

步骤3将测试信号重复上述步骤,输入训练后的SVM分类器,最后得到辨识结果。

其中,SVM 分类器选取Matlab2017a 自带的LibSVM分类器,选择高斯径向基核用作其核函数,即:

式中,σ 为掌管核函数高度的参数。LibSVM 可通过“交叉验证”自动选择最优核参数[14]。

3 仿真及实验分析

3.1 仿真模型建立

针对这些复杂多变的电能质量扰动信号,国内外的研究多数在采用限定条件后,每种扰动生成随机的数百样本,形成完整数据库,然后输入分类器进行训练和试验。参考文献[5,10]中建立包括标准信号在内的电能质量扰动信号的仿真模型,限定范围见表1。仿真模型中:L为信号,基频f取50 Hz,电压幅值A均归一化为1(p.u.),u(·)为阶跃函数,ω为扰动信号的额定角频率,T表示信号周期。

表1 电能质量扰动信号模型

3.2 边际谱及PCA降维

使用Matlab2017a,根据表中的仿真模型,采样频率取5.7 kHz,信号长度为9 个周波,1 024 个采样点,随机生成9 组仿真信号,在信噪比(Signal to noise ratio,SNR)为40 dB条件下,用改进HHT 变换进行分析。采用VMD对信号展开分解,默认分解成4 阶IMF分量。列举闪变扰动信号的分解波形,如图2 所示。对各阶IMF分量采用HHT,得到各信号的边际谱并归一化,如图3(a)~(i)所示。将生成的边际谱特征向量进行PCA降维。设定满足Θr≥95%时的r为PCA的投影维数取值,生成的PCA 降维效果图如图4 所示。由图4 可见,当取维数r=1 的时候,Θr就超过70%;当在维数r=4 的时候,Θr已然达到95%,满足要求,因此PCA选取4 维作为降维投影维数。

图2 SNR=40 dB时闪变信号的VMD分解波形

图3 SNR=40 dB时扰动信号的归一化边际谱

图4 信噪比为40 dB时PCA降维效果图

3.3 仿真测试及结果对比

根据表1 中的模型,使用Matlab2017a随机产生包括标准信号和8 种电能质量扰动信号在内的9 组信号集,每组信号集生成1 000 个样本,在叠加高斯白噪声后,生成无噪声和SNR分别为30、40、50 dB 的试验信号。在同一高斯白噪声下,取每组试验信号800 个样本,共7 200 个样本进行训练,剩下每组200 个样本,共1 800 个样本进行测试。最后将样本输入VMDPCA-SVM辨识模型中。辨识结果见表2。

表2 辨识结果及对比

由表2 可知,在无噪声的条件下平均分类准确率为99.94%,在SNR等于30、40 和50 dB的条件下,平均准确率分别达到99.33%、99.50%和99.67%,均超过99%,可见鲁棒性和准确率良好。相比其他文献所用的的方法,特别是文献[5-6]中提出的类似改进HHT的方法,文中所用方法有更大的优势,准确率和鲁棒性皆有明显提升。

4 结语

文中提出了一种基于VMD-PCA-SVM的电能质量扰动辨识方法,为电能质量扰动辨识提供了一种新思路。经过大量仿真试验,文中结论如下。

(1)该方法不仅适合于单一电能质量扰动检测,而且能精确识别2 种复合扰动,在无噪声和3 种信噪比的条件下,平均准确率均高于99%,最高可达99.94%。

(2)VMD算法本身具有自适应好、分解效率高及鲁棒性强的特点,它在数学原理上克服了模态混叠和端点效应,引入VMD算法来改进HHT算法,与其他类似文献对比,其优势通过优异的分类准确率和鲁棒性得到充分体现。

(3)该方法也存在一些不足,例如VMD算法计算复杂度较高,实时性差,SVM 所需训练样本较多等,需要日后更多的改进。该方法测试是通过仿真平台实现,是否能够有效应用在实际工作中,还有待进一步探索。

猜你喜欢

降维边际特征向量
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
混动成为降维打击的实力 东风风神皓极
克罗内克积的特征向量
学会坚持,学会放弃,理性行动
浅议导数和边际在量本利经济分析中的应用
Helicobacter pylori-induced inflammation masks the underlying presence of low-grade dysplasia on gastric lesions
降维打击
一类三阶矩阵特征向量的特殊求法
追求骑行训练的边际收益
社会治理的边际成本分析