APP下载

基于改进匹配追踪算法的语音信号处理研究*

2015-11-26浦灵敏胡宏梅

信息安全与通信保密 2015年12期
关键词:全局残差原子

浦灵敏, 胡宏梅

(苏州健雄职业技术学院电气工程学院,江苏太仓215411)

基于改进匹配追踪算法的语音信号处理研究*

浦灵敏, 胡宏梅

(苏州健雄职业技术学院电气工程学院,江苏太仓215411)

针对匹配追踪算法最匹配原子的搜索存在计算量较大、时间过长、效率不高等问题,根据粒子群算法的搜索特性,使用概率选择方式更新全局极值,利用混沌映射改善随机值,并将改进后的粒子群算法融入到标准匹配追踪算法中,通过重构语音信号,证明改进后的算法具有一定的可行性,其重构质量和运行速度均优于标准匹配追踪算法。

匹配追踪;稀疏分解;粒子群算法;混沌映射

0 引言

语音通信是人类最重要的通信方式之一,为了减少通信过程中的失真现象,高效率地对语音信号实现数字化表达,常采用压缩编码的方式。传统信号采样的定律是奈彻斯特采样定律,而基于信号带宽的奈彻斯特采样定律是具有一定局限性的。为此,一种新的采样定律——压缩传感(Compressive Sensing,CS)理论在2004被国外的学者们首次提出[1-2],该理论以信号的稀疏度作为信号采样的基础,只要信号满足稀疏特性或者可压缩特性,就能够在采样信号的同时实现数据的压缩[3]。其中,在压缩传感理论中,最为著名的就是Mallat等人在1993年提出的引入了信号稀疏分解思想的匹配追踪(Marchiing Pursuit,MP)算法[4]。

该算法主要是从过完备原子库中选择最贴近残差信号的原子,通过多次迭代找出最佳匹配原子用来表示信号,直到满足最终迭代条件。由此可以发现,最佳匹配原子的选择决定了重构信号质量的好坏。为此,不少学者提出了大量的改进方法,譬如:人工蜂群算法-MP算法[5~7],标准粒子群-MP算法[8~11],果蝇优化-MP算法[12]等,这些算法均是利用群智能寻优算法来搜索最佳原子,目标在于减小计算复杂度、提高收敛速度,但在解空间的遍历性问题上还存在局部趋同性的问题。针对这一问题,本文引入改进后的粒子群算法,将其与标准MP算法相融合,完成最佳匹配原子的搜索,该算法能够搜索匹配过程中每一步所分解的最佳原子,更好地重构原始信号[13~15]。

1 信号稀疏分解

1.1 稀疏分解原理

信号的稀疏表示就是在过完备原子库上将信号进行分解,由此获得一个简单的信号表达方式,而这个过程又被称为信号的稀疏分解。

定义f为待分解信号,长度为L,D={gγ},γ∈Γ,是稀疏分解信号所用的过完备原子库,gγ为γ中所定义的原子,Γ为所有γ的集合。

MP的信号稀疏分解过程就是通过比较信号与原子库中原子内积大小,不断搜索与待分解信号最匹配的原子gγi,把信号f投影在过完备原子库的每一个原子上,由于‖gγ‖=1,f在gγ上的投影为<f,gγ>,最佳匹配的原子gγi定义为:

则信号f可表示为

又从过完备原子库中找出与残差信号R1f最贴近的原子,则R1f可以表示为

由此可以类推,

可以看出,任何信号f经过分解后,均可以表示为:

其中,gγk为第k次迭代时在过完备原子库中所搜索的最贴近残差信号的原子,RMf为M次迭代后残差信号。

MP算法的原理是通过多次迭代找到局部最优的系数,每一次迭代的结果是不可预知的,为了更好地搜索最佳匹配原子,逼近原始信号,提高重构质量,通常需要经过相当多次迭代,才能得到相对好的搜索结果,这就浪费了很多时间成本,降低了方法的实用性。

1.2 过完备原子库的构成

通过分析信号f特征,可灵活选择适合的变换基,经过调制后构建过完备原子库,常用的有快速傅里叶变换基、离散余弦变换基、离散小波变换基、Curvelet基和Gabor基。通过分析语音信号的特点,选用与之具有一定相似度的Gabor原子,然后通过伸缩、平移、调制等行为对这些原子进行操作,构造过完备原子库,即

其中,g(t)=exp(-πt2)为高斯窗函数,对每个原子的尺度、位移、频率、相位等4个参数离散化并进行变化,可以形成庞大的原子库。γ={s,u,v,φ}(s>0,u<L,v>0,φ<2π)为时频参数向量,其中s为尺度、u为位移,v为频率,φ为相位,不同的γ,产生不同Gabor原子。

2 粒子群优化算法基本原理[15]

粒子群算法(PSO)是一种群智能优化算法,是1995年由Kennedy与Eberhart提出的。在PSO算法中,可将每个优化问题的解看作是“粒子”。根据粒子在搜索过程中的适应性,可确定一个由被优化的函数而决定的适应值,每个粒子的方向和距离可用其速度和位置用来确定;在每一次迭代过程中,每个粒子都可通过自身搜索得出一个解,多次比较,可确定当前迭代中的局部最优解;在多次迭代搜索后,粒子们跟踪当前最优粒子找到最优解,完成搜索过程。同时,在每一次迭代过程中,粒子通过跟踪局部最优解和全局最优解来更新自己的位置和速度。具体搜索过程如下:

(1)随机初始化,包括粒子个数、初始位置和速度;

(2)确定粒子的适应性函数,计算适应值;

(3)将当前所计算的适应值和局部最优解、全局最优解进行分别比较,如果更好,则更新局部最优解和全局最优解;

(4)根据公式(7)和(8)更新粒子的速度和位置;

式中,v和x分别表示速度和位置;下标“i”和“j”分别表示粒子i和该粒子的维数,w为惯性权重,大小决定了粒子的搜索能力;c1、c2为加速常数,c1调节粒子飞向自身最好位置方向的步长,c2调节粒子向全局最好位置飞行的步长,通常在0~2间取值;r1、r2为两个在(0,1)之间相互独立的随机数。

(5)检查是否满足终止条件。满足,则停止搜索;不满足,则返回(2),继续执行。

3 MP最佳原子搜索算法改进

MP算法是通过不断搜索与残差信号匹配的最佳原子来重构信号的,所以原子的匹配搜索很关键。在标准的MP算法中,过完备原子库中遍历寻优时所需要的计算量比较庞大,运行时间过长,且很难搜索到最匹配的原子[16]。本文受到粒子群算法的启发,通过粒子行为对MP算法原子进行群智能搜索,为了防止标准的粒子群算法易出现的“趋同性”现象,避免其陷入局部最优,将改进后的粒子群算法融入MP算法原子的搜索中。根据本文匹配追踪的需要,需要对4个参数进行寻优,具体执行过程如下:

(1)初始粒子群。对信号f参数离散化γi={si,ui,vi,φi},根据式(6)计算出gγi,设为第i粒子。同时,将初始粒子作为全局最优解和局部最优解。

(2)将式<Rif,gγi>设为粒子群的适应值函数。

(3)将当前计算的适应值和全局最优解进行概率比较,如果满足式(9),则更新全局最优解;将当前计算的适应值和局部最优解进行大小比较,如大,则更新局部最优解。

其中,N为粒子数,ε为预设置精度。

(4)根据公式(7)和(8)更新粒子的速度和位置,式(7)中r1、r2的随机数可采用混沌映射中的猫映射(cat map)进行设置,具体如式(10),能够一定程度上改善rand()函数产生的完全随机分布可能引起的遍历性较差等问题。

式中,mod1表示只取其小数部分,n为正整数,映射产生的xn与yn均在[0,1]之间。

(5)判断MP迭代残差阈值Rif 是否小于0.0001。满足,则停止搜索,输出gγ;不满足,则返回(2),同时,根据式(4)更新Rif。

在步骤(3)中,增加粒子的全局搜索能力,采用概率选择方式去更新全局最优解,有效地改善了标准PSO所存在的“趋同性”,提高了粒子全局搜索最佳原子的能力。

4 仿真分析

实验采用Matlab编程仿真实现,主要是通过MP算法重构语音信号。语音信号为一段40 S长的语音,其中30 s用来作为训练语音,其余10 S用来作为测试语音,采样点为8 000。改进后的MP算法中,ε为0.05,初始种群群体为40个,根据经验值,PSO算法中的参数c1、c2取值为2,惯性权重w的选取采用式(11)的方式

其中wmax为0.9,wmin为0.4,T为迭代次数,Tmax为最大的迭代次数。

定义残差[17]:e(n)=f(n)-g(n),其中,f(n)为原始语音信号,g(n)为重构语音信号。图1为重构语音信号过程中随意匹配4次信号后所产生的残差结果。图2显示了匹配追踪过程中语音信号的重构,重构语音信号越来越接近原始语音信号。

图1 语音信号匹配过程中任选4次匹配信号的残差结果

在仿真平台上,分别使用标准匹配追踪(MP)算法和改进后算法对语音信号进行重构。重构过程中,和改进后的算法相比,标准MP算法重构语音信号的过程较为复杂,运行时间长,重构的结果不理想,具体建模结果如图2,从图中可以清晰地看出改进后算法重构的语音信号更贴近于原始信号。而重构语音信号质量的主观评价还取决于人的听觉感知。通过人的听觉测试语音重构质量,从试听的结果中可感知出算法在重构信号上的优劣。结果发现改进后算法所重构出来的语音信号较标准MP算法所重构的语音听上去更为清晰、自然,且容易理解。

图2 标准MP算法和改进后算法重构语音信号建模结果

5 结语

针对匹配追踪算法中最佳原子搜索耗时问题,本文引入粒子群算法,利用其智能搜索特性,针对粒子所存在的过早“趋同性”提出改进算法,提高粒子的全局最优搜索能力,并将改进后的粒子群算法融入到标准匹配追踪算法中,减少最佳匹配原子的搜索时间,更有利于找到贴近于原始信号的最佳匹配原子来表示信号。通过仿真分析,发现改进后的匹配追踪算法节省了搜索的时间,提高了算法的效率,更好地改善了重构信号的质量。

[1]Candes E.Compressive Sampling[J].International Congress of Mathematicians,Madrid,Spain:European Mathematical Society,2006:1433~1452.

[2]Baraniuk R G.Compressive Sensing[J].IEEE Signal Processing Magazine,2007,24(4):118~124.

[3]张雯.压缩传感算法研究与音频应用[D].天津:天津大学,2011.

[4]Mallat S G,ZHANG Z.Matching Pursuit with Time-Frequency Dictoionarier[J].IEEE Transactions on Signal Processing,1993,41(12):3397~3415.

[5]侯坤等.信号稀疏分解的人工蜂群-MP算法[J].计算机仿真,2012(11):247~250.

[6]张冬丽.人工蜂群算法的改进及相关应用研究[D].河北:燕山大学,2014.

[7]宁爱平.人工蜂群算法及其在语音识别中的应用研究[D].太原:太原理工大学,2013.

[8]高雷阜等.人工鱼群算法优化SVR的预测模型[J].统计与决策,2015(2):13~16.

[9]李越雷等.利用粒子群算法实现PPS信号的稀疏分解[J].计算机仿真,2010(2):200~203.

[10]李焱.基于函数变换的改进混沌粒子群优化[J].计算机应用研究,2010(11):4105~4113.

[11]李霞等.基于改进FOA匹配追踪的超声信号处理研究[J].仪器仪表学报,2013(9):2068~2073.

[12]朱延万等.一种改进的稀疏度自适应匹配追踪算法[J].信号处理,2012,28(1):80~85.

[13]赵知劲等.一种基于量子粒子群的二次匹配OMP重构算法[J].计算机工程与应用,2012,28(29):157~161.

[14]胡宏梅.若干矢量量化码书设计算法[D].苏州:苏州大学,2007.

[15]刘景华等.一种启发式的局部随机特征选择算法[J].计算机工程与应用,2014(5):1~7.

[16]张焱凯等.余弦距离下保护型迁移学习聚类算法[J].计算机工程与应用,2014(4):1~7.

[17]孙艳等.小波匹配追踪的语音信号时频建模[J].计算机工程与应用,2012,48(3):151~152.

Speech Signal Processing based on Modified Matching Pursuit Algorithm

PU Ling-min,HU Hong-mei
(School of Electrical Engineering,Suzhou Chien-shiung Institute of Technology,Taicang Jiangsu 215411,China)

Aiming at large calculation,time-consuming and low efficiency for the searching the best atomic in matching pursuit algorithm,and based on the searching characteristic of PSO(Particle Swarm Optimization),the update of globalextremum is done with probability selection method,and the random value improved by Chaos mapping.Meanwhile,the modified PSO is integrated into the standard matching pursuit algorithm.Reconstruction of speech signal indicates that the modified algorithm is of certain feasibility,and both the reconstruction quality and operation speed are superior to the standard matching pursuit algorithm.

MP(Matching Pursuit);sparse decomposition;PSO;chaos mapping

TN911

A

1009-8054(2015)12-0127-04

浦灵敏(1982—),男,硕士,讲师,物联网工程中心主任,主要研究方向为无线通信及物联网应用技术;

2015-05-12

2014江苏省“青蓝工程”资助(No.201423);2014年苏州市智能家居无线传感应用技术重点实验室建设项目研究成果(No.SZSD201403)

胡宏梅(1982—),女,硕士,讲师,主要研究方向为语音信号处理;■

猜你喜欢

全局残差原子
Cahn-Hilliard-Brinkman系统的全局吸引子
基于双向GRU与残差拟合的车辆跟驰建模
量子Navier-Stokes方程弱解的全局存在性
原子究竟有多小?
原子可以结合吗?
带你认识原子
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
落子山东,意在全局
综合电离层残差和超宽巷探测和修复北斗周跳