APP下载

针对回声消除应用的自适应算法评价标准研究

2015-08-04文昊翔乐彦杰

韶关学院学报 2015年10期
关键词:评价标准

文昊翔,乐彦杰

(1.韶关学院 物理与机电工程学院,广东韶关512005;2.国网浙江省电力公司舟山供电公司,浙江 舟山316021)

针对回声消除应用的自适应算法评价标准研究

文昊翔1,乐彦杰2

(1.韶关学院 物理与机电工程学院,广东韶关512005;2.国网浙江省电力公司舟山供电公司,浙江 舟山316021)

摘要:为确定一种较优的自适应算法评价标准,以回声消除应用为背景,对残余噪声(RN)、回声返回损耗(ERL)与失调(MIS)3种评价标准进行比较分析.指出RN、ERL只考虑残余噪声功率,忽略了自适应算法的辨识精度,当残余噪声存在频域起伏等缺陷时,RN、ERL无法反映该缺陷,并以子带分解算法为例对各评价标准进行系统仿真.结果表明失调可有效反映子带分解算法辨识精度低的缺陷.最后提出与RN、ERL相比较,失调应为更严谨的评价标准.

关键词:自适应算法;评价标准;残余噪声;回声返回损耗;失调

通信回声现象严重影响通话质量,应在通信设备中内置回声消除(Echo Cance11ation,EC)系统以抑制回声能量,提高通信质量[1].

通信回声的产生和消除原理为∶远端语音信号X(k)与回声路径Wo卷积,卷积结果受近端噪声v(k)干扰,形成回声信号d(k)[2].为消除d(k),用滤波器W(k).通过自适应算法辨识回声路径Wo,以X(k)与W(k)的卷积结果作为d(k)的估计值,两者相减以抑制回声能量[3].

EC系统的核心是自适应算法.EC系统的实现可归纳为自适应理论中的系统辨识问题.为提高EC系统的效率,对自适应算法进行改进后,必然要对新算法的性能,如收敛速度与辨识精度进行评价.

现有的评价标准主要有残余噪声(Residua1Noise,RN)[4]、回声返回损耗(Echo Return Loss,ERL)[5]与失调(Misa1ignment,MIS)[6]等.利用不同的标准对自适应算法进行评价的结果往往存在矛盾之处,多种标准并存的现状为自适应算法的评价引入极大的混乱.

以归一化子带自适应算法(Norma1ized subband adaPtive fi1ters,NSAF)为例,讨论RN、ERL与失调3种评价标准[7].NSAF算法在严格抽取条件下,其残余噪声在频域将出现较大的起伏;从人听觉角度,频域起伏的噪声即为令人生厌的音乐噪声[8];从自适应算法角度,则表现为滤波器未能精确辨识回声路径.

通过理论研究与实验仿真,得出结论∶RN,ERL只以EC系统最后的残余噪声输出功率作为评价标准,忽略了自适应滤波器的辨识精度,未能发现NSAF算法导致音乐噪声的严重缺陷.与RN、ERL相比较,失调应为更严格的自适应算法评价指标.

1 自适应算法评价标准

自适应算法的评价标准主要有RN,ERL与失调.以dB为单位,3者分别定义如下∶

式(1)~(3)中的k表示迭代次数.以k为自变量,绘制评价标准随迭代次数的变化关系,可得自适应算法的收敛曲线.因残余噪声包含大量随机噪声,使得根据RN,ERL绘制的收敛曲线受随机噪声干扰,难以分辨自适应算法的收敛速度与稳态失调.因此需使e2(k)、d2(k)通过一个低通滤波器,滤除宽频噪声干扰,获得e(k)、d(k)的功率估计最后式(1)、(2)分别修正为∶

用于获得功率估计的低通滤波器,若截止频率设置过高将导致无法有效滤除宽频噪声中的高频分量;截止频率设置过低将导致功率估计精度下降,不能灵敏反映功率变化.实际应用中常用的功率估计低通滤波器有1/(0.99+0.01Z-1)与N点求平均(N为滤波器长度)[9].

失调曲线本身已足够平滑,无需经过低通滤波器处理.

2 NSAF算法

以NSAF为例能清晰地反映RN,ERL、失调3种评价标准的优劣,此处先简要介绍NSAF算法.

NSAF的核心思想是利用子带分解[9],通过滤波器组将输入信号、期望信号在频域进行分割,形成子带信号,然后自适应算法在子带进行.最后子带信号通过重构滤波器组合成为期望信号的估计值.

子带分解原理为[10]∶输入信号先通过分解滤波器组Hi(Z)(0

理想的子带分解滤波器组,是在频域对信号进行M等分.当输入信号为有色噪声或强相关的语音信号时,每个子带的信号频谱比初始的全频段信号更接近高斯白噪声,因此理论上可提高自适应算法收敛速度.

分解、重构滤波器组的设计方法主要是先设计一个线性相位的低通原型滤波器.然后对原型滤波器进行余弦调制,扩展为分解、重构滤波器组[11].

设原型滤波器冲激响应序列为f(n)(0

当M>2时,常用余弦调制设计滤波器组.记第i频段的分解滤波器组冲激响应序列为hi(n),重构滤波器组为gi(n),则其计算公式如下[13]∶

当子带个数与降采样间隔相等时称为严格抽取(Critica1 SamP1ing).此时既可无失真地重构输入信号,且抽取后的信号与原输入信号数据量相等,无信息冗余.本文仅针对严格抽取条件进行研究.

将子带分解与自适应算法相结合,有NSAF算法提出.NSAF算法的原理见图1.其系数更新方程为∶

式(10)的μ为全局收敛步长,取值范围为0<μ<2.

图1 NSAF算法结构图

3 实验仿真与理论分析

本节以Mat1ab对归一化最小均方 (Norma1ized Least MeanSquare,NLMS)算法与NSAF算法(M=2、M=8)进行仿真,比较RN、ERL、失调3种评价标准的有效性.NLMS算法的系数更新方程为∶

式(11)的δ为正则化参数,取δ=0;μN为NLMS算法的收敛步长,NSAF与NLMS算法的收敛步长均设为μ=μN=0.5.

对于NSAF算法,当M=2、M=8时,原型滤波器冲激响应序列分别为[0.009 387 15,-0.070 651 83, 0.069 428 27,0.489 980 8,0.489 980 8,0.069 428 27,-0.070 651 83,0.009 387 15][14]、[0,0,0,0,0,0.018 4, 0.032 9,0.051 3,0.070 4,0.085 4,0.094 0,0.097 9,0.099 6,0.099 6,0.097 9,0.094 0,0.085 4,0.070 4,0.051 3, 0.032 9,0.018 4,0,0,0,0,0][15].

EC系统参数设置如下∶回声路径Wo已知,长度为512.激励信号X(k)为一段真实语音信号,采样频率8k Hz,平均功率(k)=0.565.X(k)与Wo的卷积作为回声信号y(k),功率约为(k)=0.002 1,以高斯白噪声模拟背景噪声v(k),y(k)、v(k)信噪比为SNR=20 dB.各算法的滤波器长度均为N=512.

3.1算法残余噪声频谱分析

子带分解算法的主要缺陷是EC系统的残余回声存在令人生厌的音乐噪声现象,严重影响降噪效果.因子带分解算法存在明显缺陷,在实现EC系统时,使用NLMS比使用子带分解算法更普遍.

音乐噪声产生的原因是信号在频域存在起伏.对于子带分解算法,输入信号必须通过分解滤波器组Hi (Z)分为不同频段的子带信号.因滤波器组通带与阻带间不可避免存在过渡带,两个相邻的滤波器,其过渡带存在重叠部分,该重叠部分将导致输入信号经过分解、重构后在频域存在起伏.通过改进滤波器组或原型滤波器的设计并不能避免该缺陷,改进的唯一方法是减小子带信号重采样的间隔[16],但又将导致数据量与计算复杂度的大幅增加.3种算法收敛后残余噪声功率(k)的频谱图见图2~图4.

频域起伏的峰谷数量与子带分解数成正比.子带分解数量越多,音乐噪声特征越明显.当M=2时用户已能觉察到音乐噪声,但尚能忍受.当M=8时受音乐噪声干扰,通信已无法继续进行.

3.2评价标准研究

计算RN、ERL时使e2(k)、d2(k)通过1/(0.99+0.01Z-1)低通滤波器获得功率估计σ2 e(k)、σ2 d(k).三种算法的RN、ERL、失调随时间变化关系见图5~图7.为更清晰地显示3种指标的特点,图中的横坐标量程不一致.由3图可得,根据不同标准,各算法性能按优劣排序并不一致.

以RN作为评价标准(见图5),无论是收敛速度还是稳态失调,均有NSAF(M=8)优于NSAF(M=2)优于NLMS.以ERL为评价标准(见图6),有NSAF(M=8)与NSAF(M=2)性能相似,二者优于NLMS算法.以失调为标准(见图7),则评价更为复杂,NSAF(M=8、M=2)前期收敛速度明显快于NLMS,但收敛后NSAF的稳态失调高于NLMS.

图2 NLMS算法残余噪声频谱图

图3 NSAF(M=2)算法残余噪声频谱图

图4 NSAF(M=8)算法残余噪声频谱图

图7 各算法失调对比图

残余噪声在频域存在起伏,其时域表现则为自适应滤波器未能精确辨识回声路径.失调作为评价标准,可灵敏地反映NSAF辨识精度低的缺陷,而RN、ERL仅以残余噪声输出功率作为评价标准,未能反映NSAF算法辨识精度低的缺陷.

综合上述,与RN、ERL相比,失调应为更严谨的自适应算法评价标准,原因有3个方面.

(1)失调以滤波器与回声路径向量差的二次范数为评价标准,因多点求和,无需引入低通滤波器,可避免由此额外引入的误差.

(2)因自适应滤波器与回声路径误差部分峰谷相互抵消,在滤波器尚未精确辨识系统前,误差信号e(k)已先行收敛,图5~7的横坐标充分表明该特点.用于反映自适应算法所处的收敛状态时,RN、ERL并不是严谨的评价标准.

(3)在自适应算法辨识精度极低的条件下,算法仍可获得较低的残余噪声功率.对于RN、ERL,低的残余噪声功率掩盖了算法辨识精度低的现象,导致未能发现音乐噪声等严重降低通信质量的缺陷,而失调则能敏锐地捕捉到该缺陷.

使用失调作为自适应算法评价标准的主要实现难点是需要获得回声路径的先验信息,而在EC系统的实际应用时,是无法获得回声路径的.但在进行算法仿真时,回声路径通常是已知的,此时可用失调作为标准,更严格地评估算法的性能.

4 结语

本文介绍3种自适应算法的评价标准RN、ERL、失调.并以NSAF算法与NLMS算法为例比较3种评价标准.因RN、ERL只注重残余噪声功率,而低的残余噪声功率掩盖自适应滤波器辨识精度低的缺陷,导致RN、ERL无法发现音乐噪声等严重影响通信质量的现象.

失调的计算方式为滤波器向量与回声路径向量之差的二次范数,以辨识精度作为评价指标,与RN、ERL相比,失调应为更严谨的自适应算法评价标准.

参考文献:

[1]文昊翔,陈隆道,蔡忠法.解相关仿射投影算法及应用[J].浙江大学学报∶工学版,2014,48(1)∶136-140.

[2]徐茂.基于IPNLMS算法的回声抵消器的设计[J].电声技术,2014,38(6)∶35-43.

[3]TogamiM,Kawaguchi Y.Simu1taneous OPtimization of Acoustic Echo Reduction,SPeech Dereverberation,and Noise Reduction againstMutua1Interference[J].IEEE Transactions on Audio,SPeech and Language Processing,2014,22(11)∶1612-1623.

[4]Shimauchi S,Ohmuro H.Accurate adaPtive fi1tering in square-root Hann windowed short-time fourier transform domain[C]. 2014 IEEE Internationa1Conference on Acoustic,SPeech and Signa1Processing,2014∶1305-1309.

[5]Contan C,ToPa M.Variab1e steP size adaPtive non1inear echo cance11er[C].2012 10th Internationa1SymPosium on E1ectronics and Te1ecommunications,2012∶267-270.

[6]Bekrani M,Khong A W H,Lotfizad M.A 1inear neura1 network-based aPProach to stereoPhonic acoustic echo cance11ation[J]. IEEE Transactions on Audio,SPeech and Language Processing,2011,19(6)∶1743-1753.

[7]倪锦根,商慧亮,李锋.归一化子带自适应滤波器步长控制[J].电子与信息学报,2009,31(11)∶2606-2609.

[8]Gi11oire A.ExPerimentswith sub-band acoustic echo cance11ers for te1econferencing[C].1987 IEEE Internationa1Conference on Acoustic,SPeech and Signa1Processing,1987∶2141-2144.

[9]Nesta F,Wada T S,Biing-Hwang J.Batch-on1ine Semi-B1ind source seParation aPP1ied to mu1ti-channe1 acoustic echo cance11ation[J].IEEE Transactions on Audio,SPeech and Language Processing,2011,19(3)∶583-599.

[10]王侠,梁瑞宇,王青云,等.应用于助听器反馈抑制系统的变步长归一化子带自适应滤波算法[J].东南大学学报:自然科学版, 2015,45(3)∶417-422.

[11]赵越,越晓军,董婧.基于子带分解的自适应回声抵消算法[J].吉林大学学报∶工学报,2009,39(1)∶198-203.

[12]谭方青,张天骐,黄烈超,等.基于QPSO的两通道正交镜像滤波器组的优化设计[J].计算机应用研究,2011,28(9)∶3432-3442.

[13]赵艳,罗胜恩,万坚.余弦调制子带滤波器组迭代设计的改进算法[J].数据采集与处理,2013,28(1)∶110-116.

[14]Johnston J.A fi1ter fami1y designed foruse in quadraturemirror fi1ter banks[C].1980 IEEE Internationa1Conferenceon Acoustic, SPeech and Signa1Processing,1980∶291-294.

[15]Yuan-Pei L,Vaidyanathan P P.Linear Phase cosinemodu1ated maxima11y decimated fi1ter banks with Perfect reconstruction [J].IEEE Transactions on Signa1Processing,1995,42(11)∶2525-2539.

(责任编辑∶欧恺)

中图分类号:TM714

文献标识码:A

文章编号:1007-5348(2015)10-0021-05

[收稿日期]2015-09-07

[基金项目]广东省教育厅科技创新项目(2013KJCX0169);广东省自然科学基金项目(2015A030310510);韶关学院科研项目(314-140682).

[作者简介]文昊翔(1984-),男,广东韶关人,韶关学院物理与机电工程学院讲师,博士;研究方向∶自适应算法,有源噪声控制.

Research on AdaPtlve A lgorlthm Evaluatlon Standards for Echo Cancellatlon

WEN Hao-xiang1,YUE Yan-jie2
(1.Co11ege of Physics and Mechanica1&E1ectrica1Engineering,Shaoguan University,Shaoguan 512005, Guangdong;2.State Grid Zhoushan Power SuPP1y ComPany,Zhoushan 316021,Zhejiang,China)

Abstract∶Three eva1uation standards for adaPtive a1gorithm,Residua1Noise(RN),Echo Return Loss(ERL)and Misa1ignment(MIS)were studied theoretica11y to ascertain a Positive one.RN and ERL were found to be disadvantageous since they on1y focused on the residua1 noise Power instead of identification Precision. Consequent1y,they cou1d not ref1ect the serious defect of sPectra1 Peaks concea1ed in residua1 echo.Then various standards were simu1ated with sub-band adaPtive a1gorithm.The simu1ation resu1t demonstrated that MIS cou1d effective1y revea1 the 1ow identification Precision of sub-band adaPtive a1gorithm.ComPared with RN and ERL,MISwas found to be a rigorous eva1uation standard.

Key words∶adaPtive a1gorithm;eva1uation standard;residua1noise;echo return 1oss;misa1ignment

猜你喜欢

评价标准
“校企合作”携手完善高职院校分类考试招生的技能考核方式
构建建设类高校图书馆特色信息资源库评价标准
高等教育教学评价模式初探
传统媒体内容供给侧改革的三条路径
基于加权结构复杂度的角色挖掘评价
谈学生数学应用意识缺失的原因及解决策略
现行研究生教育评价体制下的优秀学位论文培育策略思考
小学英语教学的普遍现状及对策
浅谈广告摄影的创意与发展
高职软件技术实训考核评价标准构建