基于多窗谱估计的改进维纳滤波语音增强

2017-04-14张青吴进

计算机应用与软件 2017年3期

关键词：信噪比语音噪声

张青吴进

(西安邮电大学陕西西安 710121)

基于多窗谱估计的改进维纳滤波语音增强

张青吴进

(西安邮电大学陕西西安 710121)

为减少维纳滤波在语音增强中残留的“音乐噪声”，将多窗谱估计和改进的维纳滤波方法结合，并进行语音合成。设计了基于多窗谱估计的改进维纳滤波语音增强方法，该方法采用多窗谱估计噪声功率谱，改进维纳滤波降噪得到增强语音，以及重叠相加语音合成，并给出仿真对比验证。结果表明，基于多窗谱估计的改进维纳滤波方法在抑制噪声，减少音乐噪声方面优于基于维纳滤波的增强算法和基于多窗谱估计的改进谱减法的增强算法。

语音增强多窗谱改进维纳滤波语音合成重叠相加

0 引言

语音增强就是减少噪声干扰，提高语音质量的一个过程[1-2]。在实际中，语音在传输过程中很容易受到来自外界和内部噪声的污染，使得接收端语音质量下降[3]。抑制噪声干扰[4]，提高语音质量是语音增强的重要问题。

到目前为止，一些语音增强的方法，如谱减法[5]，带噪语音功率谱与噪声做减法得到估计语音的一种方法，该方法会使增强后的语音存在残留“音乐噪声”；维纳滤波[6]，只适用于平稳噪声环境，不适应复杂多变的噪声背景；最小均方误差法[7]，该算法是基于统计模型的，计算量大复杂度高。

针对上述问题，本文提出了一种基于多窗谱估计的改进维纳滤波语音增强方法。该方法采用多窗谱估计带噪语音功率谱得到估计值，改进维纳滤波增强法进行噪声抑制，最后采用重叠相加合成语音。

1 基本原理

1.1 多窗谱估计

Thomson在1982年提出了多窗谱估计[8]，该方法对同意数据序列用多个正交的数据窗分别求直接谱，然后求平均得到谱估计，多窗谱是一种更为准确的谱估计方法，多窗谱估计定义如下：

(1)

式中，L为数据窗个数，Smt为第k个数据窗的谱：

(2)

式中，x(n)为数据序列，N为序列长度，ak(n)为第k个数据窗，它满足多个数据之间相互正交：

(3)

数据窗是一组相互正交的离散椭球序列DPSS(DiscreteProlateSpheroidalSequences)。

1.2 维纳滤波算法及其改进

维纳滤波器是一种线性滤波器。当输入带噪语音y(n)=s(n)+d(n)(n=0,1,2,…),其中s(n)为纯语音，d(n)为噪声。经过系统函数为h(n)的维纳滤波系统，输出估计语音为[9]：

(4)

根据正交性原理，系统函数h(n)对每个m满足[11]。

(5)

(6)

将式(6)的H(k)稍作变形可得改进维纳滤波器的估计器[13]，即：

(7)

(8)

(9)

其中，ξ(k)是先验信噪比，γ(k)是后验信噪比，定义如下：

(10)

(11)

ξi(k)=aξi-1(k)+(1-a)(γi(k)-1)

(12)

(13)

这便是第i帧语音信号频谱的估算值。

2 算法具体实现步骤

本文提出基于多窗谱估计的改进维纳滤波语音增强算法，区别于传统的维纳滤波算法。具体实现步骤如下：

Step1 带噪语音信号为y(n)，加窗分帧后为yi(m)，相邻帧之间有重叠；

以i帧为中心前后各取M帧，共有2M+1帧进行平均实际中常取M为1，即在3帧中进行平均；

Step3 把分帧后的信号yi(m)进行多窗谱估计，得到多窗谱功率谱密度P(k,i)(i表示第i帧，表示k第k条谱线)；

Step4 对多窗谱功率谱密度估计值也进行相邻帧之间的平滑处理，计算平滑功率谱密度Py(k,i)：

以i帧为中心前后各取M帧，共有2M+1帧进行平均。实际中常取M为1，即在3帧中进行平滑；

3 仿真结果及分析

实验中的语音材料为安静环境下录制的纯净语音，噪声选自Noisex-92数据库。在不同背景噪声环境下，输入信噪比分别为-5、5dB的情况下，对比分析基于维纳滤波和基于多窗谱估计的改进维纳滤波语音增强以及基于多窗谱估计的改进谱减法语音增强的增强效果。结果如图1、图2、表1所示，其中图1为高斯白噪声环境下，输入信噪比分别为-5、5dB时，基于维纳滤波的语音增强与基于多窗谱估计的改进维纳滤波语音增强的增强效果对比；图2为babble噪声环境下，输入信噪比为-5、5dB时，基于维纳滤波的语音增强与基于多窗谱估计的改进维纳滤波语音增强的增强效果对比；表1为分别在babble、Gaussian、pink以及factory噪声环境下，当输入信噪比为-5、0、5dB时，对比基于维纳滤波的语音增强和基于多窗谱估计的改进维纳滤波语音增强以及基于多窗谱的改进谱减法的语音增强的输入输出信噪比及其差值。

图1 增强效果对比

图2 增强效果对比

图1中(a)、(c)分别为在高斯白噪声环境下，输入信噪比依次为-5、5dB时，基于维纳滤波算法的语音增强。图1中(b)、(d)分别为在高斯白噪声环境下，输入信噪比依次为-5、5dB时，基于多窗谱估计的改进维纳滤波算法的语音增强。对比图1中(a)和(b)、(c)和(d)可以看出，在高斯白噪声环境下，输入信噪比为-5、5dB时，基于多窗谱估计的改进维纳滤波语音增强相对于基于维纳滤波的语音增强，在增强效果方面有一定的提高。图2中(e)、(g)分别为在babble噪声环境下，输入信噪比依次为-5、5dB时，基于维纳滤波算法的语音增强；图2中(f)、(h)分别为在babble噪声环境下，输入信噪比分别为-5、5dB时，基于多窗谱估计的改进维纳滤波算法的语音增强。对比图2中(e)和(f)、(g)和(h)可以看出，在babble噪声环境下，输入信噪比为-5、5dB时，基于多窗谱估计的改进维纳滤波语音增强相对于基于维纳滤波的语音增强，在增强效果方面也有一定的提高。

表1 不同噪声环境下语音增强的输出SNR比较

从表1可以看出，当输入信噪比分别为-5、0、5 dB时，就输入输出信噪比而言，在babble、Gaussian、pink以及factory背景噪声下，基于多窗谱估计的改进维纳滤波算法与基于多窗谱估计的改进谱减法的语音增强，其增强效果优于基于维纳滤波的语音增强算法。当输入信噪比为-5 dB时，在Gaussian噪声环境下，基于多窗谱估计的改进谱减法语音增强得到的信噪比差值大于基于多窗谱估计的改进维纳滤波语音增强算法得到的信噪比差值，说明在Gaussian噪声环境下，基于多窗谱估计的改进维纳滤波语音增强算法的增强效果相对基于多窗谱估计的改进谱减法语音增强的增强效果略差。当输入信噪比为5 dB时，在babble、Gaussian以及factory噪声环境下，基于多窗谱估计的改进维纳滤波语音增强得到的信噪比差值略低于基于多窗谱估计的改进谱减法语音增强得到的信噪比差值。而在其他情况下，基于多窗谱估计的改进维纳滤波语音增强的增强效果相对优于基于多窗谱估计的改进谱减法。

4 结语

为减少在维纳滤波增强后，语音中残留的“音乐噪声”，提出了基于多窗谱估计的改进维纳滤波语音增强算法，该算法将多窗谱带噪语音功率谱估计和改进维纳滤波算法相结合，得到增强语音的频谱，并采用重叠相加法将其合成语音信号。通过仿真实验，结果表明，基于多窗谱估计的改进维纳滤波算法相比基于维纳滤波的语音增强以及基于多窗谱估计的改进谱减法语音增强，在增强效果方面有一定的提高。

[1] 徐岩,王春丽.语音信号增强技术及其应用[M].北京:科学出版社,2014.

[2] 王水平,唐振民,陈北京,等.复杂环境下语音增强的复平面谱减法[J].南京理工大学大学学报,2013,37(6):857-862.

[3] 张卫强,郭璁,张乔,等.一种基于计算听觉场景分析的语音增强算法[J].天津大学学报:自然科学与工程技术版,2015,48(8):663-669.

[4] 李秩男,张雄伟,曾理,等.改进的稀疏字典学习单通道语音增强算法[J].信号处理,2014,30(1):44-50.

[5] 王路露,刘光灿,夏旭.一种改进型谱减算法的语音增强研究[J].计算机工程与应用,2014,50(19):210-213.

[6] 容强,肖汉.基于MMSE维纳滤波语音增强方法研究与Matlab实现[J].计算机应用与软件,2015,32(1):153-156.

[7]YouC,KohS,RahardjaS.Adaptiveb-orderMMSEestimationforspeechenhancement[J].Proc.IEEEInt.Conf.Acoust.,SpeechSignalProcessing,2003(1):900-903.

[8] 武鹏鹏,赵刚,邹明.基于多窗谱估计的改进谱减法[J].现代电子技术,2008,31(12):150-152.

[9] 张正文,周航麒.基于多窗谱估计的维纳滤波语音增强算法[J].河南理工大学学报,2015,34(5):686-690.

[10]FardkhaleghiP,SavojiMH.NewapproachestospeechenhancementusingphasecorrectioninWienerfiltering[C]//InternationalSymposiumonTelecommunications-IST,2010:895-899.

[11]IbrahimA,MilnerB.VisuallyDerivedWienerFiltersforSpeechEnhancement[J].IEEETransactionsonAudio,Speech&LanguageProcessing-TASLP,2011,19(6):1642-1651.

[12]ScalartP,FilhoJ.Speechenhancementbasedonapriorisignaltonoiseestimation[J].Proc.IEEEInt.Conf.Acoust. ,Speech,SignalProcessing,1996:629-632.

[13]PhiliposCLoizou.语音增强理论与实践[M].成都:电子科技出版社,2012.

[14] 宋知用.MATLAB在语音信号分析与合成中的应用[M].北京:北京航空航天大学出版社,2013.

IMPROVED WIENER FILTER SPEECH ENHANCEMENT BASED ONMULTI-TAPER SPECTRUM ESTIMATION

Zhang Qing Wu Jin

(Xi’anUniversityofPostandTelecommunications,Xi’an710121,Shaanxi,China)

In order to reduce the musical residual noise left by the speech enhancement of wiener filter, multi-taper spectrum estimation is combined with the improved wiener filter method while processing speech synthesis. A wiener filter speech enhancement method based on multi-taper spectrum estimation is designed. The method adopts the noise power spectrum of multi-taper spectrum estimation, improves wiener filter to reduce noise and enhance speech, and overlap-adds it to achieve speech synthesis. Then the simulation contrast verification is given. The result shows that the wiener filter speech enhancement method based on multi-taper spectrum estimation performs better in noise suppression and musical noise reduction than speech enhancement algorithm based on wiener filter as well as improved spectral subtraction method based on multi-taper spectrum estimation.

Speech enhancement Multi-taper spectrum Improved wiener filter Speech synthesis Overlap-adding

2016-02-25。国家自然科学

61272120)。张青，硕士，主研领域：语音增强。吴进，教授。

TP912.35

10.3969/j.issn.1000-386x.2017.03.011