APP下载

Speex算法中AGC算法的分析与仿真

2010-08-06李菁菁黄孝建

通信技术 2010年4期
关键词:话音电平增益

李菁菁, 黄孝建, 李 敬

(①北京邮电大学 信息与通信工程学院,北京 100876;②清华大学 电子工程系,北京 100084)

0 引言

VoIP是指利用因特网实现语音和各种数据业务集成传输的一种新兴网络技术[1]。语音在采集和传输过程中,由于语音源的差异、信道的衰减、噪声干扰以及远近效应,导致信号幅度相差较大,利用AGC可以优化信号电平,提高通信质量[2]。本文提出的算法是根据VAD对话音与非话音的判别,仅对有效语音进行增益控制,抑制非话音信号,保证语音通信质量。

1 算法原理

如图1所示,经过加窗和FFT变换的话音传入VAD和AGC模块,两者配合实现自动电平控制。其中VAD用于判断信号是否为纯语音段,AGC根据VAD的结果,仅对检测到的纯语音作增益控制,而对非语音信号输出0,不进行编码与发送,从而节省带宽[3-4]。下面具体分析VAD和AGC模块的处理算法。

图1 基于VAD的AGC算法原理

1.1 VAD算法

采用的是基于统计模型的话音激活检测(STATVAD)[4-5]。首先假设2个事件:

H0:无话音 即:X=N,

H1:有话音 即:X=N+S,

S,N和X分别表示话音、噪声和带噪语音,其第k个分量为 kS, kN和 kX,话音和噪声的频谱分量都服从高斯分布,且加性噪声与话音不相关,则带噪语音谱在 0H 和 1H下的条件概率分别为:和分别表示加性噪声和话音谱的方差,第k个分量的似然比定义为:

第n帧的kε用直接判决方法的估计:

存在话音的判决准则由贝叶斯准则建立,带噪语音中存在话音的概率为:

1.2 AGC算法

采用的是一种基于能量比较的AGC算法,首先AGC对每帧语音各样点作能量估计:

当满足该条件的样点数的百分比大于0.2时进行增益调整,否则保持前一帧的值不变。

增益调整时,设定两个平滑因子rate和2rate:

其中rate初值为1,随着处理帧数增加而减小;rate2为0.2;(k)表示第k帧语音能量和;gain(k)表示第k帧的增益系数。计算出增益系数后,将当前帧各样点幅值与增益系数相乘,进行IFFT后输出。

2 仿真结果

2.1 AGC程序仿真及分析

在Palmmicro公司开发的PalmAdsp仿真器中运行Speex中定点化的VAD和AGC程序,需6887个PM(程序储存区)和1920个DM(数据储存区),运算量需20MIPS。

选择一段较平稳的语音来测试AGC的性能。图2是平稳的原始语音,图3是设定的每帧的增益值,将对应帧的语音信号与之相乘,得到图4。将该信号通过AGC模块,得到各帧增益值如图5所示。分析得出:

图2 平稳的原始语音

图3 设定的增益值

图4 原始语音与增益值相乘

图5 AGC模块得到的增益值

0~100帧,设定的增益值由0.5逐渐增大,语音刚开始较小,随着其值先增后减,AGC增益值先减后增;100~300帧,设定的增益值不变,AGC增益值基本保持与原始语音对应,语音减时,增益增,语音增时,增益减;300~345帧,设定的增益值剧增,最大为6.0,语音先减后增,AGC增益值先增后减至最小值;345~700帧,设定的增益值逐渐减小,AGC增益值呈上升趋势;700~900帧,设定的增益值渐增,初始语音较小,AGC增益值增大,接着语音信号增大,AGC增益值呈下降趋势。

经过以上分析可以得出,该AGC程序达到了自动增益控制的目的。

2.2 VAD程序仿真及分析

选择一段断续的语音来测试该程序的性能。图 7是断续的原始无噪语音;图8是经过AGC模块处理后的语音输出波形,图9是同时使用VAD和AGC模块处理后的语音输出波形。可以看出,只使用AGC模块时,语音输出电平得到调整,且保持在一定范围内,但静音信号同样被增强;同时使用VAD和AGC模块时,在放大语音的同时保持了原有的信号波形,失真小并具有一定的鲁棒性,静音信号段输出0,很好地实现了自动电平控制功能。

图7 原始无噪语音

图8 经AGC处理后的语音

图9 经VAD和AGC处理后的语音

3 结语

随着Internet的飞速发展与普及应用,发展和完善VoIP技术全面取代PSTN已成为当前的一个研究热点,而语音质量问题是 VoIP要解决的主要问题,也是其难点问题之一。Speex编码算法是一种随着网络质量变化而提供不同传输速率的变速率的编码算法,本文深入分析了Speex语音编码算法中基于VAD的AGC算法的原理,并通过进行仿真和分析,得知通过自动增益控制处理后的语音失真小,清晰度高,达到了电平控制的效果。

[1] 刘艳,付慧生,李雪峰.现代通信技术与 VoIP[J].通信技术,2007,40(04):49-50.

[2] 汪安民,陈明欣.基于客户端DSP的数字电话系统[J].单片机与嵌入式系统应用,2005(07):47-48.

[3] ChuP L.Voice-activated AGC for Teleconferencing[J]. Acoustics,Speech, and Signal processing, ICASSP-96.Conference Proceedings, IEEE International Conference,1996(02):929-932.

[4] 郭莉,殷南,王炳锡.语音业务中鲁棒性VAD算法分析[J].电声技术,2005(09):42-44.

[5] Sohn J, Sung W. A Stati-tical Model-Based Voice Activity Det-ction[J].IEEE Signal Processing Letters,1999(01):1-3.

[6] 方建,苏建元.基于 DSP和谱熵的语音检测[J].通信技术,2008,41(02):76-77.

猜你喜欢

话音电平增益
基于增益调度与光滑切换的倾转旋翼机最优控制
基于单片机的程控增益放大器设计
基于Multisim10和AD603的程控增益放大器仿真研究
话音叠加中实时混音算法的FPGA实现
程控增益射频宽带放大器
三电平PWM并网变换器LCL滤波器量化设计
准PR控制的三电平逆变器及中点平衡策略
光伏并网系统二电平逆变器的故障诊断
NPC五电平Z源逆变器的设计研究
分组话音在窄带信道的组播实现方案