APP下载

基于短时相位谱补偿的非接触语音检测增强算法研究

2013-07-31薛慧君李盛路国华吕昊张杨焦腾于霄马腾张华王健琪

中国医疗设备 2013年11期
关键词:维纳滤波背景噪声语音

薛慧君,李盛,路国华,吕昊,张杨,焦腾,于霄,马腾,张华,王健琪

第四军医大学 生物医学工程学院,陕西 西安 710032

基于短时相位谱补偿的非接触语音检测增强算法研究

薛慧君,李盛,路国华,吕昊,张杨,焦腾,于霄,马腾,张华,王健琪

第四军医大学 生物医学工程学院,陕西 西安 710032

语音是人类重要的生理信号,生物雷达能够通过检测喉部发音器官振动的微弱信息对语音进行非接触采集,从而提供一种新型的非接触语音获取方法。但生物雷达所接收的含有语音信息的回波中还存在多种噪声和杂波。本文采用离散短时傅立叶变换,在保持语音信号振幅谱不变的条件下通过改变相位谱来对信号谱进行重构,达到去除雷达语音信号中噪声分量的目的。通过与经典的谱减法和维纳滤波语音增强算法进行对比,此算法能够在低信噪比条件下有效地降低噪声分量,可提高生物雷达语音信号质量。

生物雷达;离散短时傅立叶变换;相位谱补偿;语音检测;非接触检测

生物雷达技术是近年来新兴的一种非接触式生理信息检测技术,雷达天线发射电磁波照射人体后,人体生理活动所导致的人体微动信号加载到反射波中,再通过雷达技术、生物医学信号处理技术以及计算机技术从雷达回波信号中检测人体的生命参数,从而实现人体呼吸、体动、心跳等生命特征的非接触探测。本实验室采用生物雷达技术,通过检测喉部发音器官振动的微弱信息对语音进行采集。生物雷达探测语音信号在一定程度上克服了麦克风的局限性,可实现远距离探测,具有方向性强、非接触等优点。雷达接收信号中,除了目标语音信号,还存在噪声和杂波等各种干扰信号,所以在雷达信号处理中,如何去除噪声干扰,保留雷达回波中清晰的语音信号是雷达语音增强的关键问题。

在语音增强领域,大多研究都致力于去除含噪语音信号中的噪声部分,以提高信号的可懂度和语音质量。因此各种各样的算法被用来实现语音增强,比如谱减法[1]、最小均方误差估计[2]、维纳滤波[3-4]、卡尔曼滤波[5]和子空间法等[6]。在雷达语音增强方面,李盛和田颖等人分别采用了 非 线 性 谱 减 法、 人 耳 听 觉 掩 蔽[7-8]、 小 波 阈 值 熵[9]和 高阶统计量[10]等算法来去除信号噪声,这些算法虽然在一定程度上达到了去噪的目的,但实验结果表明还需要进一步研究来提高雷达语音质量。经典的语音增强算法都在保持短时信号的相位谱不变的情况下来改变短时信号的振幅谱。本文通过改变含噪信号的相位谱而保持其振幅谱不变来生成一个新型复合频谱[11]。由于噪声信号主要存在于低频部分,而重构后的信号谱中的低频能量丢失较多,所以此种算法能够达到去噪目的。

1 语音增强方法

1.1 生物雷达实验系统

锁相振荡器产生稳定的 34 GHz、功率为 50 mW 的毫米波脉冲信号,经放大器进行放大,由 6 dB 的定向耦合器将其分为两路:其中 1/4 mm 波信号送往混频器作为参考信号;其余信号通过环形器到达平板天线进行输出,天线辐射功率保持在 10~20 mW。天线发射微波束到达人体,雷达信号被人体的胸部和喉的振动信号调制,所反射的回波信号由同一天线进行接收,回波信号与参考信号通过双平衡混频器发出低频信号,低频信号通过放大、滤波、A/D 转换输入计算机进行进一步的信号处理。详细的系统描述及实验原理详见参考文献[7-8]。

1.2 相位补偿算法

本文遵循信号分解—参量修正—信号重构的步骤来实现雷达语音增强[12-13]。算法流程,见图 1。

图1 雷达语音增强方法原理图

(1)信号分解。使用离散短时傅立叶变换对雷达语音信号进行分解。含噪语音信号表达如公式 (1):这里语音信号可看成准平稳信号,其中,、

(2)参量修正。对含噪语音的相位谱进行修正。含噪雷达语音信号是一个实数信号,因此,它的短时快速傅立叶变换共轭对称:。信号分解部分得出的可调复合谱由一个实函数进行补偿,函数与频率有关,见公式 (3)。

需要说明的是:补偿过的相位谱只是通过一个实数信号得出的伪相位谱,并不具备真实相位谱的性质。补偿的相位谱与含噪语音的振幅谱结合就组成一个可调复合谱信号,如公式 (5)。

图2 矢量原理图:离散短时傅立叶变换共轭对称的变换

1.3 实验数据采集

20名健康志愿者(被测试)参与语音测试实验,志愿者包含 12 名男性和 8 名女性,年龄 20~30 岁。雷达天线与被测试者的距离保持在 2~20 m 之间,采用 5 句中文普通话作为语音测试材料(句子的长度在 5~20 个字),语音测试实验在安静的环境中进行,每位被测试者使用正常的音量和语速读取语音材料。

2 结果与讨论

为了验证相位补偿算法对雷达语音增强的效果,实验过程中使用谱减法、维纳滤波法作为对比算法。对比实验是在含噪信号信噪比较低的情况下进行的。图 3(a)为原始雷达语音信号,从中能够观察出语音信号中掺杂大量的背景噪声。图 3(b)为谱减法处理后的语音信号语谱图,相比原始雷达语音信号,谱减法有效地去除了雷达语音中的噪声成分,但在背景噪声得到有效抑制的同时,语音信号也被 削 减 很 多,同 时 在 大 约 t=0 s 和 t=4 s 出 现 强 噪 声 分 量。图 3(c)为维纳滤波去噪后的语谱图,图中噪声成份得到了有效的去除,依然有部分语音信号被削减,但削减的程度少于谱减法处理后的结果。和谱减法类似,维纳滤波处理雷 达语音信号 在 t=0 s 和 t=4 s 处 仍然出现 了 强噪声分 量。图 3(d)为本文采用的相位补偿法去除雷达语音噪声后的语谱图,相比于前两种去噪方法,可以看到不仅背景噪声成分得到了很好地抑制,语音信号也丢失得很少。

图3 雷达语音信号语谱图

从听觉方面评估去噪效果,原始语音具有明显的背景噪声,经谱减法处理后,干扰噪声得到了有效抑制,但几乎也听不清语音信号的内容,在听觉效果评估开始和即将结束能听到很明显的刺耳的声音,说明在语音增强过程中产生了新的噪声分量。原始雷达语音经维纳滤波处理后,噪声也得到有了效抑制,处理后语音仍然混沌不清,这说明语音成分也被部分去除。而且和谱减法类似,经维纳滤波算法处理的语音中也产生了新的噪声分量。最后,相位补偿算法处理后的听觉评估可以明确听出背景噪声得到了有效抑制,语音信号也被很好地保留。

3 结论

生物雷达实验系统通过检测人体喉部振动的微弱信息对语音进行采集,使用相位补偿法对雷达语音信号进行去噪。与经典的语音增强方法不同,相位补偿法保持语音信号的振幅谱不变,而对信号的相位谱进行修正,去除含噪语音信号中低频成分(噪声信号被认为含有较多低频分量),进而达到去噪目的。为了进一步说明相位补偿算法对于语音增强的效果,实验中使用两种经典算法,谱减法和维纳滤波法与本算法进行了对比研究,结果表明:本算法有效地抑制了含噪信号中背景噪声成分,雷达语音信号也被保留得较为完整,说明相位补偿算法能够有效的去除雷达语音信号中的噪声成分。

[1] Boll SF.Suppression of acoustic noise in speech using spectral subtraction[A].IEEE Trans Acoust Speech Signal Process[C].1979,27:113-120.

[2] Ephraim D,Malah Y.Speech enhancement using a minimum mean-square error log-spectral amplitude estimator[A].IEEE Trans.Acoust.,Speech,Signal Process[J].1985,33:443-445.

[3] Wiener N.The extrapolation,interpolation,and smoothing of stationary time series with engineering applications[M].New York: Wiley,1949.

[4] Berouti M,Schwartz R,Makhoul J.Enhancement of speech corrupted by acoustic noise[J].In:Proc IEEE Internat Conf on Acoust Speech Signal Process(ICASSP)[J].1979,4:208-211.

[5] Paliwal ABK.A speech enhancement method based on Kalman filtering[A].IEEE Int Conf Acoustics,Speech,and Signal Processing[C].1987,12:297-300.

[6] Ephraim Y,Harry L.A signal subspace approach for speech enhancement[A].IEEE Trans Speech Audio Process[C].1995, 3:251-266.

[7] Li S,Wang JQ,Niu M,et al.Millimeter wave conduct speech enhancement based on auditory masking properties[J].Microwaveand Optical Technology Letters,2008,50(8):2109-2114.

[8] Li S,Wang JQ,Jing XJ.The application of nonlinear spectral subtraction method on millimeter wave conducted speech enhancement[J].Mathematical Problems in Engineering,2010,(2010):1-12.

[9] Li S,Tian Y,Lu G,et al.A new kind of non-acoustic speech acquisition method based on millimeter waveradar [J].Progress In Electromagnetics Research,2012,130:17-40.

[10] Tian Ying,Li S,Lv Hao,et al.Smart radar sensor for speech detection and enhancement[J].Sensors and Actuators A:Physical,2013,191(1):99-104.

[11] Kamil Wójcicki M M.Anthony Stark, James Lyons, Kuldip Paliwal.Exploiting Conjugate Symmetry of the Short-Time Fourier Spectrum for Speech Enhancement[A].IEEE Signal Process[C].Lett,2008,15:461-464.

[12] Crochiere R.A weighted overlap-add method of short-time Fourier analysis/synthesis[A].IEEE Trans Acoust, Speech, Signal Process[C].1980,28:99-102.

[13] Griffin D.Signal estimation from modified short-time fourier transform[A].IEEE Trans Acoust, Speech, Signal Process[C].1984,32:236-243.

Research on Non-contact Speech Enhancement Algorithm Based on Short-time Phase Spectrum Compensation

XUE Hui-jun, LI Sheng, LU Guo-hua, LV Hao, ZHANG Yang, JIAO Teng, YU Xiao, MA Teng, ZHANG Hua, WANG Jian-qi
College of Biomedical Engineering, The Fourth Military Medical University, Xi'an Shanxi 710032, China

As a kind of important physiological signals, speech signals can be detected through bioradar by detecting the weak information of human laryngeal vibration. Thus a new technology for obtaining non-contact speech signals is developed. However, various kinds of noises and clutter waves are also existed in the echoes accepted by bioradar. In this paper, discrete short-time Fourier transform was used to reduce the noise component by changing phase spectrum to reconstruct the signal spectrum while the amplitude spectrum of speech signals remained unchanged. Compared with traditional speech enhancement algorithms such as spectral subtraction and wiener filter, the proposed algorithm can effectively reduce the noise component under the condition of low signal-to-noise ratio, which indicated that the quality speech signals detected by biological radar can be enhanced.

bioradar; discrete short-time Fourier transform; phase spectrum compensation; speech detection; non-contact detection

R318.04;R197.39

A

10.3969/j.issn.1674-1633.2013.11.004

1674-1633(2013)11-0012-03

2013-09-05

国家自然科学基金项目(61371163, 61271102);陕西省国际合作重点项目(2013KW30-03)。

本文作者:前两位作者对文章具有同等贡献,因此应被视为共同第一作者。薛慧君硕士,主要从事语音信号获取及处理。李盛博士,主要从事语音信号获取及处理研究工作。

王健琪,教授,博士研究生导师。李盛,副教授,博士。

作者邮箱:sheng@mail.xjtu.edu.cn

猜你喜欢

维纳滤波背景噪声语音
环境背景噪声对飞机噪声监测结果的影响
利用背景噪声研究福建金钟库区地壳介质波速变化
魔力语音
多级维纳滤波器的快速实现方法研究
基于MATLAB的语音信号处理
自适应迭代维纳滤波算法
基于MQ3与MP3的价廉物美的酒驾语音提醒器
对方正在输入……
利用测地距离的三维人脸定位算法
应用背景噪声成像研究祁连山地区地壳S波速度结构