APP下载

基于频率转移的数字助听器单通道响度补偿算法

2017-03-23李战明

电子设计工程 2017年5期
关键词:响度频段增益

李战明,张 璇

(兰州理工大学 电气工程与信息工程学院,甘肃 兰州730050)

基于频率转移的数字助听器单通道响度补偿算法

李战明,张 璇

(兰州理工大学 电气工程与信息工程学院,甘肃 兰州730050)

为了实现数字助听器响度补偿的目的,本文提出了一种基于频率转移的单通道响度补偿算法。该算法在频域分析的基础上,对语音信号高频部分按比例压缩并搬移到目标频段,再利用多分辨率小波对信号进行分解与重构,提取频谱包络,得到特征频率点初期信息;以特征点为端点进行分段,在各频段内进行响度补偿和增益控制。该算法使得补偿后语音的响度完全映射到患者的听觉范围内。仿真实验结果表明,该方法有效补偿了患者缺失的语音高频能量,显著提高了患者的听力水平及言语辨识率,同时保护了语音特征,达到了理想的效果。

响度补偿;频率转移;多分辨率小波;特征频率点

响度补偿是数字助听器设计的首要任务。目前数字助听器中多采用多通道响度补偿算法[1],其基本思想是把信号按频率划分成多个频带,然后在各频带内进行响度补偿。该算法通常是对衰减小的频带进行小幅度增益,对衰减大的频带进行大幅度增益[2-3]。然而有研究表明,当听力损失超过60 dB时,对高频进行高增益不但达不到补偿的效果,而且会对言语的理解产生副作用[4-5];同时该研究表明,人脑对频率的觉察不是依赖绝对频率,而是相对比率。按比例压缩可以保持语音中各语素之间的相应频谱位置关系[6]。语音频谱中的许多特征(如频谱包络和共振峰等)对言语的识别具有很重要的意义,而多通道响度补偿算法几乎忽略了对这些特征的保护,造成语音结构变形和识别率低等问题。

文中在流行算法的基础上,针对以上各方面不足,提出一种基于频率转移的单通道响度补偿方案。即首先将语音高频谱(患者听力损失超过60 dB)部分按比例压缩后搬移到其残余的较好的听力范围内,然后通过小波多分辨率分析的方法提取信号频谱包络,以特征频率点为端点进行分段补偿。既保留了多通道响度补偿的优点,又解决了其对语音特征如共振峰的忽略所造成的语音结构变形问题;而采用压缩移频技术可有效改进听损患者的言语辨识率,特别对女声、童声这些高频分量丰富的语音有更好的效果[7]。实验结果表明,该算法具有可行性与有效性。

1 响度补偿算法及流程

1.1 响度补偿及增益控制原理

当声音的声压能刚好能被人耳感知时,该声压值称为“听阈”;如果加大声音的强度,使它大到人的耳朵感到疼痛,这个声压称为“痛阈”。人耳对不同频率上声强的感觉是不同的[8]。图1为正常人和听损患者的纯音听力比较。

图1 听损患者(~u)与正常人(~n)的听力测试曲线对比

从图1中可以看出,患者在不同频段上的听损情况是不相同的,所以需要在不同的频带上进行不同的增益。总体来看,频率越高,衰减越严重,听力范围越窄。

1.2 压缩移频技术

压缩移频就是将语音信号某段频域信息按比例压缩后搬移到另一频段上的方法[9-10]。这种算法能够实现的主要原因是语音的一些特殊性质,也就是在语音元素之间有着相对的关系,按比例压缩可以保持语音中语素之间的相应关系。将患者感知不到的语音高频部分按比例压缩搬移到残余的有较好的听力范围内,这可以保证患者能够感知到原本无法获取到的语音高频信息,有助于提高患者的言语辨识率。

不同患者的听损情况不同,故要根据患者的真实情况选定要搬移的频段和目标频段,然后计算压缩比,设压缩比为γ,则:

其中,fomax和fomin分别为原频段的最高频率和最低频率,fgmax和fgmin分别为目标频段的最高频率和最低频率。压缩后信号频谱表达式为:

1.3 基于小波多分辨率分析的单通道频段划分

由于患者在不同频段上的听损情况不同,故要把语音信号划分为不同的频段。利用小波多分辨率分析[11-12]对信号进行分解与重构,提取信号频谱包络,找出特征频率点进行不同频段的划分。这里的特征点指的是小波分解与重构使信号声压级频谱更加平滑,继而检测出重构后的音频声压级频谱包络的各极值所在,确定为信号声压级频谱的特征点。

1.4 系统结构框图

首先对一段语音信号进行预处理,然后根据病人的听力测试曲线选取语音高频部分进行压缩搬移,再对该信号提取频谱包络进而提取特征频率点,根据特征点划分频段并在各频段内进行响度补偿和增益调节,最后得到补偿后的语音。系统的结构框图如图2所示。

图2 系统结构框图

具体步骤如下:

第1步:语音信号预处理。语音信号采样频率为16 kHz,加hamming窗分帧,取一帧为16 ms,帧移为帧长的一半;对每一帧信号进行傅里叶变换得到信号频谱,其变换公式如公式(3)所示:

第2步:高频谱压缩搬移。以某病患为例,测得其听力特性曲线如图1所示,可以看出在4000~8000Hz频段上患者的听觉范围极小,且听力损失超过60 dB,而在2 000~4 000 Hz频段上的听觉范围较大,因此将语音的高频段(4 000~8 000 Hz)按公式(1)进行压缩,取压缩比N=2,并根据移频表达式(2)将压缩后的频谱搬移到目标频段(2 000~4 000 Hz)上。要根据患者的具体情况来选取原频段与目标频段;

第3步:单通道增益补偿。多分辨率分析又称多尺度分析,是指在不同尺度或分辨率上,由粗到细或由细到粗的对事物进行描述和分析[13]。Mallat算法[14-15]将函数空间逐级二分解,产生一组逐级包含的子空间,每级输入被分解成离散平滑逼近和离散细节信号,输出采样率减半。语音信号是一维信号,利用小波分解与重构,能够提取出信号的相对低频包络,也能够反映信号的高频细节。

Mallat算法分解原理可以用式(4)(5)表示。Sj(n)和Dj(n)分别为信号第j层的离散平滑逼近(低频信号)和离散细节信号(高频信号),h(n)是与尺度数相关的低通滤波器的脉冲响应,g(n)是与小波函数相关的高通滤波器的脉冲响应。

小波重构为小波分解的逆过程,Mallat小波逐层重构原理可以表示为式(6)。

单通道增益补偿步骤:

1)小波分解与重构(提取语音频谱包络)

本设计对语音信号帧进行4级小波分解与重构,其计算过程如下:

① 将声压级频谱最高阶高频小波特征信号置零,即D4(n)=0;

② 利用Mallat算法对声压级频谱进行逐级重构。 首先由式(6)计算出(n):

2)提取特征点(共振峰与波谷)

由(1)获得信号重构后的频谱包络,然后对其进行幅值检测,以某频率点的幅值与其前后频率点幅值之差的变化来判断该点是否为极值点,如果两差值正负性相同,则为极值点,以此选定该点为特征点;差值为正,则为波峰(包含共振峰);差值为负,则为波谷。

3)增益补偿

图3为增益控制曲线,图中横坐标表示输入的声压级,纵坐标表示输出的声压级。THRn、MCLn、UCLn分别表示正常人的听阈值、最舒适阈值、痛阈值。THRu、MCLu、UCLu分别表示患者的听阈值、最舒适阈值、痛阈值。这些参数在不同频段上的值各不相同,可根据患者的听力检查曲线来确定。以某病患为例,测得其听力特性如图1所示,计算各特征点Wx所需增益Gwx。

图3 增益控制曲线

对于某特征点,首先由图1确定该频点THRn、THRu、UCLn、UCLu、MCLn、MCLu 6个参数。然后计算该频点增益调节因子,即a和b两段直线的斜率,如下式所示:

整个听力频带被m个特征点划分成m+1个频带,特征频率点增益前文已给出了具体算法;对任一频点W,首先判断其所在频带,设其所在频带的两个端点(特征频率点)wl、wl-1,增益值为 Gwl、Gwl-1,则该频点的增益值为:

由此便可确定适合患者的全频带增益特性;

第4步:傅里叶逆变换。对补偿后的音频频谱进行傅里叶逆变换,最终得到符合患者听力需求的语音信号。傅立叶逆变换算法如下:

最后合成各帧信号,便得到响度补偿后的语音信号。

2 实验与仿真

图4为一帧语音的频谱搬移前后的比较图,经过γ=2的压缩并进行频率转移。其中原频段取为0~8 000 Hz,目标频段为0~4 000 Hz。

图4 频谱搬移前后比较

实验语音为语音室录制的一段语音。采样频率为16 kHz,首先对语音信号进行分帧,帧长为20 ms(320点),帧移为帧长的一半。对其一帧信号进行上文提到的Mallat小波分解与重构,得到重构后的谱线(下文称为Mallat频谱),仿真结果如图5所示。

图5 频谱包络图

从图5中可看出,用Mallat算法进行小波分解与重构,可有效提取出语音信号频谱包络。

对文中示例患者进行文中算法的仿真补偿,其中一帧信号的补偿结果如图6所示。

图6 响度补偿及增益控制

从图6可以看出,原语音在大部分频段内的响度值都低于患者的听阈值,在2 000~4 000 Hz频段内,患者基本听不清声音。经过本文算法补偿后的语音信号,其整个频段上的声压级明显处于患者的听觉范围内,实现了响度补偿的目的。

图7是语音信号经过响度补偿前后的振幅谱图。

图7 响度补偿前后语音信号的振幅谱图

从图7可以看出,经过频率转移的响度补偿,其高频能量得到正确补偿,中频能量明显丰富了很多。这可以保证患者能够感知到原本无法获取到的语音高频信息,有助于提高患者的言语辨识率。

图8是原语音、经过响度补偿后后语音的时域波形比较图。

从图8语音信号的时域波形比较图可以看出,补偿后的语音与原语音波形的拟合度很高,基本保持一致,较好地保留了语音特征,提高了言语辨识率;且语音的幅度明显增强,达到了响度补偿的目的。

3 结 论

以上结果表明,通过压缩移频可以将患者不容易听到的高频部分搬移到患者可以较容易感知的听力残留区,并在该区域进行了响度补偿,通过小波分析[16]提取特征频率点,以其为端点分段,在各段内各自补偿,使得补偿后语音的强度完全映射到听损患者的听力范围内,有效防止了对患者的二次伤害。相对于传统助听器补偿算法,本算法在对语音进行补偿的同时能更有效地保护语音特征,提高言语识别率,达到比较理想的效果。需要指出的是,小波函数的选取会直接影响所提取包络的结构,本文实验中利用Db6小波进行分析,取得了良好的效果。

图8 原语音及响度补偿后语音的时域波形图

[1]Kwen-Siong Chong,Bah-Hwee Gwee,Chang,J S A 16-Channel Low-Power nonuniform spaced filter bank corefor digital hearing aids[J].IEEE Transactions on Circuits and Systems II:Express Briefs,2006,53(9):853-857.

[2]王青云,赵力,赵立业,邹采荣.一种数字助听器多通道响度补偿方法[J].电子与信息学报,2009,31(4):832-835.

[3]Wyrsch S,Kaelin A.Subband signal processing for hearing aids[C]//Proceedings of the 1999 IEEE International Symposium on Circuits and Systems,1999:29-32.

[4]Miller-Hansen D R,Nelson P B,Widen J E,et al.Evaluating the benefit of speech recoding hearing aids in children[J].American Journal of Audiology,2003,12:106-113.

[5]Stelmachowicz P G,Pittman A L,Hoover B M,et al,MoellerM.The Importance of high-frequency audibility in the speech and language development of children with hearing loss[J].Arch Otolaryngol Head Neck Surg.2004,130(5):556-562.

[6]Goldbaum S M,Halpin C.Exploring the Damaged Ear.The NIDCD national temporal bone registry[J].ASHA,1999,Jan-Feb,41(1):29-33.

[7]Deniz B,Robert V S.Combined effects of frequency compression-Expansion and shift on speech recognition[J].Ear&Hearing,Jun 2007,28(3):277-289.

[8]乔杰.利用人耳听觉特性的子带双声道回波抵消[J].应用科学学报,2007,25(4):331-336.

[9]Ling D.Three experiments on frequency transposition[J].American annals of the deaf,1968,113(2):283-94.

[10]Sakamoto S,Goto K,Tateno M,et al.Frequency compression hearing aid for severe-to-profound hearing impairments[J].Auris Nasus Larynx,2000,27(4):327-334.

[11]杨建国.小波分析及其工程应用[M].北京:机械工业出版社,2005.

[12]孙勇,景博,覃征,等.基于小波分析的信噪分离方法研究[J].计量学报,2006,26(2):153-155.

[13]MallatS.A theory formultiresolution signal decomposition the wavelet representation[J].IEEE Trans on Pattern Analysis and Machine Intelligence,1989,11:674-693.

[14]张杰.Mallat算法分析及C语言实现[J].微计算机信息,2010,26(3):229-230,237.

[15]周凯,吴旦.基于多分辨分析的Mallat算法研究[J].软件导刊,2008,7(10):54-55.

[16]杨勇明.基于小波分析的蜗轮蜗杆减速器故障诊断系统[J].电子科技,2016(11):65-69.

A single-channel loudness compensation algorithm based on frequency transfer for digital hearing aids

LI Zhan-ming,ZHANG Xuan
(College of Electrical and Information Engineering of Lanzhou University of Technology,Lanzhou 730050,China)

In order to achieve the purpose of loudness compensation,a single-channel loudness compensation algorithm is proposed based on frequency transfer technology for digital hearing aids.On the basis of frequency domain analysis for the algorithm,high frequency part of speech signal is compressed according to the proportion and transferred to the target band.And then the signal is decomposed and reconstructed by using the multi-resolution analysis of wavelet.Extract the speech spectral envelope,get the early information of frequency characteristics.Segmentation is performed by the feature points,then execute loudness compensation and gain control in each band.After loudness compensation,the identity of the signal is enhanced obviously and restricted within earshot of the hearing-impaired listeners.Simulation results indicate that the loss energy of the high frequency sound is well compensated,the level of hearing and speech recognition rate is improved,at the same time the speech feature is protected,which realized an ideal effect.

loudness compensation;frequency shift;multi-resolution wavelet;characteristic frequency

TN912

:A

:1674-6236(2017)05-0083-05

2016-03-03稿件编号:201603025

李战明(1962—),男,陕西西安人,硕士,教授。研究方向:复杂系统的建模与控制,神经模糊系统与软计算,智能信息处理与模式识别,计算机控制系统的理论与工程等。

猜你喜欢

响度频段增益
基于增益调度与光滑切换的倾转旋翼机最优控制
5G高新视频的双频段协同传输
gPhone重力仪的面波频段响应实测研究
基于单片机的程控增益放大器设计
基于Multisim10和AD603的程控增益放大器仿真研究
响度在节目制作和播出中的应用
数字时代中节目响度平衡浅析
推挤的5GHz频段
台内音频响度控制方式
自增益电路在激光测距中的应用