APP下载

清浊音分离抗噪的语音识别算法的研究

2018-01-17李云

电子技术与软件工程 2017年24期
关键词:浊音清音语音识别

摘 要

针对噪音环境下,语音识别率严重下降,根据清浊音发音原理的不同,提出一种清浊音分离抗噪的语音识别算法。实验结果表明,该方法能在噪音环境下明显提高语音识别率。

【关键词】语音识别 清音 浊音 高斯模型 超高斯模型

语音识别技术就是让机器接收,识别和理解语音信号,并将其转换成相应数字信号的技术。1956年,普林斯顿大学RCA实验室成功运用模拟电路将识别语音与模板语音进行对比(运算),从而开发出单音节识别系统。1959年,英国的Fry和Denes等人共同开发出一个改进的语音识别器,它能识别出9个辅音和4个元音,同时他们还制定了一些与音素序列有关的规则,这标志着人类开始对语音中元音和辅音的分别研究。上个世纪八十年代,一种由马尔可夫链演变而来,并用参数表示的用于描述随机过程统计特性的概率模型得到了空前的发展,目前大部分语音识别系统都是以它作为基本框架来建模,这便是隐马尔可夫模型(Hidden Markov Model,HMM)。该模型能在安静环境中或某种特定噪音环境中,取得很好的识别效果。但对于复杂的噪音环境,识别率下降显著。针对这一弊端,本文提出一种清浊音分离抗噪的语音识别算法,它将清音和浊音进行分离,并针对各自不同的特点分别进行处理。实验结果表明,该方法能有效降低噪音,提高噪音环境下的语音识别率,具有很高的实用性。

1 语音的声学原理

用数字技术来描述产生模拟信号的语音,这一过程称为语音信号的声学模型。根据发音原理的不同,语音信号分为清音和浊音。清音是发音时声带不振动而与空气摩擦产生的音。当气流通过声门时,如果声道中某处面积很小,气流高速冲过此处时产生湍流,当气流速度与横截面积之比大于某个临界速度便产生摩擦音即清音。将发音时声带振动而产生的音称为浊音,人平时说话以浊音居多。清音由白噪声序列激励一个线性系统而产生,这个线性系统仅由激励源和辐射模型级联而成。浊音的产生原理则不一样,它是由一个周期性的δ脉冲串激励一个线性系统而产生的输出,该线性系统由激励源、声道模型和辐射模型级联而成。清音和浊音的产生过程如图1所示。

其中,系数Av和Au分别用来调节浊音和清音的幅度和能量。

3 实验结果

实验中,加入一个白噪声序列,将普通算法,高斯模型抗噪算法与超高斯模型抗噪算法三者进行测试,分别识别不同语音,得到识别率如表1所示。

由表1可知,在白噪音的环境下,普通算法识别率非常低,不能满足要求。而高斯模型抗噪算法,识别率明显上升,能满足一些要求不高的场合。超高斯模型抗噪算法识别率最高,能基本满足实际需要。且三种算法,随着识别语音总量的增加,其识别率都有所下降。

4 结束语

语音信号按照其发音原理的不同,可分为清音和浊音,清音靠与空气摩擦发音,浊音靠声带振动发音,各自也具有不同的声学模型。在带噪音干扰语音识别中,超高斯分布模型考虑到语音信号自身的分布特点,以及人耳对不同频谱相位的敏感度不同,更加真实地反映出语音频谱的参數分布,提高了噪音下的语音识别率。但仍然忽略掉一些高阶多项式,而这些多项式在特定场合下是需要考虑的,这正是今后需要进一步研究的。

参考文献

[1]李云.基于HMM的语音分组识别系统的研究[D].广州:广东工业大学,2013:1-3.

[2]李云.语音分组识别技术的研究[J].广东工业大学学报,2014,31(02):1-4.

[3]李云.快速语音识别算法的研究[J].信息技术,2017,17(02):27-28.

[4]何勇军.语音识别中宽带失配的补偿研究[J].计算机学报,2011,34(09):1629-1637.

[5]严斌峰.语音识别确认中的置信特征和判定算法[J].软件学报,2006,17(12):2547-2553.

[6]袁胜龙.基于深层神经网络的藏语识别[J].模式识别与人工智能,2015,28(03):209-213.

[7]杨淑莹.基于免疫猫群优化算法的矢量量化的码书设计及语音识别[J].模式识别与人工智能,2014,27(07):577-583.

[8]崔金钟.基于DHMM的嵌入式语音识别系统的实现与优化[J].电子科技大学学报,2013,42(06):930-934.

[9]刘晓峰.Logistic核函数及其在语音识别中的应用[J].华南理工大学学报(自然科学版),2015,43(05):100-106.

[10]王宪亮.基于SVM一对一分类的语种识别方法[J].清华大学学报(自然科学版),2013,53(06):808-812.

[11]Zhang Rui.Facilitating the applications of support vector machine by using a new kernel[J]. Expert Systems with Applications,2011,38(11):14225-14230.

[12]王国胜.核函数的性质及其构造方法[J].计算机科学,2006,33(06):172-174.

[13]Du pei-jun.Wavelet SVM in reproducing kernel Hilbert space for hyperspectral remote sensing image classification[J].Optics Communications,2010,283(24):4978-4984.

[14]李冠宇.藏语拉萨话大词表连续语音识别声学模型研究[J].计算机工程,2012,38(05):189-191.

[15]Hinton G E. A Fast Learning Algorithm forDeep Belief Nets.Neural Computation[J].2006,18(07):1527-1554.

作者简介

李云(1984-),男,四川省广汉市人。硕士学位。助教。2013年6月毕业于广东工业大学,现在四川信息职业技术学院担任教师工作。主要研究方向为语音识别,从事语音识别算法研究及语音识别产品开发。

作者单位

四川信息职业技术学院 四川省广元市 628000endprint

猜你喜欢

浊音清音语音识别
《山水清音》
《园林清音》
通话中的语音识别技术
基于计算听觉场景分析的改进清音分离方法
母语干涉在语音方面对日语学习者的影响
——以送气与否与清浊音的混淆为中心
《山水清音图》
日语与永州方言浊音相似点小议①