不同噪声模式下声调对听力正常青年言语识别能力的影响△

2019-03-19王媛李楠董瑞娟刘冬鑫陈静徐立王硕

听力学及言语疾病杂志 2019年2期

王媛李楠董瑞娟刘冬鑫陈静徐立王硕

言语声调(lexical tone)是能区别音节意义的音高，它承载了语义，是区别于非声调语言(如英语)的特征之一。汉语声调按照基频走行的不同分为阴平(一声)、阳平(二声)、上声(三声)和去声(四声),2010年，Patel等[1]研究表明，将语句中的所有声调变为一声后，听力正常受试者在安静环境下对平声调语句识别正确率能够达到自然声调语句识别率的94%，即声调信息并不对语句识别产生明显影响；然而引入语谱噪声后(信噪比为0 dB)，听力正常受试者聆听自然声调句子的言语识别率有一定程度的下降，聆听平声调语句的言语识别率更差，这表明声调信息对语谱噪声下的语句感知有显著影响。本研究分别使用双人语噪声(two-talker babbles, TTB)和语谱噪声(speech-shaped noise, SSN)两种噪声模式，研究听力正常人在安静和不同噪声环境下聆听语句的言语识别能力，探讨声调在不同噪声模式下对言语感知的影响。

1 资料与方法

1.1研究对象听力正常受试者20例，其中男10例，女10例，平均年龄22.41±1.84岁，0.25～8 kHz纯音听阈≤15 dB HL。研究对象均为在校大学生，均以普通话作为日常语言交流方式，无耳科疾病史。本研究通过了北京市耳鼻咽喉科研究所伦理委员会的批准，所有受试者均同意参加本次研究。

1.2言语识别能力测试材料本研究采用的言语测试材料是儿童版汉语普通话噪声下言语测试句表 (Mandarin hearing in noise test for children, MHINT-C)[2,3]。除使用其原始材料作为本研究自然声调语句测试材料外，还邀请男性专业播音人员将MHINT-C语句测试材料录制为每字均发一声的平声调语句测试材料，并选取双人语噪声和语谱噪声两种噪声模式，双人语噪声为一位男性和一位女性共同朗读的无语义句子，SSN是白噪声经过言语谱滤波处理后得到。本研究每例受试者需要使用14个不同的等价句表(每表10个句子)，儿童版MHINT共有15个等价性句表，能够满足本研究测试要求。

1.3言语识别能力测试方法在标准隔声室内进行测试，采用头戴压耳式耳机(Sennheiser HD 280 pro)，在受试者舒适的给声强度下进行。语句测试语料通过笔记本电脑里的MATLAB软件播放给受试者聆听，受试者需要集中注意力尽可能分辨语句内容，并要求其对耳机中播放的句子进行复述，每个句子仅聆听一遍，测试者根据受试者复述正确的字数进行打分。每例受试者分别在安静环境下和信噪比为+5、0、-5 dB的两种噪声模式下进行自然声调语句和平声调语句识别测试，每例受试者聆听14个句表共140句语句测试材料，每个句表十个句子100个关键字，言语识别率的计算公式为：正确率=(正确字数/100)×100%。允许受试者进行联想，对内容进行适当猜测；测试开始前需要进行练习以熟悉测试流程，整个测试过程约30分钟。

1.4统计学方法采用SPSS21.0分析数据，数据呈偏态分布时，采用Mann-Whitney test比较不同噪声模式不同信噪比下言语识别率的差异，P<0.05为差异有统计学意义。

2 结果

20例听力正常青年受试者在安静环境下以及不同信噪比语谱噪声和双人语噪声下自然声调和平声调语句的言语识别率见表1。可见，在安静环境下和信噪比为+5、0 dB的语谱噪声模式下受试者聆听自然声调语句与平声调语句之间的言语识别率差异无统计学意义(P>0.05)；当信噪比为-5 dB时，受试者聆听自然声调语句的言语识别率显著高于聆听平声调语句的言语识别率(P<0.01)。

安静环境和信噪比为+5、0 dB的双人语噪声模式下，受试者聆听自然声调与平声调语句得分之间差异无统计学意义(P>0.05)；信噪比为-5 dB时，受试者聆听自然声调语句的言语识别率显著高于聆听平声调语句的言语识别率(P<0.01)。

表1 不同测试环境下自然声调和平声调言语识别率比较

注：*与相同噪声模式下平声调言语识别率比较，P<0.01；△与语谱噪声下相同信噪比平声调识别率比较，P<0.01

信噪比为+5、0 dB两种噪声模式下受试者聆听平声调语句的言语识别率差异均无统计学意义(P>0.05)；当信噪比为-5 dB时，受试者聆听双人语噪声下平声调语句的言语识别率显著高于语谱噪声下平声调语句的言语识别率(P<0.01)。

3 讨论

董瑞娟等[3]比较听力正常受试者和听力障碍患者的言语识别能力，结果显示当信噪比降到0 dB时，听力正常受试者的言语识别率仍接近100%，高于听力障碍患者3～4倍。本研究结果与此一致，无论在语谱噪声还是双人语噪声下，随着信噪比的降低，听力正常人聆听自然声调语句仍然拥有良好的言语识别能力，说明听力正常受试者听觉系统抗噪声干扰能力强。此外，本研究结果显示，在噪声环境下，信噪比越小，听力正常受试者聆听平声调语句的言语识别率比自然声调语句的言语识别率下降更明显，说明声调信息在噪声环境下对言语感知有贡献作用，与国外研究[1,4～6]一致。Wang等[5]研究显示听力正常人在babble噪声下聆听平声调语句的言语识别率明显低于自然声调语句的言语识别率，推测可能是由于信噪比较大时，受试者可以通过句子中除声调以外的冗余信息对句子内容进行辨别。Hickok等[7]的研究结果表明聆听者可应用一些神经或额外的认知资源(如语义、语境等)对句子中平声调成分进行处理并恢复成熟悉的内容进行识别。随着信噪比降低，句子中可利用的冗余信息越来越少，张家騄等[8]指出汉语声调具有较强的抗干扰能力，即在噪声环境下，声调信息的损失较小，聆听者能够通过对声调的感知有效识别句子内容，而当声调信息也去除后，受试者可以依赖的信息更少，因此噪声环境下聆听平声调语句的能力更差。

针对汉语声调信息对噪声下言语识别意义的研究显示，听力正常人在babble噪声下测得的自然声调和平声调语句言语识别率的差值要比在白噪声下测得两者差值小近两倍[1,6]，说明听力正常者在babble噪声下聆听平声调语句较白噪声下更容易。本研究结果与此相似，在双人语噪声下，当信噪比为-5 dB时，平声调语句言语识别率较自然声调语句下降8.56%；而在语谱噪声下，平声调语句言语识别率较自然声调语句下降更显著，达18.37%，这表明在语谱噪声下，声调信息对听力正常者噪声下言语识别能力的贡献更大。Füllgrabe等[9]指出听力正常者有较好地编码声信息中精细结构(fine structure)的能力，能够从波动性噪声(例如：多人语噪声)的瞬时时域信息变化中提取言语声信息帮助其进行噪声下的语句识别(listening in the dips)。因此推测，听力正常者可以捕捉到双人语噪声中瞬时时域信息的变化感知言语声，而在语谱噪声这种稳态噪声环境下，听力正常不能应用这种能力，因此缺少声调信息时语谱噪声环境中其言语感知能力更差。

研究显示，感音神经性听力损失患者使用精细结构信息的能力下降，且随着听力损失程度的加重而加重[10～12]，该类患者捕捉瞬时时域信息变化的能力可能退化。由此推测，对于感音神经性听力损失患者，声调信息在不同噪声条件下对言语识别能力的贡献模式可能有所不同，有待进一步探讨。此外，本研究显示声调信息对于噪声环境下言语识别能力有一定程度的贡献，且在不同噪声模式下贡献不同，这可能为提高噪声环境下人工助听技术更好地改善言语识别能力提供一定理论基础。