APP下载

基于发音动作的中英文辅音交叉语言对比研究

2017-09-18郑红娜

智能计算机与应用 2017年4期

郑红娜

摘要: 本文著眼于语音可视化,目的在于揭示中英文辅音的发音运动。然而,交叉语言比较的首要任务是消除特定说话人生理特性等音素引起的固有差别,本文采用了基于说话人归一化的普氏算法来进行说话人归一化处理,接着利用分层聚类分析算法和多维标度定位算法对相似发音对进行了量化的比较,从而获得了英汉相似音素发音的元音对比最小对和辅音对比最小对,并揭示了这2种语言的易混淆发音文本对在发音动作上的区别。

关键词: 发音动作; 电磁发音仪(EMA)AG500; 中英文交叉语言; 普氏变换; 对比最小对

中图分类号:TP391

文献标志码:A

文章编号:2095-2163(2017)04-0042-02

0引言

[JP+1]长期以来,人们大都关注语音的声学特性和社会属性,很少关注其生理属性。但是,心理研究结果表明:人类交流的3种主要模式(文本传递、语音传递和面部表情传递)中贡献比例分别为:7%文本+39%语音+54%面部动作[1]。因此,带有视觉信息的语音研究已成为当今学界热点关注的课题方向。近年来,随着发音动作观测技术的日趋成熟,越来越多的研究开始致力于语音生理属性的探索分析,语音可视化就是在这样的背景环境下获得提出并逐渐发展起来的一门技术。[JP]

研究可知,语音可视化就是通过直观地呈现可见发音器官(如牙齿、唇等)及不可见发音器官(如舌头、软腭等)的发音运动,达到增强语音可懂度和识别率的目的。该技术在噪声环境、听觉损伤或其他因素导致的声学信息得不到保证的情况下,可发挥显著的优势。

电磁发音仪(Electro Magnetic Articulography,EMA)是研究微小复杂动作的专用设备,该仪器可逼真模拟通常不易观察到的舌头、软腭等发音器官运动的发音动作[2]。

目前,越来越多的学者开始了发音训练的有关研究,并试图通过直观显示发音器官运动的方法来辅助发音训练[3-4]。

为了有效地帮助母语为汉语的学习者学习英语发音以及帮助母语为英语的学习者学习汉语普通话,有必要通过交叉语言对比的方法找出英语和汉语中易被第二语言学习者错发或漏发的发音文本对,进行有针对性的交叉对比研究。

1经验法获得中英文辅音三维发音动作文本

本文的语料包括2个主要部分,分别是:中文部分和英文部分。中英文语料的主要目标是建立音素级和音节级的中英文标准发音动作语料库,用以模拟真实说话人标准的发音动作。

首先,研究以《英语发音字典》[5]、《语音学》[6]、《标准汉语》[7]和《标准汉语语音学》[8]为准则选出2种语言中特有的辅音音素(汉语中不存在的英语音素以及英语中不存在的汉语音素,及其相近音素)。表1中即列出了这些音素,表1中的所有音素都用国际音标(International Phonetic Alphabet,IPA)的符号规范书写。

由表1中的音素对可知,经验的易混淆辅音音素包括6对。这些音素对在听觉上将很难辨别,然而,其舌头和唇部的发音动作却存在很大的差异,研究结果呈现可如图1所示。

图1则描绘了中英文元音的相似音素的静态帧和关键帧,图中所有音素的静态帧都选为同一帧,用虚线标示;英语音素的关键帧用实线标示;而普通话的关键帧用点划线标示。图中用T1、T2、T3分别标示了舌尖、舌体和舌后三个数据采集点,而用L1、L2和L4分别标示了左嘴角、上唇和下唇三个离散数据采集点。

分析图1可知,这些易混淆的音素具有相同的发音部位,但是关于发音方法和发音动作(包括唇形、舌位舌头与牙齿或上颚的接触程度等)却截然不同。这与日常的经验分析结果也是一致的。

因此,有必要进一步在发音动作的层面上区分这些易混淆的因素对,揭示这些易混淆音素对的内在联系和区别。

2多维标度定位算法

多维标度定位算法(MultiDimension Scaling, MDS)可以定量比较发音数据,并在一个说话人无关的发音空间中直观地显示各个音素,将英语和汉语中音素之间的差距在一个跨语言的语音空间上进行可视化。

音素之间的差距可以通过主观评价和客观评价来标定度量。在主观评价中,可以在归一化的发音动作空间中形象地观察相似音素对;在客观评价中,可以通过马氏距离(Mahalanobis Distance)来量化各通道的位移向量。

多维标度定位算法的原理是:首先,得到位移向量之间的马式距离矩阵,生成一个量化的元音空间作为感知差异矩阵(perceptual dissimilarity matrices);然后,借助这个矩阵在三维空间进行重构,重构时应保证尽可能各分量之间的距离接近原始的距离。

本实验中,MDS算法的输入是由12个辅音音素的位移向量(位移向量是关键帧与静态帧的差值)组成,将12个辅音分别进行分析。输出是在一个统一的说话人无关的发音空间上反映音素间距离的形象表示,具体如图2所示。

3结束语

由于英语和汉语两种语言中有些发音是极为相似的,这些相似的发音会经常被外语初学者漏读或者错读,为了更加有效地帮助以汉语为母语的学习者练习英语发音以及帮助以英语为母语的学习者练习普通话发音,本文针对2种语言的特点,进行了基于最小音素对的交叉语言对比。利用多维标度定位算法直观比较了双语中易被第二语言学习者错发或漏发的辅音发音文本对。

参考文献:

[1] MEHRABIAN A. Communication without words[J]. Psychology Today, 1968, 2(4): 53-56.

[2] [JP3]SUMBY W H,POLLACK I. Visual contribution to speech intelligibility in noise[J]. Acoustical Society of America, 1954, 26: 212.[JP]

[3] WANG Hongcui, KAWAHARA T. Effective error prediction using decision tree for ASR grammar network in call system[C]// ICASSP. Las Vegas, NV, USA:IEEE, 2008: 5069-5072.

[4] CHAPLLE C, JAMIESON J. Computerassisted language learning as a predictor of success in acquiring English as a second language[J]. TESOL Quarterly, 1986, 20(1): 27-46.

[5] JONES D, ROACH P, HARTMAN J. English pronouncing dictionary[M]. 17th ed. New York:Cambridge University Press, 2006.

[6] BALL M J, RAHILLY J, PICKETT J M. PHONETICS—The science of speech[J]. The Journal of the Acoustical Society of America, 2000, 108(6): 2695.

[7] LEE W S, ZEE E. Standard Chinese(Beijing)[J]. Journal of the International Phonetic Association, 2003, 33(1): 109-112.

[8] DUANMU S. The phonology of standard Chinese[M]. 2nd ed. USA:Oxford University Press, 2007.endprint