汉语朗读中词素位置概率线索作用的发展研究 *

2021-05-30连坤予张书帏白学军

心理与行为研究 2021年2期

连坤予马杰魏玲张书帏白学军,4

(1 福建医科大学健康学院，福州 350122) (2 教育部人文社会科学重点研究基地天津师范大学心理与行为研究院，天津 300387) (3 天津师范大学心理学部，天津 300387) (4 学生心理发展与学习天津市高校社会科学实验室，天津 300387)

1 引言

词是阅读中的基本加工单位（Li, Rayner, &Cave, 2009），在近年的阅读心理学领域中词切分机制成为一个重要的课题。在表音文字（例如英语）中，词与词之间的空格在词汇识别（lexical identification）和眼跳定位（saccadic targeting）过程中作为一种有意义的词切分线索具有重要的作用。如果要求英语母语读者阅读没有词间空格的文本，被试的阅读速度相比于阅读正常文本的读者将至少下降30%左右（Rayner, Fischer, & Pollatsek,1998），在词上的首次落点位置也将从大约单词开头1/4 处的位置，也就是偏向注视位置转移至词首（Rayner, 1998）。

前人研究表明，词素位置概率可能是汉语默读中的一种有效的词切分线索（Liang et al., 2017）。词素位置概率是指一部分汉字出现在多字词的固定位置（如词首、词中或词尾），或是偏向于出现在词的某个固定位置的现象（Liang et al., 2017）。比如，在双字词中，“各”可以组成29 个不同的双字词，如“各种”“各自”“各地”等。在这29 个双字词中，“各”都出现在词首，因此“各”字的词素位置信息是词首。据统计，在5915 个常用汉字中，约20%的汉字在多字词中只出现在固定的位置或仅作为单字词出现（白学军, 闫国利,2017）。因此，当这些汉字在文本中出现时就会给被试提供清晰的词边界信息。Liang 等人（2017）的研究结果发现，在新词学习过程中，汉语母语被试能够利用词素位置概率进行词切分，且大学生利用这种语言线索的能力高于小学生。这说明汉语读者的语言能力会影响该语言线索的运用程度。

与默读相比，被试在朗读中需要从有限的认知资源中分出一部分用于处理目标材料的发音、声调和重音信息（Hale et al., 2007）。因此，被试在汉语朗读的词切分过程中会不会更加依赖于词素位置概率这种词切分线索，还有待进一步研究。

虽然传统的阅读研究承认朗读比默读增加了额外的语音处理过程，但这些研究通常将阅读和默读简单地放在同一水平上（Ashby, Yang, Evans, &Rayner, 2012）。最近的研究发现，在朗读和默读条件下，被试的眼动模式可能有所不同。在汉语研究中，臧传丽、张慢慢、岳音其、白学军和闫国利（2013）的研究结果发现：汉语母语读者在朗读时表现出更多的注视次数和更长的注视时间。另外，增加副中央凹信息可以同时提高朗读和默读条件下汉语母语读者的阅读速度，但是这种效应在默读中比朗读中更加显著。张慢慢、张心如、符颖、杜红和臧传丽（2017）在臧传丽等人的研究基础上进一步研究了朗读和默读条件下副中央凹视野词频和视觉复杂性对被试阅读的影响。结果发现：在朗读条件下，被试对低频词高视觉复杂性条件下的词汇的注视时间最长。这表明，在朗读条件下，汉语母语读者需要花费更多资源来进行词汇识别和加工。

综上所述，词素位置概率在汉语阅读中是一种有效的词切分线索，且汉语读者对这种线索的运用具有发展上的差异。读者的眼动模式，以及副中央凹的加工能力在朗读中与默读条件下有所不同（臧传丽等, 2013; 张慢慢等, 2017）。在朗读条件下，词素位置概率对不同阅读水平（大学生、小学生）的读者的词切分是否有影响，国内目前还没有相关研究。朗读是学龄期儿童重要的语言学习方式。美国的国家早期语言发展委员会（National Early Literacy Panel）在2009 年的报告中指出，在基础教育时期，加强教师对学生的朗读行为的培养，可以有效预防学生出现和阅读有关的学习障碍（Swanson et al., 2011）。因此，有必要探究朗读条件下儿童与成人是如何利用词素位置概率这一词切分线索，以期进一步拓展和完善词素位置概率对学龄儿童的研究。本研究将通过两个实验，探究词素位置概率作为默读中的一种有效的词切分线索，在朗读条件下是否依然有效，且这种效应是否具有发展上的差异。

2 实验1：首字词素位置概率对大学生和小学生句子朗读的影响

2.1 实验目的

本实验通过操纵首字词素位置概率的高低，考察汉语读者在朗读过程中是否会利用该线索进行词切分。此外，通过比较大学生和小学生对该线索利用程度的高低，考察朗读过程中词素位置概率线索的作用是否具有发展上的差异。

2.2 研究方法

2.2.1 被试

选取某大学的76 名大学生，平均年龄19.00±0.75 岁，其中男性18 名，女性58 名。选取某小学的76 名三年级小学生，平均年龄10.32±0.47 岁，其中男生44 名，女生32 名。被试均为汉语母语者，视力或矫正视力正常。

2.2.2 实验设计

采用2（组别：大学生、小学生）×2（首字词素位置概率：高、低）的混合设计。其中组别为被试间变量，首字词素位置概率为被试内变量。

2.2.3 实验材料

参照“人民日报字词频表”，选择由88 个汉字组成的44 个双字词。控制双字词中的首字词素位置概率，将首字词素位置概率高于0.70 定义为高概率，首字词素位置概率低于0.30 定义为低概率。控制尾字的词素位置概率在0.40～0.60 范围内。首字词素位置概率计算方法如下：将汉字出现在词首时双字词的数量除以汉字所能组成的所有双字词（无论出现在首字还是尾字）的数量。控制双字词的首尾字笔画数，高低首字词素位置概率的首字字频和首字笔画数，双字词的词频和笔画数，并进行配对样本t 检验。结果发现：首字平均笔画数8.42（SD=2.53），尾字平均笔画数7.84（SD=2.63），首尾字笔画数差异不显著，t=1.70，p＞0.05；高首字词素位置概率的首字平均字频595.24 次/百万（SD=3048.56 次/百万），低首字词素位置概率的首字平均字频289.91 次/百万（SD=960.15 次/百万），高低首字词素位置概率的首字平均字频差异不显著，t＜1，p＞0.05。高首字词素位置概率的首字笔画数8.22（SD=2.74），低首字词素位置概率的首字笔画数8.46（SD=2.46），高低首字词素位置概率的首字笔画数不显著，t＜1，p＞0.05。高首字词素位置概率的双字词平均笔画数16.05（SD=4.05），低首字词素位置概率的双字词平均笔画数16.48（SD=4.07），高低首字词素位置概率的双字词笔画数差异不显著，t＜1，p＞0.05。高首字词素位置概率的双字词平均词频24.51 次/百万（SD=45.07 次/百万），低首字词素位置概率的双字词平均词频56.18 次/百万（SD=232.88 次/百万），高低首字词素位置概率的双字词词频差异不显著，t＜1，p＞0.05。

将目标词放在句子中间，句长在12～17 个汉字之间。选取15 名不参加正式实验的三年级小学生对句子难度进行5 级评定，从1“非常不容易”到5“非常容易”；其平均难度为4.50（SD=0.26），表明句子能够被小学生和大学生理解。选取35 名不参加正式实验的大学生对句子通顺性进行5 级评定，从1“非常不通顺”到5“非常通顺”；平均通顺性为4.41（SD=0.34），表明句子非常通顺。另外选取35 名不参加正式实验的大学生对句子预测性进行评定。预测性是指将句子材料中目标词及之后的内容全部删除，然后让被试依据剩下的部分进行自由联想并将句子补充完整。如果被试将句子剩下部分的前两个字补充为目标词则判定为预测成功（计为1），否则判定为预测不成功（计为0）。删除预测性为0.5 以上的句子之后，句子的平均预测性为0.007（SD=0.41），表明目标词的可预测性非常低。最后确定实验句44 组。根据拉丁方设计将44 组实验句分成两个组块，每名被试只做一个组块。实验材料举例见表1。

表 1 高低首字词素位置概率目标词举例及例句

2.2.4 实验仪器

采用由加拿大SR Research 公司开发的Eyelink 1000 plus 眼动仪记录被试眼动轨迹，采样率为1000 Hz。显示屏为19 英寸的戴尔显示器，分辨率为1024×768 像素，刷新率为75 Hz。被试眼睛与屏幕之间的距离为65 cm。汉字以26 号宋体呈现，每个汉字水平视角为1.16°。

2.2.5 眼动指标

参照以往研究（Liang et al., 2017），本实验共选取3 个眼动指标：（1）凝视时间（gaze duration）指第一遍阅读中从首个注视点开始到注视点首次离开当前兴趣区之间的持续时间，反映词汇通达的早期加工；（2）再注视时间（refixation duration）指首次阅读中兴趣区内去除首个注视点后，剩下注视点的注视时间的总和，反映词汇通达早期加工的难度；（3）总注视时间（total fixation duration）指落在兴趣区内的所有注视点的注视时间的总和，反映总体词汇通达的特点。

2.2.6 实验程序

每名被试单独施测。首先进行眼校准（水平三点模式），平均误差小于0.30°。随后进入正式实验，要求被试大声朗读实验语句，按回车键完成一个句子的阅读，并通过“F”和“J”按键在屏幕上选择阅读理解题目的正确答案。每名被试共朗读6 个练习句和44 个实验句，句子的呈现顺序是完全随机的。整个实验过程大约需要30 分钟。

2.3 结果

所有被试的阅读理解正确率均在80% 以上（大学生：M=95%，SD=6%；小学生：M=84%，SD=12%），表明被试都认真阅读并都理解了句子。大学生的阅读理解正确率显著高于小学生，t=−4.64，p＜0.001。表明大学生的阅读理解能力高于小学生。

Rayner（1998）和Rayner（2009）的研究表明，注视时间太短或太长都无法准确反映阅读的加工信息，因此，删除持续时间短于80 ms 或长于1200 ms 的注视点。然后按照以下标准删除不符合要求的数据：（1）删除眼动追踪丢失的数据（0.05%）；（2）删除单个句子上的注视点总数少于5 个的试次（0.88%）；（3）删除3 个标准差以外的数据（0.40%）。删除的数据共占总数据的1.33%。

所有数据采用基于R 环境（R Core Team, 2014）下的线性混合模型（liner mixed model, LMM）和lme4 数据处理包进行统计（Bates, Mäechler, &Bolker, 2012）。使用马尔可夫链蒙特卡罗算法（Markov-Chain Monte Carlo）得出事后分布模型参数作为显著性的估计值（Baayen, Davidson, &Bates, 2008）。将以目标词为兴趣区进行数据统计。将组别、首字词素位置概率以及它们之间的交互作用作为固定因素纳入模型进行分析。

大学生和小学生在不同首字词素位置概率下的眼动特征见表2。使用LMM 对数据分析的结果见表3。

表 2 大学生和小学生在高低首字词素位置概率条件下的注视时间

表 3 年龄和首字词素位置概率在眼跳目标分析指标上的固定效应估计值

实验1 通过操纵首字词素位置概率的高低，考察了小学生和大学生在句子朗读中对该线索的利用程度。结果发现：首先，在反映相对早期的词汇加工指标，如凝视时间和再注视时间上，年龄与首字词素位置概率交互作用显著。进一步分析发现，小学生在低概率条件下的凝视时间和再注视时间显著长于高概率条件，表现出明显的首字词素位置概率效应，然而大学生并未表现出该效应。其次，在反映词汇加工的晚期眼动指标上，如总注视时间上，年龄与首字词素位置概率交互作用边缘显著。进一步分析发现，在总注视时间上，小学生和大学生均表现出一致的首字词素位置概率效应，且小学生表现出更大的首字词素位置概率效应。

3 实验2：尾字词素位置概率对大学生和小学生句子朗读的影响

3.1 实验目的

本实验通过操纵尾字词素位置概率，考察汉语读者在朗读过程中是否会利用该线索进行词切分。此外，通过比较大学生和小学生对该线索利用程度的高低，考察朗读过程中词素位置概率线索的词切分作用是否具有发展上的变化。

3.2 研究方法

3.2.1 被试

同实验1。

3.2.2 实验设计

采用2（组别：大学生、小学生）×2（尾字词素位置概率：高、低）的混合设计。其中组别为被试间变量，尾字词素位置概率为被试内变量。

基于熵权法的我国公共图书馆发展水平评价及其趋势研究 ………………………………………………………… 邵艳红（2/37）

3.2.3 实验材料

参照“人民日报字词频表”，选择由88 个汉字组成的44 个双字词。控制双字词中的尾字词素位置概率，将尾字词素位置概率高于0.70 定义为高概率，尾字词素位置概率低于0.30 定义为低概率。控制首字的词素位置概率在0.40～0.60 范围内。词素位置计算方法同实验1。控制双字词的首尾字笔画数，以及高低尾字词素位置概率的尾字字频和尾字笔画数，双字词的词频和笔画数，并进行配对样本t检验。结果发现：首字平均笔画数7.60（SD=2.34），尾字平均笔画数8.17（SD=2.10），首尾字笔画数差异不显著，t＜1，p＞0.05；高尾字词素位置概率的尾字平均字频494.66 次/百万（SD=1399.86 次/百万），低尾字词素位置概率的尾字平均字频188.27 次/百万（SD=495.28 次/百万），高低尾字词素位置概率的尾字平均字频差异不显著，t=1.38，p＞0.05。高尾字词素位置概率的尾字笔画数8.42（SD=2.17），低尾字词素位置概率的尾字笔画数8.49（SD=2.41），高低尾字词素位置概率的尾字笔画数不显著，t＜1，p＞0.05。高尾字词素位置概率的双字词平均笔画数16.16（SD=2.94），低尾字词素位置概率的双字词平均笔画数15.89（SD=3.08），高低尾字词素位置概率的双字词笔画数差异不显著，t＜1，p＞0.05；高尾字词素位置概率的双字词平均词频10.32 次/百万（SD=13.65次/百万），低尾字词素位置概率的双字词平均词频7.33 次/百万（SD=15.59 次/百万），高低尾字词素位置概率的双字词词频差异不显著，t＜1，p＞0.05。

将目标词放在句子中间，句长在12～17 个汉字之间。编成句子后，选取15 名不参加正式实验的小学生对句子难度进行5 级评定；平均难度为4.59（SD=0.23）。选取35 名不参加正式实验的大学生对句子通顺性进行5 级评定；平均通顺性为4.39（SD=0.34）。另外选取35 名不参加正式实验的大学生对句子预测性进行评定；删除预测性为0.5 以上的句子之后，句子的平均预测性为0.019（SD=0.58）。最后确定实验句44 组。根据拉丁方设计将44 组实验句分成两个组块，每个被试只做一个组块。实验材料举例见表4。

表 4 高低尾字词素位置概率目标词举例及例句

3.2.4 实验仪器

同实验1。

3.2.5 眼动指标

眼动指标选取同实验1。

实验程序同实验1

3.3 结果

所有被试的阅读理解正确率均在80% 以上（大学生：M=94%，SD=5%；小学生：M=83%，SD=16%），表明被试都认真阅读并理解了句子。大学生的阅读理解正确率显著高于小学生，t=−5.25，p＜0.001，表明大学生的阅读理解能力高于小学生。

删除标准同实验1：（1）删除眼动追踪丢失的数据（0.02%）；（2）删除单个句子上的注视点总数少于5 个的试次（0.88%）；（3）删除3 个标准差以外的数据（0.38%）。删除的数据共占总数据的1.28%。

数据处理方法同实验1。大学生和小学生在不同尾字词素位置概率下的眼动特征见表5。使用LMM 对数据进行分析，得到的结果见表6。

表 5 大学生和小学生在高低尾字词素位置概率条件下的注视时间

实验2 通过操纵双字词尾字的词素位置概率高低，考察了小学生和大学生在句子朗读中对该线索的利用程度。结果发现：首先，在凝视时间上，年龄和尾字词素位置概率交互作用边缘显著。进一步分析发现，小学生在低概率条件下的凝视时间显著长于高概率条件，表现出明显的尾字词素位置概率效应，然而大学生并未表现出该效应。其次，在再注视时间和总注视时间上，年龄与尾字词素位置概率交互作用不显著，小学生和大学生均表现出一致的尾字词素位置概率效应。

4 讨论

本研究探讨了在朗读条件下，以汉语为母语的读者如何使用词素位置概率线索来分割词，以及这种效应是否存在发展上的差异。在汉语阅读的词切分中，由于前一个词n–1 的右边界是词n 的左边界，所以在完成前一个词n–1 的处理时实际上同时完成了当前词n 的左边界的分割（Li et al.,2009）。因为单词n 的左边界在被被试注视之前已经被切分出来，所以当单词n 在中央凹中进行处理时，读者其实没有必要利用首字的词素位置概率进行词切分（高淇, 2018）。但是在朗读条件下，成人被试和儿童被试都可以运用首字词素位置概率线索进行词切分，并且首字词素位置概率对儿童的影响更大。这有可能与两种阅读方法的不同处理流程有关：首先，因为朗读对儿童被试的阅读比成人被试有更大的促进作用，在朗读条件下，儿童被试对目标词的信息提取更为流畅，因此，首字词素位置概率效应对儿童的影响水平也相应提高。但在朗读的条件下，成人被试阅读会受到一定程度的阻碍（Miller & Smith, 1989）。因此，相比儿童，成人被试受首字词素位置概率效应的影响较小。其次，由于朗读要求读者除了提取诸如单词的形状和含义之类的信息外，还必须提取目标单词的语音信息，增加了句子阅读中儿童被试的认知负荷，使儿童被试更多地依赖词素位置概率线索来进行词切分。

根据汉语阅读的词切分模式和词识别模式（Li et al., 2009），词素位置概率可能通过以下方式影响词切分过程和词识别过程。在汉语阅读中，从注视点左侧的一个汉字到右侧的三个汉字为汉语母语被试的阅读知觉广度（Yan, Zhou, Shu, &Kliegl, 2015）。知觉广度内的所有汉字将被激活，同时每个汉字所携带的位置概率信息也将被激活。如果当前汉字的实际位置信息与固有位置信息相匹配，则激活水平会比较高，很容易达到阈值，从而优先被识别和分割出来；如果当前汉字的实际位置信息与固有位置信息产生矛盾，而且解决矛盾需要花费额外的认知资源，则识别时间将延长。可以看出，词素位置概率作用于词汇识别的汉字组词这一环节。

Liang 等人（2017）的研究结果发现，在默读条件下，尽管儿童也可以运用词素位置概率信息，但是与成人相比，其运用程度要低得多，表明儿童对词素位置概率线索的利用程度低于成人。然而，本研究的结果发现，在朗读过程中，尾字词素位置概率信息对儿童和成人的阅读几乎同样重要。与成人相比，儿童对首字词素位置概率的依赖性更大。这可能是因为，与成人被试相比，在大声朗读的过程中，一方面，儿童需要在发音过程中花费更多的认知资源；另一方面，儿童处理副中央凹的能力低于成人被试，因此他们需要在更大程度上激活首字词素位置概率这一线索来帮助他们完成当前单词n 的左边界的分割，然后完成单词识别过程（Tiffin-Richards & Schroeder, 2015）。

此外，本研究的结果还发现，尾字词素位置概率的高低在朗读下会影响汉语被试的词汇识别，且儿童被试和成人被试利用此线索的程度没有显著差异。因此，在本研究条件下，尾字词素位置概率在儿童被试和成人被试朗读中起着几乎同等重要的作用。结合默读条件下的研究结果，即成人被试比儿童被试在更大程度上利用了尾字词素位置概率线索（Liang et al., 2017）。这可能表明在汉语阅读中，不同阅读方式会影响尾字词素位置概率的发展。本研究目前无法解释为什么儿童被试和成人被试在朗读和默读中对尾字词素位置概率线索利用具有不同的趋势。日后的研究需要在实验中同时操纵不同的阅读方式（朗读和默读）以及首尾字词素位置概率的高低，进一步探讨这个问题。

鉴于朗读与默读在认知处理上存在许多差异，今后的研究有必要验证汉语阅读中的词切分机制是否会受到诸如阅读方式等因素的影响。本研究证明，在朗读的条件下，汉语母语读者也可以使用词素位置概率线索进行词切分，但是儿童对此类线索的依赖与默读条件下有所不同。作为非熟练读者，儿童比成人对这种线索的依赖明显更多。在某种程度上，本研究结果打破了朗读和默读在传统阅读研究中处于同一位置的观点（Ashby et al., 2012）。朗读是学龄儿童学习语言的重要手段。本研究结果为在基础教育阶段如何利用词素位置概率促进儿童阅读能力的发展提供了新的视角和启示。依据本研究结果，建议根据小学语文课本和教具中词素位置概率高低，增加一些适合学生阅读能力的材料，以便学生大声朗读，从而帮助学生更好地提高阅读能力。