APP下载

汉语阅读中高限制性语境对不可预测词加工的影响:眼动研究*

2022-01-22赵赛男张俐娟王敬欣

心理与行为研究 2021年6期
关键词:预测性限制性语义

赵赛男 李 琳,3 张俐娟 王敬欣,3

(1 教育部 人文社会科学重点 研究基地天津师范 大学心理与行为研 究院,天津 300387) (2 天津 师范大学心理学部,天津 300387) (3 学生心 理发展与学习天津 市高校社会科学实 验室,天津 300387)

1 引言

阅读中词汇的加工和整合会受到语境预测性的影响,表现出语境预测性效应。语境预测性是指根据给定的语境,接下来即将出现的词能被读者预测出来的概率(Rayner & Well,1996)。语境预测性效应即相较于不可预测词,可预测词的加工更快速容易(刘志方,仝文,张智君,赵亚军,2020;DeLong,Urbach,& Kutas,2005;Rayner,Li,Juhasz,& Yan,2005;Rayner & Well,1996)。语境预测性取决于语境限制性。语境限制性是指语境对接下来可能出现的所有内容范围的限制程度。高限制性语境将可能会出现的内容种类限定在很小范围内,读者能对可能出现的某一种内容进行较高预测(Frisson,Harvey,& Staub,2017)。低限制性语境中,接下来可能出现的内容种类广泛,读者难以对某一内容进行较高预测(Frisson et al.,2017)。在高限制性语境中,接下来出现的词可能是与较高预测一致的可预测词,也可能是不一致的不可预测词。在低限制性语境中,很难对某一内容进行较高预测,接下来出现的均是不可预测词。

语境预测性效应可能源于高限制性语境对可预测词的促进(收益),也可能源于对不可预测词的干扰(成本)。大多数研究通过比较高限制性语境下可预测词和不可预测词的加工差异测量语境预测性效应(刘志方等,2020;Rayner & Well,1996;Zhao,Li,Chang,Wang,& Paterson,2021)。但只采用高限制性语境缺乏基线(低限制性语境),难以明确效应来源。也有少数研究通过比较高限制性语境下可预测词和低限制性语境下同一词的加工差异来测量语境预测性效应(卢张龙,白学军,闫国利,2008),此方法由于缺乏高限性语境下的不可预测词,也无法判断语境预测性效应中是否存在成本。要想探究语境预测性效应,需要对预测误差成本进行测量。预测误差成本(prediction error cost)即相较于低限制性语境,高限制性语境对不可预测词的加工造成的干扰(Frisson et al.,2017)。目前尚不清楚汉语阅读中预测误差成本的表现。

预测误差成本是否存在关系到对预测加工机制的理解。有关阅读中的预测加工模式存在两种假说。词汇预测观(lexical prediction)认为,读者根据语境按照“全或无”的方式首先只激活接下来可能出现的某一个特定单词(DeLong,Troyer,& Kutas,2014)。当接下来出现的内容违背预测时,高限制性语境会对这些不可预测词的加工造成干扰,产生预测误差成本。等级预激活观(grade preactivation)认为读者按照完形填空概率对接下来的内容同时进行了不同等级的广泛预激活,而非对某个特定单词的离散激活(Staub,2015)。根据这一假说,高限制性语境不会对不可预测词的加工产生干扰。

针对预测误差成本这一问题,在拼音文字(如英语)中,大多数采用快速系列视觉呈现范式(RSVP)的研究发现,与低限制性语境相比,高限制性语境中的不可预测词诱发了更大的晚期额部正波(LPC)(刺激呈现后500~900 ms),存在预测误差成本(Federmeier,Wlotko,De Ochoa-Dewald,& Kutas,2007)。但在少数自然阅读中没有发现预测误差成本(Frisson et al.,2017;Luke & Christianson,2016)。不同范式下的结果差异可能是材料呈现方式的差异造成的。预期双加工理论认为,语境对词汇加工既有促进,也有抑制。早期无意识的自动激活扩散加工迅速引发了语境促进作用,不会产生抑制。抑制作用只发生在后期意识-注意加工阶段(Posner & Snyder,1975;Stanovich & West,1979)。在RSVP 范式中,刺激以固定速度呈现,通常每个单词呈现500~1000 ms,是自然阅读中平均注视时间(250 ms)的倍数。长时间的视觉呈现可能在后期诱发出了预测误差成本。但在词汇正常呈现的自然阅读中未产生预测误差成本。

与拼音文字相比,汉语没有空格,无法利用视觉信息获取词的边界,但在阅读相同内容时速度却相似(Liversedge et al.,2016),这表明读者可能利用了额外的语境资源提升了词切分加工效率,促进了词汇加工(Li & Pollatsek,2020)。另外,Rayner 等人(2005)发现,虽然拼音文字和汉语中的语境预测性效应有很大相似性,但也存在一些差异。在拼音文字中,中、低等预测性词在跳读上没有差异,但在汉语中两者却有差异。这表明汉语阅读中的语境预测性效应更明显。最后,汉语阅读中发现了较早的语义预视加工优势(王穗苹,佟秀红,杨锦绵,冷英,2009)。汉语与拼音文字的认知加工既有相似性,也有独特性,但尚不清楚汉语的独特性是否会对预测加工产生影响。

综上,本研究利用眼动技术考察汉语阅读中的预测误差成本,探究汉语阅读中的预测加工方式。研究假设:若读者采用特定词汇预测方式,高限制性语境会对不可预测词的加工造成干扰,存在预测误差成本;若读者采用等级预激活方式,高限制性语境不会对不可预测词的加工造成干扰,不存在预测误差成本。

2 实验1:高限制性语境对不可预测词加工的影响

2.1 研究方法

2.1.1 被试

从天津市某大学招募了42 名被试,年龄18~24 岁(M=20.10 岁,SD=1.46 岁)。被试均以汉语为母语,视力或矫正视力正常,结束后获得一定的报酬。

2.1.2 实验设计

实验1 为单因素三水平(高限制性语境可预测词、高限制性语境不可预测词、低限制性语境不可预测词)被试内设计。材料如表1 所示。

表1 实验1 材料举例

2.1.3 实验材料

实验1 共135 组实验句,每组包含三个句子,代表三种水平。可预测词和不可预测词在词频和笔画数上没有差异(词频:t=0.42,p=0.68;笔画数:t=0.09,p=0.93)。词频统计基于SUBTLEXCH(Cai & Brysbaert,2010),单位为次/百万。12 名大学生对材料进行了完形填空。研究将填写目标词人数占总人数的比率作为目标词的预测性指标。可预测词的完型概率高于67%,不可预测词的概率低于17%。高限制性语境中可预测词和不可预测词的预测性差异显著(t=81.88,p<0.001),但高限制性语境不可预测词和低限制性语境不可预测词的预测性没有差异(t=0.63,p=0.53)。每个句子中的最高完型概率值为语境限制性指标。最高概率值越低,语境限制性越低。高、低限制性语境间的语境限制性差异显著(t=60.60,p<0.001)。24 名大学生对材料合理性进行了7 点量表评定。不同条件下的合理性存在差异,F(2,402)=35.13,p<0.001。事后比较发现,高限制性语境可预测词的合理性与其他两种条件均存在差异(0.19<MD<0.23,ps<0.001),高限制性语境不可预测词与低限制性语境不可预测词间没有差异(MD=0.04,p=0.15)。材料参数见表2。最后,将所有实验句按拉丁方顺序分成3 组,每组135 句,每个水平下45 句。

表2 实验1 材料属性参数描述

2.1.4 实验仪器与程序

采用加拿大SR Research 公司生产的EyeLink 1000 Plus 型号眼动仪,采样频率为1000Hz。刺激呈现在刷新频率为144Hz、分辨率为1920×1080 像素的ASUS 液晶显示屏上。材料为28 号宋体字,被试眼睛距离屏幕60cm,每个汉字视角约为0.9°。

实验时,首先调整和固定被试位置。然后,呈现指导语,进行校准。校准成功后进入练习,被试对呈现的句子进行自然阅读,并对随后随机出现的问题进行“是”“否”判断,以确保被试认真阅读。被试练习并理解后进入正式实验,正式实验中每三个试次进行一次重新校准,25%的句子后有问题。整个实验大约需要30 分钟。

2.2 结果

被试作答正确率80%以上,对句子进行了认真地阅读。数据分析前按照以下标准对数据进行了删除:(1)追踪丢失试次(0.05%);(2)注视时间短于80ms 或长于800ms 注视(8.0%);(3)句子总注视点个数低于5 的试次(1.28%)。

利用R 软件下的Lme4 包(1.1-25)(Bates,Mächler,Bolker,& Walker,2015)进行了线性混合模型分析。分析指标有跳读(SKIP:第一遍阅读中目标词被跳过的概率)、首次注视时间(FFD:第一遍阅读中在目标词上首个注视点的持续时间)、凝视时间(GD:第一遍阅读中从开始注视目标词到首次离开目标词期间所有注视点的持续时间总和)和总注视时间(TRT:目标词上所有注视点持续时间的总和)(闫国利等,2013)。t/z值大于1.96 时,差异显著(p<0.05)。有关目标词的描述性统计见表3,统计分析结果见表4。

表3 实验1 眼动指标平均值和标准误

表4 实验1 统计分析结果

由表3、表4 结果可知,注视时间上语境预测性效应显著(|t|s>2.88,ps<0.004),跳读上边缘显著(z=1.83,p=0.06)。在高限制性语境中,可预测词的注视时间短于且跳读高于不可预测词。更重要的是,不可预测词在高限制性语境中的注视时间显著短于(|t|s>2.18,ps<0.05)且跳读高于(z=1.83,p=0.06)低限制性语境,未表现出任何预测误差成本。

由于高限制性语境可预测词条件下的合理性与其他条件存在差异,研究将合理性看做协变量纳入模型进行了分析,进一步明确合理性对实验效应的影响。结果发现:跳读上,合理性未对模型造成影响(χ2=0.27,p=0.60);首次注视时间上,合理性对模型产生了影响(χ2=9.24,p=0.001)。语境预测性效应不再显著(t=0.22,p=0.83),不可预测性词在高、低限制性语境中差异仍显著(t=2.35,p=0.02);凝视时间和总注视时间上,合理性对模型产生了影响(GD:χ2=7.26,p=0.007;TRT:χ2=10.15,p=0.001),合理性效应显著(GD:t=2.70,p=0.007;TRT:t=3.19,p=0.001),语境预测性效应显著(GD:t=2.83,p=0.005;TRT:t=2.40,p=0.02),不可预测词在高、低高限制性语境下差异显著(GD:t=3.22,p=0.001;TRT:t=2.54,p=0.01)。

综上所述,合理性主要使首次注视时间上的语境预测性效应不再显著。凝视时间、总注视时间上语境预测性效应仍显著。最重要的是合理性未对不可预测词在高、低语境限制性下的差异表现造成了影响。

实验1 可预测词与不可预测词间的语义相关性可能会促进不可预测词的加工。因此,难以明确高限制性语境对不可预测词的促进作用是由于语境对系列相关词汇的等级平行预激活造成的,还是不可预测词与特定可预测词之间的高语义相关造成的。为了排除可预测词与不可预测词间语义相关性对不可预测词的促进作用给预测误差成本表现带来的影响,实验2 操纵可预测词与不可预测词的语义相关性,进一步考察了高限制性语境对语义无关不可预测词加工的影响。

3 实验2:高限制性语境对语义无关不可预测词加工的影响

高限制性语境最主要的特征是限制了接来下词汇的种类,很难在高限制性语境下实现对合理语义无关不可预测词这一实验水平的操纵。鉴于高限制性语境特点和操纵合理语义无关不可预测词的冲突,实验2 采用语义违背范式(semantic violation paradigm)(王穗苹等,2009)控制可预测词和不可预测词间的语义相关性。不合理的语义违背词既保证了接下来的词是不可预测词,又控制了不可预测词与可预测词语义不相关。在实验2中,语义一致词为符合高限制性语境预测的可预测词汇,语义违背词为不合理的不可预测词。

实验2 假设,若高限制性语境对语义无关不可预测词造成了干扰,即存在预测误差成本。那么,语义违背词条件下,目标词在高限制性语境中的加工慢于在低限制性语境中。若高限制性语境不会对语义无关不可预测词产生干扰,即不存在预测误差成本。那么,语义违背词在高、低限制性语境中的加工没有差异。

3.1 研究方法

3.1.1 被试

从天津市某大学招募了80 名被试,年龄17~25 岁(M=19.8 岁,SD=1.42 岁),两名被试作答准确率低于80%,最终78 名被试的数据参与分析。所有被试均以汉语为母语,视力或矫正视力正常。整个实验约20 分钟,完成后可获得一定报酬。

3.1.2 实验设计

实验为单因素四水平(高限制性语境语义一致词、高限制性语境语义违背词、低限制性语境语义一致词、低限制性语境语义违背词)被试内设计。材料举例见表5。

表5 实验2 材料举例

3.1.3 实验材料

实验2 共80 组实验句,每个句子平均22 个汉字(字数范围为18~32 字)。语义一致词和语义违背词的词频和笔画数没有差异(词频:t=1.49,p=0.14;笔画数:t=1.18,p=0.24)。词频库同实验1。12 名大学生进行了完形填空测验。高、低限制性语境间语境限制性差异显著(高限制性语境:M=0.89;SD=0.10;低限制性语境:M=0.23;SD=0.10;t=42.47,p<0.001),高限制性语境语义一致词和低限制性语境语义一致词的预测性差异显著(t=76.84,p<0.001)。24 名大学生对句子合理性进行了7 点评定,语义一致词分数高于5.5 分,语义违背词分数低于3.5 分,两者间合理性差异显著(t=83.10,p<0.001)。最后,将所有材料按拉丁方顺序分成4 组,每组共80 句,每个实验水平下20 句。材料情况见表6。

表6 实验2 材料属性参数描述

3.1.4 实验仪器与程序

仪器和程序同实验1。

3.2 结果

数据分析方法和因变量眼动指标同实验1。被试作答正确率均值80% 以上,说明被试对句子进行了认真地阅读。按照以下标准对数据进行了删除:(1)追踪丢失试次(0.0 2%);(2)注视时间短于80 ms 或长于800 ms 注视(8.00%);(3)句子总注视点个数低于5 的试次(0.02%)。

与目标词相关因变量指标的描述性统计见表7,统计分析结果见表8。

表7 实验2 眼动指标平均值和标准误

表8 实验2 统计分析结果

语境预测性效应显著(FFD:t=4.08,p<0.001;GD:t=3.35,p<0.001;TRT:t=3.64,p<0.001;SKIP:z=3.88,p<0.001),高限制性语境下语义一致词的注视时间短于且跳读多于低限制性语境条件。预测误差成本效应不显著(FFD:t=0.61,p=0.54;GD:t=0.77,p=0.44;TRT:t=0.74,p=0.46;SKIP:z=1.32,p=0.19)。整体结果表现为,相较于在低限制性语境中,语义一致词在高限制性语境中的注视时间更短、跳读更多。但对语义违背词来说,在高、低限制性语境中没有差异。

4 讨论

本研究通过考察高限制性语境对接下来不可预测词加工的影响,首次探究了汉语阅读中的预测加工方式。结果发现,不管是在实验1 中同一高限制性语境下不同预测性目标词的加工,还是在实验2 中高、低限制性语境下不同预测性目标词的加工上,均表现出语境预测性效应。相较于不可预测词,高限制性语境中可预测词的注视时间更短、跳读更多(刘志方等,2020;Zhao et al.,2021)。结果表明,在正常熟练的阅读过程中,读者会根据语境提供的信息对接下来的内容进行预测加工,以影响词汇本身加工和整合效率。

最重要的是,实验1 中,不可预测词在高限制性语境中的加工快于低限制性语境;实验2 中,语义违背词在高、低限制性语境中的加工没有差异。两个实验的结果均表明不存在预测误差成本,即高限制性语境并没有对实际出现的不可预测词的加工造成干扰。根据等级预激活的观点,读者根据语境信息,按照不同的权重同时并行激活了一系列的词汇(Staub,2015)。由于是不同程度地平行激活了系列词汇,高限制性语境只会对不同预测程度的词产生不同程度的促进作用,并不会对出现的不可预测词造成额外的干扰。但是,根据词汇预测观的观点,读者根据前文的语境信息,首先激活完型概率最高的特定词汇,当发现呈现的不是预测到的特定词汇时,读者需要首先抑制已经预测的特定内容,再对当前的词汇进行加工,是一种串行式的词汇加工过程。因此,高限制性语境不仅能促进可预测词的加工,还会对意想不到的不可预测词的加工造成干扰。因此,当前研究结果支持了等级预激活的观点。实验1 中,当可预测和不可预测词语义高度相关时(例如:面包 vs.饼干),高限制性语境促进了不可预测词的加工。但实验2 控制语义一致词和语义违背词语义不相关后,仍未表现出预测误差成本效应,这表明实验1 中高限制性语境对不可预测词的促进作用是由于平行的等级预激活造成的。

当前主要研究结果与拼音文字眼动研究发现一致(Frisson et al.,2017;Luke & Christianson,2016),即不存在预测误差成本,主要预测加工方式未受到语言系统之间差异的影响。但不同于拼音文字的研究结果,实验1 在词汇加工的早期指标上就表现出了高限制性语境对语义相关不可预测词的促进作用,在拼音文字的研究中,该效应只发生在了总注视时间等晚期指标上。这可能是因为汉语表意文字属性使其获取语义更加迅速,语境预测性对词汇加工的促进作用发生得更加迅速和显著。因此,汉语和拼音文字间书写系统的差异对语境预测性的加工过程造成了量的差异,但却未产生质的影响,即没有改变语境预测加工策略。

在日常实际阅读过程中,限制性很高的语境并不是十分常见,很少遇见预测程度很高的可预测词。中等或低等预测程度的词汇加工更为频繁普遍(Frisson et al.,2017)。因此,高效无成本的等级预激活加工更符合实际的语言认知加工需求。另外,高限制性语境这种无干扰的促进作用也大大提升了阅读效率和汉语新词的学习效率(陈宝国,张媛玥,马腾飞,2019)。

最后,阅读不仅包含对词汇的直接注视加工,还能在更早的预视中获取词长、正字法、语义以及句法等信息(臧传丽,鹿子佳,张志超,2019)。跳读上的语境预测性效应也在一定程度上反应了语境预测性对词汇早期预视加工阶段的影响(刘志方等,2020)。所以,整个词汇加工过程中(预视加工阶段,直接注视加工阶段)都有可能产生预测误差成本。但是,双加工理论和有关预测误差成本的ERP 研究结果均表明,语境对词汇的干扰更可能发生在后期(Federmeier et al.,2007;Stanovich & West,1979)。因此,当前研究首要考察了在词汇直接注视加工阶段的预测误差成本效应,后期研究可以通过控制实验材料,测量副中央凹预视中前目标词上的预测误差成本效应,对早期的干扰进行进一步检验。

5 结论

相较于拼音文字,在汉语阅读中,语境预测性对词汇加工的促进作用发生的更加迅速、显著,但却采取了相同的预测加工方式—等级预激活。读者利用高限制性语境以等级预激活的并行预测加工方式促进了对接下来的可预测词的加工,但是高限制性语境并不会对无关不可预测词的加工产生干扰。

猜你喜欢

预测性限制性语义
真实场景水下语义分割方法及数据集
动作自主性与结果性质对不同预测性条件下施动感的影响*
汉语依凭介词的语义范畴
创新范式转移
非限制性定语从句常见易错题例析
定语从句