APP下载

汉字单字识别的正字法加工方式

2014-03-23余成武

关键词:部件汉字效应

余成武,张 敏

(1.闽南师范大学生物科学与技术系,福建漳州363000;2.杭州师范大学教育学院,浙江杭州311121)

1 问题提出

汉字是世界上最古老、使用人口最多的文字,由于其不同于拼音文字的许多独特性,汉字识别的研究一直激发着不同学科研究者的兴趣.汉字识别包含了字形、字音和字义等多种信息代码的加工,是完成汉字形、音、义的通达过程,已有研究表明字形对字义的作用大于字音[1-2].因此,进行汉字字形识别研究,考察汉字识别的字形特征,揭示汉字视觉识别过程和复杂模式识别过程的规律,对于解决汉字教学过程中的相关难题,提高汉语学习的效率和汉字教学的质量具有重要的理论和实践意义.

汉字的正字法(orthography)是人们长期形成并内化的关于“如何正确书写汉字”的规则,而汉字正字法加工作为汉字字形识别的第一要素,它发生在汉字识别的初期,是人们利用正字法规则做出“字与非字”判断的过程.当前关于正字法加工的研究主要从汉字正字法意识的发展和对外汉语教学研究的角度,对正字法本身加工过程的探讨则较少[3].此外,汉字识别过程研究一直存在整字识别和特征识别之争论,彭聃龄等[4]采用不同的实验任务发现当部件数保持恒定时存在笔画数效应,少笔画字较多笔画字加工快,张武田等[5]研究发现高频条件下出现部件数效应,独体字的命名要快于双部件字.汉字加工过程的笔画数效应和部件数效应证实了自下而上加工方式的存在,虽然较多的研究结果支持自下而上的特征识别,但并非所有研究者都得出一致的结论.高定国等[6]对影响汉字认知速度的因素进行了研究,结果未见笔画数效应,潘玉进[7]采用命名法探讨在不同汉字部件亮度下的笔画数效应时,也未发现笔画数效应,这种汉字识别中的“整体优先”效应则证明了汉字识别可能存在自上而下的加工方式.总结已有的研究,我们认为之所以会得到不同的结论,主要是因为以往研究多以汉字命名任务为研究范式,而汉字命名的过程包括了正字法加工在内的字形、字音、字义的通达,这样的操作可能存在几种不同“模式识别”的混合作用而造成研究结果的不一致.

本研究在前人有关汉字识别研究的基础之上,把着眼点放在汉字识别的正字法加工阶段,尝试以真假字判断任务为研究范式,独立考查汉字正字法的加工方式,以及这种加工方式是否受到汉字字频、部件频率等因素的影响.

2 实验1

2.1 研究目的

本研究拟利用笔画数效应和真假字判断任务,通过控制汉字的字频、部件数来验证汉字在正字法加工的过程是否存在部件数效应,从而推论汉字正字法识别的加工方式.如果存在部件数效应,则说明汉字正字法加工为自下而上的加工,此时汉字的正字法加工以笔画或部件为基本的加工单元.如果汉字的加工方式存在自上而下的加工方式,则不存在部件数效应.

2.2 研究方法

2.2.1 被试的选取

24名非汉语语言学本科生参与实验,被试视力或矫正后视力正常.

2.2.2 实验材料与工具

真字选自《汉字信息字典》[8],其中高频字部分汉字均高于30次/百万(平均字频为761次/百万),低频字字频均低于30次/百万(平均字频低于6次/百万).少部件字均由2个部件构成,平均笔画数为6.25画,多部件字由3个部件构成,平均笔画数11.75画.假字由真字通过改变部件位置形成,转换位置后的假字均为不符合汉字正字法规则的字,假字与真字构成在部件、部件数以及结构类型上匹配.

真字与假字图片均使用Photoshop软件制作完成,其参数为宋体,73磅,图片大小为4cm×4cm,字体为黑色,屏幕为白色,以保证所有图片在尺寸、背景、对比度和物理属性的一致性.如图1所示.

实验程序由E-prime软件编辑完成并记录被试反应时与正确率.刺激呈现于17英寸CRT屏幕中央,分辨率为1024×768,刷新频率为100Hz.

图1 实验材料举例Fig.1 The experimental materials for example

2.2.3 实验设计

采用2(字频:高、低)×2(部件数:多、少)×2(目标字类型:真字、假字)的被试内设计,因变量为被试反应的正确率和反应时.

根据时间进程的研究[9],人们在对汉字识别的过程中,字形加工在43ms已经稳定出现,音、义的加工则必须在57ms之后.因此,本研究主要通过控制部件位置来改变正字法信息,并将目标字的呈现时间控制在43ms,以最大程度地降低汉字音、义对正字法加工造成的影响.

2.2.4 实验程序

正式实验之前先进行练习以熟悉操作,具体刺激呈现方式如图2所示.

首先在计算机屏幕中央一个注视点“+”800ms,接着是500ms的空白,然后呈现目标字(如“快”字),目标字呈现时间为43ms,紧接着目标字之后的是一个43ms的后掩蔽,接着出现一个4 000ms被试反应窗,最后是1 800~2 000ms的随机空白.接着呈现下一刺激.被试按要求在反应窗出现时及时作出真假字的反应.

图2 实验1材料呈现流程Fig.2 Experiment 1materials exhibit flow

2.3 研究结果

删除正确率低于80%的被试数据以及反应时为0或超过3 000ms的极端值数据,实验1剩余有效数据17组.

对整理后数据进行2×2×2重复测量的方差分析(表1)表明:部件数主效应显著(F(1,16)=7.517,p<0.05),字频主效应显著(F(1,16)=18.988,p<0.001),目标字类型主效应显著(F(1,16)=4.873,p<0.05);部件数和字频交互作用不显著(F(1,16)=1.340,p=0.246);部件数和目标字类型交互作用不显著(F(1,16)=1.133,p=0.303);部件数、字频和目标字类型三者交互作用不显著(F(1,16)=1.623,p=0.221);字频和目标字类型的交互作用显著(F(1,16)=26.376,p<0.001).进一步的简单效应检验表明:当字频为高频时,目标字类型效应显著(F(1,16)=33.310,p<0.01),此时真字反应明显快于假字,当字频为低频时未发现目标字类型效应;当目标字类型为真时,字频效应显著(F(1,16)=14.975,p<0.001),高频字的反应时明显高于低频字,当目标字类型为假时未发现字频效应.

表1 不同字频和笔画数真假字反应时Tab.1 Reaction time of true or false characters with different word frequency and radical number/ms

2.4 讨论

汉字识别的部件数效应显著,意味着汉字正字法加工存在自下而上的数据驱动加工方式.字频与汉字目标字类型的主效应和交互作用均显著,简单效应的结果表明,只有在真字条件下存在字频效应.既然部件对于正字法加工有作用,那么,部件频率作为部件的一个重要属性是否同样对汉字的正字法加工有重要的影响?

3 实验2

3.1 研究目的

在实验1的基础上通过控制整字频率和部件频率,探讨部件作为汉字的一个构成部分,其频率如何影响正字法加工.

3.2 研究方法

3.2.1 实验被试

24名非汉语语言学本科生参与实验,被试视力或矫正后视力正常.

3.2.2 实验材料与工具

根据《汉字信息字典》[8]的界定,部件频率指含有该部件汉字频率的综合.实验中部件频率信息均来自《汉字信息字典》中的“部件组字次数动态统计表”,按照该表统计结果,频率最高的前30个部件组合汉字累计百分比就已经达到43.929%,前50个部件累计百分比为55.377%,前150个部件组合汉字累计百分比达到81.839%.本研究将频率排名高于50的部件定位高频部件,低于150的为低频部件.实验2所选汉字均为2部件左右结构汉字,根据不同字频、左部件频率和右部件频率匹配成8种条件下的汉字材料.假字由真字通过改变部件位置形成.

真假字图片制作方式与规格同实验1.

3.2.3 实验设计

实验为2(字频:高、低)×2(左部件频率:高、低)×2(右部件频率:高、低)×2(目标字类型:真字、假字)的被试内设计.因变量为被试反应的反应时和正确率.

3.2.4 实验程序(同实验1)

3.3 研究结果

剔除正确率低于80%的被试数据以及反应时为0或超过3 000ms的极端值数据,实验2剩余有效数据21组.

对整理后数据进行2×2×2×2重复测量的方差分析(表2)结果表明:字频主效应显著(F(1,20)=24.014,p<0.001),目标字类型主效应显著(F(1,20)=12.434,p<0.01),左部件频率和右部件频率的主效应均不显著(F(1,20)=0.217,p=0.646;F(1,20)=0.096,p=0.759);左部件频率与右部件频率的交互作用不显著(F(1,20)=0.175,p=0.199),左、右部件频率与目标字类型的交互作用均不显著(F(1,20)=3.396,p=0.060;F(1,20)=0.778,p=0.338);左、右部件频率分别与字频和目标字类型的交互作用均不显著(F(1,20)=0.002,p=0.968;F(1,20)=1.324,p=0.263);左部件频率、右部件频率、字频和目标字类型四因素交互作用不显著(F(1,20)=2.308,p=0.144);字频与左部件频率以及字频与右部件频率的交互作用均显著(F(1,20)=5.405,p<0.05,F(1,20)=5.732,p<0.05),字频、左部件频率以及右部件频率三者交互作用显著(F(1,20)=5.843,p<0.05),字频与目标字类型交互作用显著(F(1,20)=6.755,p<0.05).

表2 不同字频和部件频率条件下真假字反应时Tab.2 Reaction time of true or false characters with different word frequency and radical frequency/ms

3.4 讨论

左右部件频率主效应均不显著,但二者与字频交互作用显著,说明部件频率影响汉字正字法加工过程,但这种影响可能与字频因素有关.图3显示了各种类型汉字平均反应时,其中低频真字的反应时波动较为明显:右部件频率为高时,低频真字的反应时显著变低,说明右部件频率对于低频汉字的正字法加工具有较重要的作用.

字频效应和目标字类型效应在实验2再次得到验证,说明了字频是影响汉字早期字形加工的一个重要因素.目标字类型效应则说明了人们在正字法加工的过程中对符合正字法规则的汉字反应更敏感.

图3 不同部件频率、字频真假汉字反应时间Fig.3 Reaction time of true or false characters with different radical frequency

4 总讨论

4.1 字频对汉字正字法加工的影响

根据以往有关汉字识别的研究,字频是影响汉字识别的一个重要因素.正字法加工发生在汉字识别的初期阶段,主要是通过对汉字字形结构、内容与位置的分析对一个“符号”做出字与非字判断的过程,这种判断利用的是人们对于汉字正字法规则的内化和理解.实验1与实验2证实了在单字识别个过程中存在稳定的字频效应,字频是影响汉字正字法加工的一个重要因素.基于联结主义的观点,人们对信息的加工过程是通过各节点之间的兴奋性和抑制性的联结传导来进行的,而各模块上的节点之间以及模板与模板的节点之间联结的权重是不一样的[10].反复、经常的兴奋性联结或抑制性联结,不仅会增强它的兴奋性或抑制性联结的权重,同时还会导致联结节点阈值的升高或降低.由此可见,经常使用的信息码由于经验的作用,其节点联结的权重大,激活值也大,而相应节点兴奋所能达到的阈限却低,这样,字形码或字音码被激活至阈限的时间就短于那些不经常使用的字.假字条件下字频效应不显著是因为“假字”破坏了汉字的正字法规则,此时,部件组合而成的“汉字”失去其整体性,人们对信息整合加工的结果是一个无意义的整体,字频作为汉字的整体属性也就失去其效应.

字频反应汉字的使用程度,正字法加工中的字频效应的在一定程度上说明汉字识别的正字法加工可能还存在“整字”层次.高频字的正字法加工比低频字快,说明了人们对熟悉的汉字在正字法加工时存在自上而下的加工.人们在利用内化的正字法规则时,面对特别熟悉的高频字时,相对不熟悉的低频字,其“自动化”程度更高,需要的心理注意和认知资源较少,加工快.这点符合双加工理论的对认知加工过程的假设.

4.2 汉字类型对正字法加工的影响

实验2字频和目标字类型存在交互作用,对高频字和真字的反应较快,而低频字和假字的反应较慢,由此可见人们对于不同汉字类型汉字的加工同样符合联结主义的观点,相对于假字来说,真字的联接权重大,阈限低.其次,已有的研究已经证实了部件位置信息对于汉字识别的重要性,部件位置信息是正字法加工的基本要素之一[11-13].本研究通过改变部件的位置来获得与真字匹配的假字,这些假字在特定部件上都出现了位置信息与正字法规则的不匹配,研究结果显示目标字类型效应显著,人们在判断真字为真时要显著地快于假字为假,从侧面验证了部件位置在汉字正字法加工中的重要作用,那么,为什么对于真字与假字的判断存在差异?从正字法判断的过程来看,正字法加工是人们根据自身对正字法规则的理解对汉字做出“字与非字”判断的过程,真字之于假字,与高频字之于低频字一样,其自动化程度都应该更高,所需的注意资源更少,正字法加工判断的时间也就更短.

4.3 汉字字形识别早期的正字法加工方式

4.3.1 部件数效应与正字法加工方式

由于正字法加工发生在汉字识别的早期,加工的内容主要是汉字字形,因此也可叫做汉字早期的字形识别.本研究利用部件数效应对汉字正字法识别的加工方式进行探讨,实验1采用二部件字与三部件字为实验材料,在单字水平上得到了部件数效应,证实了汉字正字法加工过程自下而上加工方式的存在.也就是说,笔画或部件是汉字正字法加工的基本单元,人们通过特征分析,由笔画/部件至整字的加工层次完成汉字的正字法识别.

4.3.2 字频、部件频率效应与正字法加工方式

字频效应提示汉字识别的正字法加工可能还存在“整字”层次,实验2未见部件频率效应,部件频率与字频存在交互作用,也有这样一种可能,高频汉字中的部件频率与字频具高相关,即高频汉字中的部件频率也高.这就涉及到实验2中对部件频率影响汉字正字法加工的探讨.实验2将左右部件分别以高低两种水平进行区分,将其与高低字频汉字进行匹配,实验结果显示没有存在左部件频率和右部件频率的主效应,但部件频率与字频的交互作用显著,也就是说,虽然部件频率对汉字的正字法加工有影响,但这种影响可能是通过整字频率来实现的,从侧面再次验证了整字频率在预测正字法加工过程中的重要作用.字频作为“整字属性”在汉字单字正字法加工中所体现的重要作用从侧面证明汉字单字的正字法加工同样存在自上而下的正字法加工,因此,本研究结果证实汉字单字识别的正字法加工存在两种加工方式并存的现象.在进行正字法加工时,人们对特别熟悉的汉字采取自上而下的加工方式,而对于不熟悉的汉字采取自下而上的特征提取加工.但是,本研究以单字为实验材料,单字阅读比较不符合人们的“阅读”习惯,如果将这种探讨扩展到词汇或句子水平是否能得到一致的结论,这将是下一步研究需要解决的问题.

5 结 论

1)字频对汉字识别的正字法加工影响显著,从侧面证明自上而下加工方式的存在;

2)单字识别的正字法加工存在显著部件数效应,正字法加工存在自下而上的加工方式;

3)部件频率主效应不显著,部件频率对汉字单子正字法加工的影响可能与字频有关;

4)目标字类型影响汉字的正字法加工,真字的加工更符合人们的加工习惯.

[1]管益杰,方富熹.我国汉字识别研究新进展[J].心理学动态,2000,8(2):1-6.

[2]陈宝国,彭聆龄.汉字识别中形音义激活时间进程的研究I[J].心理学报,2001,33(1):1-6.

[3]余成武.汉字识别的正字法加工方式[D].杭州:杭州师范大学,2011.

[4]彭聃龄,王春茂.汉字加工的基本单元:来自笔画数效应和部件数效应的证据[J].心理学报,1997,29(1):8-16.

[5]张武田,冯玲.关于汉字识别加工单位的研究[J].心理学报,1992(4):380-385.

[6]高定国,钟毅平,曾铃娟.字频影响常用汉字认知速度的实验研究[J].心理科学,1995,18(4):225-229.

[7]潘玉进.不同部件亮度条件下的汉字识别初探[J].应用心理学,2000,6(1):7-14.

[8]李公宜,刘如水.汉字信息字典[M].上海:科学出版社,1988.

[9]陈宝国,王立新,彭聆龄.高、低频汉字形音义激活时间进程[J].心理与行为研究,2006,4(4),522-257.

[10]曾凯.联结主义理论对学习英语词汇搭配的启示[J].东北大学学报:社会科学版,2009,11(3):267-268.

[11]曾捷英,周新林.汉字识别中的部位部件效应[J].心理科学,2001,24(3):356-357.

[12]吴先良.汉字识别的正字法加工的ERP研究[D].长沙:湖南师范大学,2009.

[13]陈昌明.文盲的正字法意识和语音意识及其在阅读能力获取过程中的发展[D].重庆:西南大学,2010.

猜你喜欢

部件汉字效应
铀对大型溞的急性毒性效应
懒马效应
基于Siemens NX和Sinumerik的铣头部件再制造
部件拆分与对外汉字部件教学
汉字这样记
应变效应及其应用
汉字这样记
焦利氏秤各部件的修理和改装