APP下载

欧美留学生汉语有标复句习得顺序研究

2018-09-10张利蕊

华文教学与研究 2018年3期

张利蕊

[关键词]欧美留学生;汉语有标复句;习得顺序;正确使用相对频率法;蕴含量表法

[摘要]文章以六部对外汉语教学大纲为依据,遴选出52个常用汉语有标复句句式,并基于60万字的中介语语料,采取正确使用相对频率法与蕴含量表法相结合的研究方法,系统考察了欧美留学生汉语有标复句的习得顺序。文章首先从整体上揭示了欧美留学生对52个有标复句的习得顺序,进而以此为基础推断出12大类有标复句的习得顺序。本研究的相关数据与结论可以为对外汉语教学大纲和教材的编写、修订以及复句教学提供直接的依据。

[中图分类号]H195.3 [文献标识码]A [文章编号]1674-8174(2018)03-0078-10

1.引言

二语习得顺序研究发端于20世纪70年代初,肇始于国外学者对母语习得顺序的探讨,经典文献如Brown(1973),该文采用“纵向(10ngitudinal)”法对3名儿童进行跟踪实验,发现他们对14个语素的习得顺序一致,进而提出儿童习得母语知识时遵循了基本固定的顺序。Dulfdv&Burt(1973)采用“横向(cross-sectional)”法考察151名西班牙儿童对8个英语语素的习得顺序,发现年龄大的儿童具有更加成熟的认知能力,儿童语素习得顺序的差异系认知能力的不同而致。Krashen(1982)结合前人与自己的实证研究,提出了深具影响力的“自然顺序”假说,认为学习者在对语言结构知识的习得方面是按自然顺序进行的,而不是跳跃式的。历经20年的发展,习得顺序的研究进入90年代已取得丰硕的成果。Ellis(1994)对相关研究做了总结与回顾,指出二语习得顺序研究其实包括两个方面:一是习得发展过程(the sequence of acquisition),即学习者习得目的语的某个特定语法项目时在各个阶段所表现的差异与发展;二是习得顺序(theorder of acquisition),即学习者掌握目的语中不同语法项目的先后顺序。这些文献对后续研究产生了深远的影响。

Ellis(1994)关于二语习得顺序内涵的概括为国内绝大多数学者所接受。汉语学界对二语习得顺序的研究自20世纪90年代后期日益受到重视。学者们大多采用描写性研究手法,通过个案观察、语言测试、问卷调查和语料库调查等方式收集数据,据此做量化分析,针对“把”字句、趋向补语、单句句式等汉语语法项目的习得顺序做了广泛而深入的探讨,取得了丰硕的成果(钱旭菁,1997;施家炜2002;杨德峰,2003;卢福波,2005等)。

在汉语语法体系中,有标复句的地位极为重要,不仅运用范围广,而且使用频率高,一直是对外汉语教学的重点。但是有标复句因其句法语义的复杂性、句式结构的多样性以及内部成员的繁复性,不仅成为留学生汉语学习中极易产生偏误的难点,也使得学界对有标复句的习得研究相当薄弱。汉语的复句从语义类型来看有十几种,常见句式有数十个,单类择点研究难以从整体上勾勒出留学生复句习得的概貌。就复句整体习得顺序来看,余敏(2012)的研究最为全面,但该文的研究对象是韩国留学生,相关结论对其他国籍特别是欧美留学生未必适用。此外,该文语料全部来自HSK动态作文语料库,并未涉及初级阶段留学生的习得材料,语料单一。该文对于语料库中的缺失句式并没有利用诱发语料做进一步分析,也影响其结论的科学性和全面性。

鉴于目前的研究现状,对留学生汉语复句习得顺序的研究亟需分国别开展。本文选择欧美留學生为对象研究复句的习得顺序有两个方面的考虑:其一,近年来,来华的欧美留学生在数量上有了大幅度的增加,但是他们的学习效果并不令人满意(吕玉兰,2000)。在这种背景下,关注欧美留学生的汉语习得情况,减少教师与留学生的教学与学习难度,可望吸引更多的欧美留学生来华学习汉语,这样的研究无疑具有较强的现实意义;其二,欧美留学生的母语英语属于印欧语系,而目的语汉语属于汉藏语系,两种语言在语法上呈现出系统性差异。具体说来,英语有形态变化,语序灵活,常常运用较为丰富的连接词,而汉语缺乏形态变化,少用甚至不用连接词,语序相对固定(连淑能,2010:32)。母语和目的语的差异给欧美留学生习得汉语有标复句带来了很大的困难,因此开展本研究很有必要。

2.句式范围及语料来源

2.1句式选定

为了系统而科学地揭示汉语有标复句的习得顺序,本文首先采用“整体观的视角”调查了目前较为常用的6部对外汉语教学大纲:《对外汉语教学语法大纲》《汉语水平等级标准和语法等级大纲》《对外汉语教学初级阶段教学大纲(语法大纲部分)》《高等学校外国留学生汉语教学大纲(长期进修)》《高等学校外国留学生汉语言专业教学大纲》《国际汉语教学通用课程大纲》,然后遵循“常用性、规范性、基本性、针对性”的句型确立原则从6部大纲中遴选52个常用复句句式,再依照邢福义(2001)的复句分类体系标准将52个复句区分为12种语义类型(见表1),最后利用中介语语料调查各个句式的使用情况。

2.2语料来源

本研究使用的语料来源有三:一是北京语言大学“HSK动态作文语料库”,收集了美国、英国、加拿大、澳大利亚等欧美留学生作文语料,共计40万字;二是笔者自建语料样本,收集了武汉大学、华中师范大学、哈尔滨师范大学等高校国际交流学院的欧美留学生作文,共计20万字。这两部分为留学生产出的自然语料,其优点是能客观、真实地反映习得者对目的语的使用情况。但缺点是可能会受学习者掌握目的语水平的差异、学习策略的不同、样本规模过小等因素的影响,导致部分复句句式的缺失。三是诱发语料,我们针对欧美留学生所做的有标复句使用情况的问卷调查获得诱发语料,以便用于统计各句式的正确使用频率。诱发语料经过严谨的设计和控制,能够较大程度上保证考察内容的全面性。自然语料和诱发语料相结合,能够确保统计数据与研究结论更加科学与客观。

2.3选定句式使用频次

为了保证统计数据的真实性与有效性,我们首先对52类复句句式做了人工标注,在此基础上利用自然语料统计留学生对这些句式的使用频次。详细数据如表1。

3.研究方法

二语习得顺序研究的通常做法是先收集足量的语言样本,然后对语言样本进行分级的量化处理,进而揭示特定语法项目的习得顺序和习得难度。施家炜(2006)梳理了二十年来汉语作为第二语言习得顺序的研究成果,统计出习得顺序研究常用的方法有:正确率排序法、错误率排序法、使用频次排序法、使用频率排序法、Q-SCORE算法、偏误率排序法、正确使用相对频率法、阶段计分法、习得区间法、蕴含量表法等。上述方法各有优劣,实际应用中宜根据实际情况选择其中的一种或多种方法解决问题。鉴于本研究的自然语料来自HSK作文和几所高校的欧美留学生作文,受作文的特定话题、体裁、题材的限制,会导致语料分布不均,所以本文采用了正确使用相对频率法。另外,HSK动态作文语料库是中高级阶段的留学生语料,我们收集的来自武汉大学、华中师范大学、哈尔滨师范大学等高校国际交流学院的欧美留学生的20万字作文语料中,涵盖了不同学习年限、不同年龄、初、中、高三个水平等级的欧美留学生,个体差异较大,宜于选用蕴含量表法,因为该方法的突出优势就在于“减少个体差异对分析结果的影响。从统计学的角度讲,当样本的选择具有代表性且数量足够时,所得到的分析结果应该可以代表所考察群体的特征”(冯丽萍、孙红娟,2010)。考虑到本文考察的复句涉及12种类别52个句式,加之语料分布不均和考察对象较大的个体差异,我们综合运用了正确使用相对频率法和蕴含量表法两种方法,以期获得更具客观性和体系性的数据结构。

3.1正确使用相对频率法

基于使用的语言习得模型(usage-basedmodel)认为,频率是二语习得过程中一个非常重要的因素,某语法项目的使用频率越高,学习者在头脑中对其掌握的强化程度越高,印象越深刻,在习得过程中产生泛化错误的几率也就越低。通常而言,使用频率高、应用范围广的语法项目,可能是习得者较早也较容易掌握的。这意味着,使用频率较高的语法项目,其正确使用频率可能会较高。但是二者并无严格的对应关系。因此二语习得研究中,又引入了正确使用相对频率的方法,以解决语料分布不均、句式样本容量小、无法进行等量随机抽样等问题。

本文借鉴了施家炜(1998)关于正确使用频率的算法设计,并结合实际情况将正确使用相对频率法的计算方法具体定义如下:某复句句式的正确使用相对频率=习得者对于该句式的正确使用频次/习得者对52个句式的使用频次之和。以条件句式T2(只要……就……)为例,在语料样本中,欧美留学生对52个复句句式使用频次之和为4361,其中T2的正确使用总频次为47次,那么句式T2的正确使用相对频率就是47/4361=0.0108。见表2。

3.2蕴含量表法

中介语研究的一个主要目的就是记录学习者在一段时间内对目的语中的语法、词汇和语音特征的逐步习得过程。相关研究证明,蕴含量表(implicational scales)是研究习得过程行之有效的一种方法。蕴含量表描述了个体或群体在语言变量的使用和习得过程中分层级的共现模式,得到x蕴含Y,而不是相反。该方法可以减少研究过程中个体(或群体)差异对习得顺序造成的影响,分析不同阶段和不同个体(或群体)之间的差异性是否显著,因此它能够较为准确地反映出特定语法项目的习得顺序。

就本文而言,蕴含量表法的基本思路是:首先求得52个复句句式在不同学时等级上的正确使用频率(计算方法为:某复句句式在某学时等级上的正确使用频次/该句式在该学时等级上出现的频次);然后将各句式的正确使用频率转换成二分變量,借助蕴含量表建立起各句式习得的难易等级,并标定被试的水平位置;最后对蕴含量表的有效度进行检验。

本研究中,欧美留学生在中级与高级阶段习得52个复句句式的正确率分别为0.825与0.837,总正确率为0.813。因此,以0.80为分界点,大于0.80记为1,表示已经习得,小于0.80记为0,表示未被习得。然后计算每个句式“1”的总数量,将这些总和按照由小到大的顺序由左往右依次排列,左端表示“较难习得”,右端表示“较易习得”。接下来计算每组群体的“1”的总数量,根据总和从上到下依次排列。下一步是画出分界线,根据每一行“1”的数量,有几个“1”就在对应列中画一条竖线,然后用横线将竖线链接。根据蕴含量表的理想模型假设,折线左下区域的句式都应该是“0”,右上区域应该是“1”,若折线左下区域出现了“1”,说明该句式本不该习得而被习得,反之,若折线右上区域出现了“0”,说明该句式本该习得而未被习得。量表下面的“正确”和“错误”的数量依此规律得出,符合规律的视为“正确”,不符合规律的视为“错误”。蕴含量表的最后一行是根据每一列“0”和“1”的数量列出的边缘值,第一个数字是每一列中“0”的数量,第二个数字是每一列中“1”的数量。

4.研究结果

4.1正确使用相对频率法研究结果

根据3.1所示方法,我们对自然语料中52个句式的使用频次和正确使用相对频率进行了计算,并对计算结果进行排序,具体数据如下表。

根据正确使用相对频率的统计结果,52个有标复句中,R3、X6、X5、T4、L3、D4、D3、D2、M5、J4为自然语料中的缺失句式。它们在自然语料中的缺失和很多因素有关,例如作文语料库中作文的特定话题和题材的限制、学习者使用频率的影响,即学习者在诸多句式中会选择自己较为熟悉且使用频率较高的句式、学习策略的影响,即学习者对于自己较为生疏且关系复杂的句式主观上往往会采取回避策略等等。为弥补缺失语料的不足,保证研究的全面性,我们设计有针对性的问卷来调查留学生对缺失句式的使用,获取诱发语料。诱发语料以调查问卷的形式通过“问卷星”在网上进行,调查了北京师范大学、武汉大学、华中师范大学、哈尔滨师范大学和西北师范大学5所高校的国际交流学院在读欧美留学生。问卷以选词填空、修改病句、连词成句的题型考察了欧美留学生对语料中缺失句式的掌握情况,共回收有效问卷78份。鉴于问卷调查不能像自然语料一样统计句式总和,因此无法计算正确使用相对频率,我们只能针对78份问卷反映的情况按照正确使用频率来排序。根据调查结果,其正确使用频率及排序如表3所示。

根据以上统计结果,可以概括出52个有标复句句式的习得顺序。具体而言,排序前16位的依次是:Y1>Z1>J2>Y2>D1>Z2>T3>M1>B4>T2>X1>T5>TD2>Z3>Z4>JZ2=z6=B2;位居第17-26的依次是:J1>T1>B3=Y4=Y3>R2>R1>TD1>Z5>JZ1>L5>TJ1=B1=M4=M2;位居第27-32的依次是:T6>M3=T4>J5>X3>L2=J3>X4=X2;排名在33以后的句式为自然语料中的缺失句,习得顺序依次是:T4=X6=L3>D4>R3>J4>M5>X5>D3>D2。

4.2蕴含量表法研究结果

4.2.1研究结果

基于3.2的讨论,我们首先对已有语料进行分级处理。HSK动态作文语料库中证书等级A、B定为“高级”;证书等级C定为“中级”。自建语料样本中已通过HSK五级和六级的定为“高级”;四级和三级定为“中级”;二级以下及未考取证书的定为“初级”。分级后按高、中、初三个级别来计算特定句式在某学表4:正确使用相对频率前16个句式蕴含量表时等级上的使用频次。由于52个句式无法在同一个蕴含量表中呈现,我们将正确使用相对频率法的所得数据分4个部分来展示,研究结果见表4~表7。

从表4-表7可以看出,正确使用相对频率的统计结果和蕴含量表所显示的习得顺序存在一些差异,这说明不同句式习得难易度存在较大的跨度。例如,推断复句TD2和条件复句T2最难习得,因果复句Y2、Y1最容易习得。

4.2.2蕴含量表有效度检验

实际研究中,不能仅凭创建的蕴含量表来简单地说明语法项目习得的等级差异。接下来还需要用再生系数、最小边缘再生系数、再生提高百分比等数据对蕴含量表的有效性进行检验。

1)再生系数(Coefficient 0f Reproducibility)

再生系数的公式为:再生系数(Crep)=1一错误的数量/学生的数量*句式的数量,根据统计知识的假设,此系数越接近1,可预测性越强,计算结果原则上应该超过0.90。关于欧美留学生对52个复句句式习得顺序的研究是以四个蕴含量表的形式来呈现的,根据此公式,其再生系数应该是:Crep=1-10/3*52=0.9395。计算结果显示,此蕴含量表的再生系数均超过了0.90,说明我们的四个蕴含量表都具有较强的可预测性。

2)最小边缘再生系数(Minimum MarginalReproducibility)

最小边缘再生系数的公式为:最小边缘再生系数(MMrep)=最大边缘值/学生数量。句式的数量。我们根据此公式计算蕴含量表的最小边缘再生系数为:MMrep=133/3*52=0.8397。根据吴继峰、王亚琼(2014)的假设:最小边缘再生系数的数值应小于再生系数,我们的计算结果与此假设相符合,说明蕴含量表具有可预测性。

3)再生提高百分比(Percent Improvement in Reproducibility)

再生提高百分比的公式为:%improve—ment=Crep-MMrep。我们根据此公式计算蕴含量表的再生提高百分比为:%improvement=0.9395-0.8397=0.0998。

4)可測量l生系数(coefficient ofScalability)

可测量性系数的计算公式为:Cscal=%improvement/1-MMrep。我们根据此公式计算蕴含量表的可测量性系数为:Cscal=0.0998/1-0.8397=0.6225。吴继峰、王亚琼(2014)认为,可测量性系数能够证明蕴含量表所建立起来的等级分级的有效性,在研究中使用蕴含量表是需要报告这个数值的,而且只有当这个数值超过0.60时,蕴含量表才具有可测量性。从计算结果来看,我们的蕴含量表的可测量性系数超过了0.60,因此证明具有可测量性。

综合以上分析及检验,欧美留学生对52个汉语有标复句句式的习得顺序为:Y1>z1>Y2>Z2>T3>M1>X1>JZ2>D1>B4>T5>Z3>Z4>Z6>B2>J2>T2>TD2>T1>Y4>Y3>TD1>B1>M4>B3>R2>R1>JZ1>J1>L5>L1>M2>Z5>M3>X4>X2>T4>T6>L2>J5>X3>J3>J4>R3>D4>L3>X6>L4>D2>M5>D3>x5。蕴含量表是有效的(Cscal=0.6225,大于0.60),且具有较高的可预测性(Crep=0.9395,大于0.90)。

4.3正确使用相对频率法复句类型习得顺序研究结果

在利用正确使用相对频率法和蕴含量表法确定52个有标复句句式的习得顺序后,我们再次使用正确使用相对频率法对欧美留学生12类汉语有标复句的习得顺序做了研究,结果如表8。

根据正确使用频率法的统计结果,欧美留学生留学生习得12类汉语有标复句的习得顺序是:因果复句>转折复句>假设复句>条件复句>递进复句>并列复句>目的复句>推断复句>让步复句>选择复句>假转复句>连贯复句。

5.结语

欧美留学生对12类汉语有标复句的习得顺序依次为:因果复句、转折复句、假设复句、条件复句、递进复句、并列复句、目的复句、推断复句、让步复句、选择复句、假转复句和连贯复句。对比余敏(2012)的研究结果,我们发现,欧美留学生和韩国留学生对12类汉语有标复句的习得顺序上,前三类复句完全一致,差别较大的是条件复句和让步复句,条件复句在欧美留学生的习得顺序上排名第四,而在韩国留学生的习得顺序上排名第八;让步复句欧美留学生习得顺序排第九,韩国留学生习得顺序排在最后一位。欧美留学生对52个汉语有标复句句式的习得顺序为:Y1>z1>Y2>Z2>I3>M1>X1>JZ2>D1>B4>I5>Z3>Z4>Z6>B2>J2>T2>TD2>T1>Y4>Y3>TDl>B1>M4>B3>R2>R1>JZl>J1>L5>L1>M2>Z5>M3>X4>X2>T4>T6>L2>J5>X3>J3>J4>R3>D4>L3>X6>L4>D2>M5>D3>X5。就欧美留学生汉语有标复句习得顺序来看,句类和具体句式的习得顺序没有必然联系,因此,教学过程中一方面要考虑留学生对复句逻辑语义类型的认知传统,有一定的句类意识;但另一方面,又不能拘泥于句类导向式的集中教学,而要考虑复句的使用频率、留学生的习得顺序、习得难度等因素。

就欧美留学生而言,在有标复句的习得上,高级水平留学生较之中级和初级水平的留学生,使用频次大幅增多,运用范围明显扩大,使用准确率也有显著提高。这说明随着语言水平和等级的提高,对复句句式的理解和掌握也会随之提升。研究还表明,欧美留学生对复句的学习是一种渐进、动态的过程,在52个句式的习得顺序上并无清晰的界线。正确使用相对频率的调查结果和蕴含量表结果存在的差异说明留学生对有标复句的习得往往是多个句式同步进行、相互交叉、互相渗透,并非按严格的顺序逐一习得。

本文的实证研究表明,虽然汉语有标复句的句式复杂,种类繁多,但留学生在习得过程中存在带有共性的自然顺序。对欧美留学生汉语有标复句习得顺序的研究使我们从整体上对这个群体汉语有标复句的习得难易度有了更为清晰的认识,这为教学大纲的制定、教材的编写以及课堂教学提供直接的依据。对比本文与余敏(2012)的研究,可以发现,不同国别的留学生在对某一语法点的习得情况也不尽相同。这也给我们一个启示:尽管区分国别意识的教学实践与教材编写操作起来存在诸多困难,但是它应该是我们今后努力的方向。

[责任编辑 王功平]