APP下载

2006-2011二语习得研究热点与前沿的可视化分析

2013-12-03

当代外语研究 2013年3期
关键词:词频二语语言学

刘 浩

(南开大学,天津,300071)

1.引言

新世纪以来,二语习得研究的广度和深度不断扩展,多学科交叉日益显著(乐眉云2001),尤其在近几年来,该领域研究日渐繁荣,出现研究内涵不断扩大、重点逐步深化、视角日益多样化的新局面(杨连瑞、尹洪山2005;戴运财等2011;Long 2012)。同时,作为一个内容广泛的跨学科领域,二语习得研究的理论和研究成果对诸多的社会实际问题有潜在的借鉴意义,如第一语言习得、理论语言学、神经语言学、特殊人群的语言习得、语言教学和语言教育等(Long 2012)。

本文以二语习得研究领域三种高影响力外文期刊为数据来源,选取它们在2006-2011年间所刊载文章的关键词和主题词为研究对象,运用科学计量学中的词频统计和共词分析法透视近年来二语习得领域的研究热点和前沿领域,同时借助信息可视化技术手段绘制近年来二语习得研究的科学知识图谱。

2.研究方法

2.1 词频分析

根据齐普夫定律(Zipf’s law),主题词是对文章核心内容的浓缩和提炼,是具有实际意义且能表达文献主题概念的自然语言词汇,如果某一主题词在其所在领域的文献中反复出现,则可认为该高频主题词所表征的内容是该领域的研究热点。主题词可以是文章给定的关键词,也可以从文章题名、摘要或文本中提取。通过统计高频主题词及其变化趋势,可以很好地察觉该学科已经或正在发生的变化,准确把握其研究热点、发展脉络与发展方向。

词频分析法正是利用能够揭示文献核心内容的主题词或关键词在某一研究领域文献中出现的频次高低来确定该领域研究热点和发展动向的文献计量方法(马费成、张勤2006)。它克服了以往综述研究仅凭主观判断和纯粹文字描述的不足,可以透过现象准确、客观、系统地揭示主题词背后隐含的深层次内容。

2.2 共词分析

共词分析是一种内容分析方法,借助观察能够表达某一学科研究主题或研究方向的专业术语共同出现在同一篇文献中的情况,对这些词进行分层聚类,以揭示它们之间的亲疏关系,进而分析它们所代表学科的研究内容及主题结构的变化。共词分析同文献计量学中的作品或作者同被引的分析相似,其立论假设为关键词是对文章核心内容的浓缩和提炼,如果两篇文章中有两个以上的相同关键词,那么就认为这两篇文章在研究主题的概念、理论或方法上是相关的,且在研究内容上是相似的。两篇文章共词的数量越多,它们研究的内容就越趋同;同理,共词的文章数量越多,这类文章关键词的距离就越近,此时,运用因子分析、聚类分析和多维尺度分析等多元统计分析手段可以对这些共现的关键词进行归类并解析出一个学科的知识结构,同时,借助信息可视化技术可以将分析的结果清晰、直观地展现出来。

3.样本文献的选取和数据处理

3.1 样本期刊和文献的来源

为了较准确地反映近年来二语习得研究的现状,本研究选择StudiesinSecondLanguageAcquisition(SSLA),LanguageLearning(LL),SecondLanguageResearch(SLR)这三种外文期刊作为期刊选择源,以它们在2006-2011所发表的文章作为样本文献来源。这三种期刊在二语习得研究领域比较权威也比较有代表性,可以较好地满足本研究的需要。为排除不相干文献的干扰,本研究在文献处理过程中剔除了通知、前言、索引、书评等内容及部分专题和增刊上的文章。基于这样的处理,最后保留符合研究需要的文献共440篇(如表1所示)。将它们建立文本数据库,并从该库中提出词频统计和共词分析所需的高频关键词。

表1 2006-2011三种外文期刊来源文献数量统计表

3.2 关键词的提取和整合

3.2.1 提取关键词

对于文献中已有的关键词,本研究先对其进行整合,然后从文本库中进行提取(整合步骤参考本节2)。对于没有关键词的文献,本研究从文章的标题中进行提取,提取过程中会参考文章的摘要,选择与主题有关、意义完整且没有歧义的词或词组(参见王立非、江进林2011),每个标题包含的关键词数量不等。例如:

SecondLanguageAcquisitionofItalianAccusativeandDativeClitics

Abstract: This experimental study investigates the acquisition of Italian accusative and dative clitics by English adult speakers.These pronouns are non-existent in English.Results from a grammaticality judgement task show that Italian accusative and dative clitics develop slowly but gradually in Italian second language (L2) grammars.Interestingly, the placement properties appear to develop earlier than their case properties.The possible implications of these findings for theories of the L2 initial state are considered.

结合这篇文章的摘要及主题,本研究从该文章中共提取出六个关键词:experimental study(研究类型)、second language acquisition(研究主题)、Italian accusative clitics(研究内容1)、Italian dative clitics(研究内容2)、English adult speakers(研究对象)、grammaticality judgment task(研究方法)。

3.2.2 关键词的整合原则

为保证分析数据的统一性和准确性,本研究对提取的关键词进行整合,整合过程中遵循一致性原则和简化的原则。

第一,对关键词的整合遵从一致性原则,包括统一名称的使用、统一单复数等。首先,在结合朗文语言学和应用语言学词典及相关书籍并考虑文献中关键词使用习惯的基础上,对于关键词的名称进行统一。以second language为例,有的文章把其直接用作关键词,有的文章却使用其缩写形式L2;此外,关键词短语中也有类似情况,有的使用全称(如second language sentence processing等),有的使用缩写(如history of L2 acquisition、L2 oral ability等),处理过程中,如果为单列关键词,就统一用second language,如果出现在词组中,就统一使用L2。此外,根据关键词的使用习惯,将文中的English as a second language统一换成ESL,将SLA、L2 acquisition、Second Language Acquisition、second language acquisition全部替换成了second language acquisition(这种处理虽不符合简化原则,但鉴于大部分文章都使用该词,所以本研究选择使用此习惯表达)。其次,根据关键词提取的需要及其在文章中的使用习惯,本研究对单复数也进行了统一,如将feature和features统一成features。另外,针对大小写,若是专有词或专有术语,整合时统一使用大写,如American Sign Language,Noun Phrase Hierarchy Hypothesis,Universal Grammar,其余关键词一律使用小写。

第二,对关键词的整合尽量遵循简化原则,一方面尽可能使用缩写的形式,如English as a second language改成ESL,Chinese as a second language改成Chinese L2等。另一方面,对文章出现的复合短语或并列关键词,在遵循一致性原则的前提下,根据短语意思对其进行拆分,如Universal syntax/semantics拆分为universal syntax和universal semantics,L2 processing and universal grammar拆分为L2 processing和Universal Grammar。

4.结果及讨论

4.1 基于词频分析的研究热点和前沿

经过词频分析,数据库中共统计出1,543个关键词,在参考二语习得研究及综合关键词含义特征和数量的基础上,本研究选择词频超过3次的的关键词来代表二语习得的研究热点和前沿(共123个)。

通过观察关键词统计表,可以发现,出现频率最高的三个关键词依次为second language acquisition、ESL和second language,这充分说明三本期刊均以二语习得为研究重心,也从侧面验证这些期刊上的文章符合研究的需要。此外,结果还表明英语是二语习得研究关注最多的语言。结合Larsen-Freeman和Long(1990)及Ellis(1994)对二语习得研究的领域界定,本研究主要从中介语研究、学习者研究、学习理论、二语习得的外部因素、二语习得研究所涉语种、研究类型、二语习得研究相关学科等方面分类列出关键词的统计结果,以更为清晰地呈现二语习得领域的研究热点。

一、 中介语研究方面的高频关键词有:relative clauses(11)、grammatical gender(10)、features(9)、morphosyntax (8)、gesture(5)、morphology (5)、inflection (5)、functional categories(5)、semantics (5)、interlanguage pragmatics(4)等。这些高频关键词说明,近年来中介语研究涉及句法、形态、语义、语用等多个方面,其中以对形态和句法的关注居多。

二、 学习者研究方面的高频关键词有:heritage speakers (9)、age(6)、Critical Period Hypothesis(4)、children(4)、individual difference(4)、motivation(4)、age effects(4)、self-efficacy (4)、first language attrition(4)、metacognitive awareness(3)、attention(3)等。可以看出,近年来二语习得领域的学习者研究关注的重点有继承语、年龄、个体差异等方面。

三、 学习理论的高频关键词有:L2 processing (9)、processibility theory(5)、interaction (5)、language processing (5)、incidental acquisition (4)、input processing(4)、dyadic interaction (3)、L2 sentence processing(3)、processing capacity(3)、proceduralization(3)等。从这些高频关键词可以看出,信息加工理论及交互理论是近年二语习得研究中受到关注最多的学习理论。

四、 二语习得的外部因素方面:涉及教学因素的关键词依次有recasts(10)、instructed second language acquisition(6)、processing instruction (6)、corrective feedback(5)、focus on form(4)、written corrective feedback(4)、interactional feedback(4)、oral corrective feedback(3)、prompts(3)、form-focused instruction(3)。这些关键词表明反馈是教学方面的研究热点,这其中包括重铸式反馈、纠正性反馈、交互式反馈、口头及书面纠正性反馈等。涉及其它外部因素的高频关键词有:transfer(14)、crosslinguistic influence(5)、L1 transfer(5)、context(4)、input(4)、input frequency(4)、modified output(3)、study-abroad(3)、prompts(3)、L2 influence(3)等。这表明迁移是二语研究的热点。

五、 二语习得研究所涉语种有:ESL(31)、L2 Spanish(18)、third language acquisition(8)、L2 Chinese(8)、L2 French(7)、L2 Dutch(4)、L2 Russian (4)、L2 German (5)、L1 Spanish(3)、L2 Korean(3)、L2 Japanese(3)等。从这些关键词可以看出,近年来,二语习得研究涉及多个语种,其中,对英语和西班牙语的关注最多,其次是汉语、法语等其他语言。同时也可以看出,近年来汉语作为二语的习得研究受到很大的重视。

六、 研究方法或类型上的高频词有:classroom research (9)、meta-analysis (3)、think-aloud (3)、corpus linguistics(3)、task-based instruction(2)、classroom experiment(2)等。这表明,课堂研究是二语习得领域使用较多的研究类型。虽然一些研究并未把研究类型作为关键词,从而影响了本研究的分析结果,但据实际情况而言,课堂研究确实是二语习得最常用的研究类型。

七、 二语习得研究的相关学科:语言学方面有:Universal Grammar(9)、fundamental difference hypothesis (7)、noun phrase accessibility hierarchy(5)、pragmatics(4)、parameters(4)、aspect hypothesis (4)、gender agreement(4)、time in language(4)、complex adaptive system(3)等;认知科学方面有:working memory (5)、explicit knowledge (5)、incidental acquisition(4)、implicit knowledge(3)、proceduralization (3)、L2 perception (2)、retention(2)、intake(2)等;神经科学领域有:ERP(3)、neuroimgaing(2)、neuroanatomy(2)等;心理语言学领域有:psycholinguistics(3)、word association(3)等;社会学方面有:dyadic interaction(3)、language contact (2)等;心理学方面有:priming(4)等。这些关键词充分说明,二语习得研究与语言学、认知科学、心理语言学、神经科学等学科紧密相连,也充分说明二语习得研究的学科交叉性特征。

4.2 关于研究热点与前沿的可视化分析

为了更好地勾勒出近年来二语习得的研究结构,本研究运用社会网络分析软件对词频超过5次的关键词(共41个,高频关键词此表见表2)进行可视化分析(见图1)。

图1直观且清晰地勾勒了2006-2011二语习得研究领域的知识网络。整个知识图谱以second language acquisition为中心向外辐射。通过图谱,可以清晰地看出近年来二语习得研究涉及的主要语言有英语、西班牙语、汉语、法语等,研究中侧重对目的语的屈折变化、形态、形态句法、词汇、语法的性、关系从句、特征等语言本体特征方面的习得研究;对习得的外部因素的关注主要集中在迁移、母语迁移和跨语言影响等话题;对学习理论方面的研究主要集中在加工理论及与之相关的研究(如语言加工、二语加工等);对学习者特征方面关注最多的是年龄问题;对教学方面的关注主要涉及纠正性反馈、重铸式反馈对二语习得的影响等;语言学理论上则重点关注普遍语法、语法的性、根本性差异假说、名词短语可及性层级假说、功能特征等方面。

图12006-2011三种外文期刊高频关键词的共现图谱(词频≥5次)

4.3 2006-2011二语习得研究的热点和前沿分析

从词频分析和可视化共现图谱的结果可以看出,近年来,二语习得研究的热点和前沿主要有以下几个特征:

第一,重视句法层面的习得研究。通过观察高频关键词及其图谱可看出,近年来二语习得研究主要聚焦于句法层面,如关系从句的习得和名词短语可及性层级假设;此外,对形态、屈折、功能语类、语法的性、语义学等其他层面的习得研究也很多。

第二,重视对中介语语言学特征的描写。自Selinker于1972年提出中介语概念以来,中介语的语言学特征习得研究一直是二语习得研究关注的重心。据笔者统计,2006-2011关键词中直接包含中介语的词组有interlanguage pragmatics、interlanguage grammars、interlanguage phonology、interphonology等,相信随着研究的深入及对中介语特征的进一步系统归类,关于中介语的研究会取得更多的突破,对语言习得研究及语言学研究(如普遍语法理论)都有极大的帮助。

第三,重视对学习理论和学习者个体差异研究。根据高频关键词的统计分析可以看出,近年来二语习得研究重点关注的学习理论主要为是语言可加工理论和交互理论。而对学习者的个体特征的研究多集中在年龄及与之相关的关键期假设上,对其它因素如动机、态度、学习策略、认知风格等的关注不多。

第四,重视学科间的交叉研究。近年来,二语习得研究与与语言学、心理学、心理语言学、神经科学、社会学等学科的交叉研究发展显著。二语习得作为一种复杂的人文现象,同时也作为人类特有的一种高度复杂的认知过程,不可能仅从单一学科出发就能完成对其的认识,它需要从不同的学科中吸取营养。但这个研究过程绝不是各个学科的简单堆积,而是各学科之间的协同作战(戴炜栋2008),相互借鉴。二语习得研究只有不断地吸收借鉴各个学科有价值的研究成果为己所用,才能逐步完善对二语习得的认识,只有这样,有关二语习得的理论的研究才会有所突破、创新和发展。当然,二语习得研究并不只是简单地从各个学科索取,它还会对其他相关学科的研究和发展产生影响。如二语习得研究的成果可以进一步验证已有的学习理论或语言理论假设,可以帮助人类完善对语言习得机制的认识,揭示大脑工作的原理和智力活动的特性,进一步丰富对认知和语言规律的认识,对人工智能、计算机科学和机器翻译都大有裨益。

第五,重视基于课堂的研究,尤其是课堂反馈研究。课堂研究与关注课堂输入(如课程大纲、教学材料等)和课堂输出(如考试分数等)的研究不同,它把课堂教学过程作为研究对象,狭义上来说,课堂上的交互活动是其唯一的调查目标(Allright & Bailey 1991)。课堂研究的重心是了解课堂环境里的活动,如教师对学生的错误如何做出反馈、如何开展课堂内的交互活动、课堂环境里语言输入的类别、课堂内外师生的情感交互等。基于课堂的二语习得研究具有可控的特征,可以很好地从微观上了解词素、句法等方面的习得。此外,在课堂教学方面,除了侧重对输入的研究外,还较为关注课堂反馈,如纠正性反馈、重铸式反馈、交互式反馈、口语纠正性反馈及书面纠正性反馈等。

第六,涉及语种范围广,其中以英语、西班牙语和汉语作为二语习得的研究居多。近年来二语习得研究涉及的语种范围广,且有不少针对第三语言习得的研究。除了高频关键词中提到的语言(主要是英语、西班牙语、法语、汉语),二语习得涉及的语言还有德语、荷兰语、日语、韩语、意大利语等,其中对英语的关注最多,对西班牙的关注居其次(这可能与美国社会拉丁美裔人口多有很大关系)。另外,本研究发现,对汉语作为第二外语教学的二语习得研究也不少,这与近年来中国政府大力推广的对外汉语教学及国内对外汉语教学和研究水平的提高不无关系。此外,关键词中还包含不少对三语习得及三语语言特征的分析研究(其它词汇)。这说明,二语习得研究不仅关注儿童和成人在自然环境或教学环境中习得或丧失第二语言的现象,方言的习得或丧失(Douhty & Long 2003)、三语习得也在二语习得研究者的关注范围内。

5.总结

本研究还存在着一定的不足。首先,选择关键词作为分析的切入点,有以点带面的遗憾。其次,只选择三本外文期刊作为数据来源,因而分析尚不全面。期待未来能采用历时对比分析的方法来观察和预测二语习得这一重要及新兴学科研究的状况及趋势。

Allright, D.& K.M Bailey.1991.FocusontheLanguageClassroom:AnIntroductiontoClassroomResearchforLanguageTeachers[M].Cambridge: Cambridge University Press.

Doughty, C.J.& M.H.Long.2003.TheHandbookofSecondLanguageAcquisition[M].Oxford: Blackwell.

Ellis,R.1994.TheStudyofSecondLanguageAcquisition[M].Oxford: Oxford University Press.

Larsen-Freeman, D.& M.H.Long.1991.AnIntroductiontoSecondLanguageAcquisition[M].London: Longman.

Long, M.H.2012.Current trends in SLA research and directions for future development [J].ChineseJournalofAppliedLinguistics35(2): 135-52.

Selinker, L.1972.Interlanguage [J].InternationalReviewofAppliedLinguistics10(3): 209-31.

戴炜栋.2008.关于二语习得研究学科建设的几个问题——《二语习得研究与中国外语教学》序[J].山东外语教学(6):3-5.

戴运财、王同顺、杨连瑞.2011.跨学科的二语习得研究——对二语习得学科属性的思考[J].外语界(6):88-94.

乐眉云.2001.二语习得研究的多学科前景[J].外语研究(4):23-25.

马费成、张勤.2006.国内外知识管理研究热点——基于词频的统计分析[J].情报学报25(2):163-71.

王立非、江进林.2011."十一五"期间国家社科基金外国语言学立项热点及分布分析[J].外语教学与研究43(5):772-79.

杨连瑞、尹洪山.2005.发展中的二语习得研究[J].现代外语28(2):181-92.

猜你喜欢

词频二语语言学
体认社会语言学刍议
《复制性研究在应用语言学中的实践》评介
“透视”第二语言习得心理过程*——关于二语加工的一次学术访谈
25年来中国修辞研究的关键词词频统计*——基于国家社科与教育部社科课题立项数据
当代二语习得研究中介语对比分析方法理论与实践
认知语言学与对外汉语教学
《教学二语习得简介》述评
词频,一部隐秘的历史
二语习得中母语正迁移的作用分析
以关键词词频法透视《大学图书馆学报》学术研究特色