APP下载

专业学术英语词汇表编制及其在EAP教学中的应用

2011-08-15

重庆与世界 2011年1期
关键词:词频语料语料库

张 敏

(北京信息科技大学外国语学院,北京 100192)

专业学术英语词汇表编制及其在EAP教学中的应用

张 敏

(北京信息科技大学外国语学院,北京 100192)

以基于词频的英语词汇分类方法和Coxhead学术英语词汇表(AWL)的开发经验为基础,探讨了运用语料库分析软件编制专业学术英语词汇表(SAWL)的主要方法,包括专业语料库的创建、词频统计及词表的生成与分析。专业学术英语词汇表对于外语教师掌握学习者的专业学术英语词汇量、评估学术用途英语教学内容的词汇负荷量、进行专业学术英语的体裁教学均具有较强的实用性和使用价值。

学术英语词汇;语料库;学术用途英语

词汇习得一直以来被看作是语言学习中的一个关键组成部分,词汇掌握的广度和深度将直接影响语言使用者是否能够有效地理解各种形式的语言输入,同时自如、准确、充分地运用语言完成描述、概括、分析、阐释等语言输出行为。与此同时,掌握一门外语的词汇对外语学习者来说是一项普遍令人生畏的任务,特别是当学习者将目标设定为获取较高的外语读写能力[1]。Nation(2006)通过词汇量测试推算,受过良好教育的英语本族语使用者能够掌握大约20000个词族(word family),而使用英语进行专业学术学习的非英语本族语使用者掌握的接受性词汇大约为8000~9000个词族[2]。由于词族是指由同一词根(word base)通过附加前缀或后缀构成的一组单词,语言使用者可接触到的词汇量远大于此,但这些词汇在人们的语言实际运用中出现的频次存在差异,对于循序渐进的外语学习者的词汇学习而言也具有不同意义。随着20世纪80年代开始大规模计算机语料库的陆续创建和数据驱动的语言学研究方法的普及,研究者们得以通过定量的方法对词汇进行更客观准确的统计。将词汇按照使用频次来划分,成为语料库方法下词汇研究的重要成果,对于外语教学也具有重要的指导意义。

一、基于词频的英语词汇分类

Coxhead&Nation(2001)将英语词汇划分为四类,即高频词汇、学术词汇、专业词汇和低频词汇[3]。高频词汇涵盖口语及各类书面语中的大部分常用词汇,最具代表性的是由West(1953)提出的一般用途英语词汇表GSL(General Service List),其中包含英语中最为常用的2000个词族,覆盖了英语口语中大约90%~95%和书面语中80%~85%

的用词,可满足日常一般用途英语的使用需要[4]。因此, GSL已被广泛视为英语学习者,特别是英语初学者应率先掌握的词汇。在此基础上,中高级英语学习者,特别是将英语用于学术用途的学习者,应将注意力转移到学术英语中的常见词汇上来。学术英语词汇,也被称为半专业词汇或广泛应用于各类学科的高频通用性学术词汇。Campion &Elley(1971)搜集了大学生在大学学习中可能遇到的最常用500词和常用3200词[5]。Praninskas(1972)基于选自10个学科的10本大学教科书中的272466个词汇,编制了美国大学词汇表(American University Word List)[6]。Xue &Nation(1984)总结了大学词汇表UWL(University Word List),搜集了学术语篇中除GSL以外约800个常见高频学术词族,覆盖了典型的学术语篇中约8%的词汇量[7-8]。

随着计算机语料库语言学的兴起,研究者们陆续开始借助语料库分析软件对学术词汇进行统计和分析,其中最具代表性的是由Coxhead(2000)通过Range软件开发的学术词汇表AWL(AcademicWordList)。该词表基于人文、经济、法律、科学4个大类、28个学科教科书及学术期刊350万词的学术英语语料库,共计570个词族,3107个类符,并按使用频率划分为10个子词表,可涵盖除GSL以外学术语篇中出现的约10%的词汇[9]。AWL一经提出,由于其涵盖的学科门类广泛,通用性强,具有较好的普适性,即被视为由一般用途英语向学术用途英语学习过渡阶段提高词汇量的一条有效途径。AWL与GSL两者结合可覆盖学术语篇90%以上的词汇。除此以外,学术语篇还包括大约5%的专业词汇,以及其它5%出现频率更低的英语词汇。

二、基于AWL的专业学术英语词汇表编制

AWL基于语料库分析软件开发的模式和经验得到了众多研究者的关注和肯定,同时也促进了基于语料库的学科专业学术英语词汇研究。在Hyland&Tse(2007)进行的学科间学术英语词汇的语篇覆盖率对比研究中,AWL学术词汇在计算机科学专业的语篇覆盖率高达16%,而在生物学专业的语篇覆盖率仅为6.2%[10]。Martinez(2009)建立了由826,416词组成的农业研究论文语料库,并通过Wordsmith Tools(WST)进行分析,结果发现AWL包含的3107个类符当中仅有1941个出现在所建语料库中,而其中出现频率最低的740个类符仅占整个语料库中形符总数的1.98%[11]。学术词汇和专业词汇之间的实际界限也较为模糊,一定数量的专业词汇使用频率甚至超过了AWL当中的某些通用学术词汇,而不同专业的通用学术词汇的使用频率也有所差异。因此,针对特定专业建立中小型专业语料库,开发专业学术英语词汇表SAWL(Specialized AcademicWord List)将有助于语言教师总结专业学术英语在词汇、词汇语法结构、修辞等方面的使用规律,更好地将研究成果应用到实际的英语教学中去,并使之具有更强的针对性和实用性。

基于AWL的专业学术英语词汇表的开发和编制主要遵循以下原则与步骤:

(一)创建专业语料库

Coxhead(2000)AWL的开发基于涵盖28个学科350万词的学术英语语料库。在此基础上,Nelson(2000)创建了基于商务英语教材、商业刊物、商务信函合同等约60万词的商务英语语料库,并在互联网上建立了商务英语词汇表[12];Mudraya(2006)创建了工程类专业英语语料库,涉及电子工程、材料学、力学等专业约200万词的学术语篇全文,并通过WST软件分析提取了由1260个词族构成的工程专业学术英语词汇表[13];Wang等(2008)创建了规模约为100万词的医学研究论文语料库,涉及32个医学专业,发表自2000—2006年的288篇论文,从中提取了由623个词族构成的医学专业学术英语词汇表[14];Martinez(2009)以AWL为基础,自建由218篇论文组成的80万词的农业研究论文语料库,通过WST筛选提取了农业专业最常用学术英语词族92个[11]。

因此,当代专门用途英语语料库呈现出专门/小型化的发展趋势,“语料的体裁或主题更加专一化,语料库的规模相应较小”[15],“只要语料库精心设计、低至几千词、高至几十万词的语料库都有助于专门用途语言的研究,其中的关键是要保证语料库的开放性、语料数据的充足、语料作者的多元化、以及语料与研究目的紧密关联”[16]。专业学术英语语料库的语料多选自专业期刊、教科书、报告、项目书等文本,选取时应遵循客观性、随机性和均衡性原则,尽量避免所选语料的作者、主题、篇幅、写作时间及语料选取者的个人因素等对语料分析形成过多干扰,影响语料分析结果的可靠性和可信度。根据拟建语料库涵盖的专业范围和建库的研究目的,专业学术英语语料库的实际大小可在几十万至几百万词之间。

在建库语料搜集完毕之后,应对语料进行一些必要的处理,例如将搜集的语料转化为纯文本格式,并按照统一的命名规则对其逐个进行命名,以便日后查找。对于按照IMRD模式(Introduction-Method-Results-Discussion)(Swales 1990)撰写的学术论文或可将文本按语步进行划分的语料,还可将各部分分别进行保存,以对比在不同语步写作中学术英语词汇的使用情况[17]。与此同时,还应剔除图表、公式、参考文献等与词汇处理分析无关的内容。

(二)词频统计

在对语料进行词频统计时,可利用常见的语料库分析软件,如Words mith Tools,Range等,通过截词将GSL词汇过滤出去,并可将AWL设为匹配词表(match list),将其余词汇与AWL词汇进行比对,可发现AWL统计的词频和所建专业学术英语语料库中学术词汇使用频率的异同。例如经词频统计,Martinez(2009)发现其提取的农业学术英语词汇表最常用60词族中仅有significant,analysis,data, variation,indicate,estimate,specific,factor,identify,function, distribution,derived等26个词族与AWL最常用子词表1内60个词族重叠,也从一个侧面说明专业学术英语词汇表与专业的相关性更高,对专业学习更具针对性。

在词频统计中,专业学术英语词汇选择通常遵循两个主要标准,即范围(range)和频率(frequency)。在AWL的编制过程中,最终进入词表的词汇应不包含GSL,且能够覆盖建库28个学科中一半以上学科语料,即保证入选词汇使用范围的广度。与此同时,入选词汇还应达到一定的使用频率要求。在AWL所建350万词的学术英语语料库中,最终统计生成的学术英语词汇在语料库中的使用频率至少应达到100次以上,而高频学术词汇的使用频率可达数千次。Hyland&Tse(2007)在进行跨学科学术英语词汇词频统计时,将学术英语词族使用的平均数作为高频学术英语词汇的标准,并统计得出了192个高频学术英语词族[10]。因此,在自建专业学术英语语料库基础上进行词频统计时,建库者可根据实际需要来设定词汇筛选统计的范围和频率标准。

(三)词表生成与分析

通过语料库软件对语料的分析处理,研究者可获得抽取语料中有关形符、类符、词族总数等基本数据,也可通过匹配词表或Range软件直接将词汇划分为GSL、AWL及其它词汇。结合之前设定的词频统计标准,可从中统计出AWL词汇在所建专业学术英语语料库中的使用情况,以及未包含在AWL词表中具有本专业特色的专业学术英语高频词汇。在此基础上,还可以根据所选语料的文体、主题、写作时间、作者类型等变量,对专业学术英语词汇进行更为具体的研究。

四、专业学术英语词汇表(SAWL)在EAP教学中的应用

专业学术英语词汇表(SAWL)的开发不仅对于词汇研究者来说具有重要价值,对于学术用途英语(EAP)教学也具有实际的指导意义。学术用途英语作为特殊用途英语(ESP)的一个分支,已成为国内外众多高校面向中高级学习者的英语教学以及英语水平测试的重要内容,旨在提高英语学习者使用英语进行学术学习、研究、交流等具有明确语言交流目的活动的能力。

专业学术英语语料库的建立和相应词汇表的编制将有助于英语教师:

(一)掌握学习者的专业学术英语词汇量(vocabulary size)

通过基于SAWL的词汇量测试,教师将能够了解学生目前实际的专业学术英语词汇掌握水平,找到学生在词汇学习中的薄弱环节,为展开学术英语系列课程,例如学术英语阅读、学术讲座听力、学术英语交际、学术英语写作等做好基础性的准备。学生也可从中较为直接地了解从一般用途英语向学术用途英语学习的过渡中如何进行有的放矢的学习。由于SAWL涉及学习者在本专业学习中的高频学术词汇,针对SAWL词汇的学习能够在学生的专业英语学习中得到强化和印证,也提高了学生学习英语的工具性意识和学习自主性。

(二)评估教学内容的词汇负荷(vocabulary load)

一系列的观察和实证研究发现对于将英语用于学术用途的学习者来说,造成词汇困难的不是一般用途词汇,也不是与学科高度相关的专业词汇,而是介乎两者之间的学术词汇[18]。通过编制专业学术英语词汇表,可以将学术词汇和专业词汇有效结合在一起,同时通过语料库分析软件的处理,将所建SAWL设为匹配词表,可高效率的实现教学内容中专业学术英语词汇有关覆盖范围和出现频率的统计。教师可根据统计得出的结果决定教学内容的选择、取舍、次序的安排等,引导学生进行循序渐进的学习。

(三)进行基于SAWL的专业学术英语体裁教学

专业学术英语词汇大多较为正式,具有较强的学术气息,为语言使用者提供了一套具有学术话语社团特色的词汇框架与修辞手段,是构建学术语篇体验的重要途径之一。基于语篇体裁和语步词汇使用特点的语料库分析也是AWL和SAWL开发的拓展研究方向。例如,通过语料库软件对不同学术文体或同类语篇内不同语步进行词汇分析,如学术词汇在论文导言、文献综述、实验方法、结果分析、结论等各语步的高频词汇分布,有助于学生在学术英语的学习中提高语类意识,并养成观察语言使用规律的习惯,并通过实际的语料积累相关文体或语步的词汇使用特点和写作范式,提高学生使用专业学术英语的实际运用能力。

基于语料库语言学研究方法的专业学术英语词汇表(SAWL)的编制对于广大语言教师而言结合了词汇研究和实际的学术英语教学两个方面,并且能够做到互为促进,使得外语教师既成为专门用途语料库的建库者,又成为语料分析研究结果的直接受益者。大学学术英语教学作为大学基础英语教学的延伸已引起越来越多外语教学研究者和教师的关注,学术词汇表和专业学术英语词汇表对于大学生顺利完成基础英语向专门用途英语的过渡,突破用英语进行学术学习、专业学习中的词汇瓶颈障碍,将发挥十分重要的基础性作用。

[1]Cobb T,HorstM.Is there room for an Academic Word List in French?(Draft chapter)[Electronic version]. In:B.Harley&J.Hulsteijn(Eds.),Vocabulary in a second language:selection,acquisition&testing,ProceedingsofHaifa-Leidenconferenceon vocabulary,2002.

[2]Nation I S P.How large a vocabulary is needed for reading and listening?The CanadianLanguage Review,2006, 63,1:59-82.

[3]Coxhead A,Nation P.The specialized vocabulary of English for academic purposes.In J.Flowerdew&M. Peacock(Eds.),Research perspectives on English for academic purposes.Cambridge:Cambridge University Press,2001.

[4]WestM.A general service list of English words.London:Longman,Green&Co.,1953.

[5]Campion M,Elley W.An academic vocabulary list. Wellington:New Zealand Council for Educational Research,1971

[6]Praninskas J.American university word list.London: Longman,1972.

[7]Xue G,Nation P.A university word list.Language Learning and Communication,1984,3(2):215-219.

[8]Nation I S P.Teaching and learning vocabulary.New York:Newbury House,1990.

[9]Coxhead A.A new academic word list.TESOL Quarterly,2000,34(2):213-238.

[10]Hyland K,Tse P.Is there an“academic vocabulary”? TESOL Quarterly,2007,41(2):235-253.

[11]Martinez I A.Academic vocabulary in agriculture research articles:a corpus-based study.English for Specific Purposes,2009,28:183-198.

[12]NelsonM A.Corpus-based study of business English and business English teachingmaterials[Electronic version]. Unpublished PhDThesis.Manchester:University of Manchester,2000.

[13]Mudraya,O.Engineering English:A lexical frequency instructionalmodel.English for Specific Purposes,2006, 25(2):235-256.

[14]Wang,J.Liang,S.&Ge,G.Establishment of a medical academic word list.English for Specific Purposes, 2008,27:442-458.

[15]黄大网,秦弈,徐赛颖.专门用途英语语料库:挑战、理据与愿景[J].宁波大学学报:人文科学版,2010,23 (5):48-52.

[16]Bowker L,Pearson J.Working with Specialized Language:A practical Guide to Using Corpora[M].London and New York:Routledge,2002.

[17]SwalesJ M.Genre analysis.English in academic and researchsettings.Cambridge:CambridgeUniversity Press,1990.

[18]Lam J.A study of semi-technical vocabulary in computer science texts,with special reference to ESP teaching and lexicography(Research reports,Vol.3).Hong Kong: Language Centre,Hong Kong University of Science and Technology,2001.

(责任编辑周江川)

H319.3

A

1007-7111(2011)01-0100-03

2010-11-10

北京信息科技大学教改项目“基于语料库的大学生学术英语读写教学模式的探索与创新”(029923810)

张敏(1979—),女,讲师,硕士研究生,研究方向:语料库语言学、专门用途英语教学。

猜你喜欢

词频语料语料库
基于语料库的清末民初日源外来词汉化研究
面向低资源神经机器翻译的回译方法
《语料库翻译文体学》评介
可比语料库构建与可比度计算研究综述
词汇习得中的词频效应研究
汉语阅读中词频与注视时间、跳读的关系
词频,一部隐秘的历史
国内外语用学实证研究比较:语料类型与收集方法
语篇元功能的语料库支撑范式介入
汉语音节累积词频对同音字听觉词汇表征的激活作用*