APP下载

自建小型学生作文语料库以及运用

2013-09-18邝计嘉蒋庆胜

大学英语(学术版) 2013年1期
关键词:词表语料库外语

邝计嘉 蒋庆胜

(四川省泸州医学院外国语学院,四川泸州 646000)

1.引言

语料库语言学是近30年来在国内外迅速发展起来的跨学科领域,在教学中引入大型语料库是当今外语教育发展的新趋势。现代外语教学不仅要求教育者具有良好的外语水平和教学能力,还要具备对语言教育和教学的研究能力(何安平2004)。 基于语料库的教学研究能够使外语教师们从理性思维的角度出发,运用计算机技术分析数据,从而科学地掌握教学规律,进行教学研究,而不仅仅是写一些个人的教学总结体会,或者是生搬硬套国内外教学理论来附会自己的教学经验。

语料库语言学应用于英语教学早已有之。mindt(1996)对LLC(英国口语语料库)的前12篇以英语为本族语的对话语料库为参照,发现德国中学的英语教学大纲中的语法排序与本族语中的实际运用存在不一致的情况。他(1997)又利用语料库为教材设计出some和any的教学安排方案。而建设学习者中介语语料库,并使用计算机检索工具作为辅助手段,能够快速准确地获取有关错误出现的频率、种类与语境多方面的信息。Ellis(1994)曾指出对外语学习者的语言差错分析必须基于定义准确的语料抽样,才能清楚地回答学生到底犯了哪些类型的错误,在什么样的情况下犯错等等问题。国内外已经建立的学习者大型语料库包括:1990年比利时卢迈大学英语语料库研究中心的S.Granger教授开始主持建立的高级英语学习者书面语料库ICLE(internationalcorporaoflearners’english)(Granger1994:25-29)1998年,她又开始主持建设国际英语学习者口语语料库LINDSEI(Granger2000),汇集来自法国、瑞士等多个国家的高级英语学习者的英语对话和独白语料。在我国,1997年,由广东外语外贸大学的桂诗春和上海交通大学杨慧中教授联合主持建立了超百万词次的中国大中学生英语作文语料库CLEC(见桂诗春2001),香港大学建立的TELECStudentCorpus(香港中学生书面英语语料库)(Allen1998)。南京大学外国语学院和外语教育与研究出版社共同建设的SWECCL中国学生英语口笔语语料库。基于这些语料库,研究者们也做出了一些研究成果。如李景泉,蔡金婷(2001)利用CLEC语料库对中国学生英语写作中冠词错误用现象进行分类,并解释出原因。王立非,鲁岩(2007)利用WECCL(中国学习者英文笔头作文语料库)和ICLE(中国学习者英文笔头作文语料库)以及LOCNESS(国际英语学习者语料库)相类比,对大学生英语论文中高频动词使用进行研究。

中介语语料库已经在中国蓬勃开展起来。但是由于中国东西差异较大,沿海和内陆差异较大,如CLEC,WECCL等语料库并不能很好地代表西部高校学生的水平。要了解本校或者是自己所教学生的作文水平或者语言水平,盲目借鉴CLEC等语料库的检索成果是不明智的。所以自建学生的小型语料库具有自身的可能性和必要性。

2.自建学生作文语料库

前期准备工作包括将作文题目布置好后,让学生将作文以学号命名汇总。由于语料库检索对语料库本身就具有严格的要求,如文本格式,字符空格,缩写词等等,这些要求事先都告诉学生,让学生养成良好的习惯,并且在某种意义上,都成为语料库前期的编辑者。针对教学重点,让学生对自己的作文进行赋码。比如,某次作文练习讲解的是作文功能词的运用,在写完作文后,教师指导学生自己将自己的作文的功能词标出并赋码。一是方便我的检查,二是考察学生是否自己能够识别并运用,培养学生元认知的能力。

3.运用该语料库可能进行的研究

3.1 字数检查一目了然

利用wordsmith中wordlist的一项功能,可以对学生作文的单词数,类符数,形符数,类符形符比,平均单词长度,每一个单词长度的单词数等等进行统计,信息一目了然,如图1。字数不够,词汇量过少等等一系列问题能够迅速根据相关数据判断出。

3.2 是否偏题

利用antconc对相关词语进行检索,比如此次笔者布置的一篇题为NothingSucceedsWithoutaStrongWill的四级作文,题目要求作文对“Quittingsmokingistheeasiestthingintheworld.I’vedoneithundredsoftimes.“进行评价。所以在antconc中,以smoking作为关键词,对concordanceplot进行检索,能够迅速看出学生作文是在哪一部分对这句有关smoking的句子进行评价,并且评价了多少次,有没有漏评。如图2所示。

3.3 N-grams查看高频词汇,查看学生语言学习的问题。

举例来说,用AntConc的N-grams进行检索时,可以对作文的高频词汇进行排序搭配,从而发现一些语言过度使用的现象。如本次作文中,笔者发现peoplethink处于N-grams的前列:80篇作文中Peoplethink共出现了38次。借此,笔者推断,学生对peoplethink在学生作文中有过度使用的倾向。对学生进行逐个访谈,询问他们为什么喜欢用这样的表达,是否有其他表达方式等等,对这一现象做出原因分析,并提出解决办法,详见另文。

3.4 Range的词表对照功能

外语教学中,我们常常会面对词表。教材背后的生词表,大纲要求的大纲词表。而在精读课文讲解,阅读理解练习、听力材料的选择时,我们需要对篇章中的词汇有所判定,如超纲词,活用词。而此种判定需要相应的基础词表,称为底表(basewordlist)(梁茂成等2010)。学生的作文语料库可以利用range生成总体词汇分布情况和单独每个学生的词汇分布情况。可以利用总体分布情况按照不同年级的维度进行区分,从而描述不同年级学生的词汇总体分布情况,探索学生的学习趋势和规律。也可以将单个词语出现的频率列出来,发现学生具体使用了什么词,用了多少频率。与额外制作的教材词表进行对比,可以发现,学生在多大程度上运用了新学的单词。对于一些抱怨新学单词用不上的同学,可以将语料库中出现了课文词汇的例句提出,进行示范讲解。

4.结论

语料库语言学的研究与统计学的概率有关,来源于真实的材料和数据。当代计算机的普及使得语料库的研究成为可能。本文总结的自建学生作文语料库的应用,是站在巨人肩上,借用前人开发的语料库工具,如wordsmith,antconc,range词表等,得出的数据能够验证或者提出学生平时学习的问题和自己教学中发现的问题。将学生的作文集结成库,利用语料库工具进行检索考察,获得客观的数据,远比自己根据教学反思总结得出来的抽象经验可靠得多。不足之处在于,语料库检索工具对语料库的格式要求比较高。这需要在收集学生作文时,便和学生把要求讲清楚,并自己再仔细按照要求进行检查。

何安平(2004).语料库在外语教育中的应用:理论与实践[M].广州:广东高等教育出版社出版。

何安平(2004).语料库语言学与英语教学[M].北京:外语教学与研究出版社。

梁茂成,李文中,许家金(2010).语料库应用教程[M].外语教学与研究出版社。

杨惠中,桂诗春(2001).中国学习者英语语料库[M].上海:上海外语教育出版社。

猜你喜欢

词表语料库外语
A Chinese-English List of the Sports Programmes in Winter Olympics 冬奥会项目名称汉英对照词表
《语料库翻译文体学》评介
外语教育:“高大上”+“接地气”
叙词表与其他词表的互操作标准
大山教你学外语
基于COCA语料库的近义词辨析 ——以choose和select为例
大山教你学外语
基于JAVAEE的维吾尔中介语语料库开发与实现
国外叙词表的应用与发展趋势探讨*
常用联绵词表