APP下载

基于Range软件的英语专业教材文本词汇分析

2020-04-29

乐山师范学院学报 2020年3期
关键词:大纲词汇量英语专业

李 瑞

(楚雄师范学院 外国语学院,云南 楚雄 675000)

教科书是核心教学材料,是教学大纲的具体表现形式,[1]也是学生在校学习并获得系统知识的主要材料和教师教学的重要依据。语言类教科书常常是某个学习阶段的内容载体,包括语言知识与语言技能等,为教学提供资源和工具的同时也为教师提供教学指南。因此,在英语教学中,教材的重要作用不言而喻。

近几十年来,我国编写出版了几十套供英语专业教学所用的教材,但只有几套英语专业教材经过不断的修订,被广泛使用。长期以来,国内学者对英语专业教材的研究范围偏窄,更多的是针对外语教材的评估标准[2]、编写理论[3]、编写方法[4]和手段[5]进行介绍或总结。其次,研究内容缺乏梯度和深度,偏重于英语教材研究的历史梳理[6]、教材评价体系的介绍[7-8];再则,研究方法欠科学。大量的研究采用定性分析的方式。近十年间虽有不少教材使用者从教学实践中的感悟和体会出发,分析评论了一些教材的特点、优势和不足[9-11],但即使是最新的《中国英语能力等级量表》[12]中,对各层级能力的分级分项文字描述也缺乏具体的量化指标。

总的来说,国内对英语专业教材的评估研究大多是宏观的或定性的,这使得英语专业教材评估失去客观的检查标准。对教材的选用更多的是秉承教师间的口口相传,领导的决定甚至是出版社的推广[13]。

在国外,教育部门鼓励教师根据自己和学习者的需要自编或改编教材,教师拥有对教材的决定权,而对出版社发行的教材一般不会进行系统性评估。与国外外语教材研究的基础不同,我国的英语教材都是基于统一的教学大纲,且都要对大纲负责。2000年,高等学校英语专业教学指导委员会制定了《高等学校英语专业英语教学大纲》(以下简称《大纲》),明确提出了对英语专业的教学要求和各单项的层级要求,其中,对词汇教学有明确的量化标准。

外语教学是为学习者提供适宜的语料输入,通过教学使学习者运用所掌握的语料进行语言输出的过程。输入性语料主要通过听和读的方式,而阅读则是最重要和有效的。承载语言意义的基础材料——词汇是影响阅读理解的主要因素之一。因此,阅读材料,即教材文本对英语教学有重要而深远的影响。本研究选取两套历经数十载教学和市场检验的英语专业教材:《新编英语教程》和《综合教程》(其后简称为《新编》和《综合》)作为研究对象,并选取每套教材中第一册的阅读课文(text 1和text 2)进行分析,以期解答以下问题:

1)教材文本是否提供了与大纲要求所一致的词汇量?

2)教材文本是否能给学生提供适宜的词汇学习机会?

一、研究方法

本研究使用I.S.P.Nation开发的Range程序(BNC版本)作为分析工具。该软件基于BNC语料库,从1亿词中按词频高低顺序提取14 000个词族,将每1 000个词族分为1词级,第1级所含的1 000词族是最高频的词族,第2级直至第14级的词频依次递减。开发这14层词级的理论依据是学习者通常按由高到低的词频顺序掌握词汇[14]。BNC语料库中还包括一个专有名词词表和感叹词词表,软件分析时也可以设置到分析条件中。BNC是目前最具权威的英式英语语料库,书面语料占90%,口语语料占10%。这与本研究以书面语语料为主的教材文本特征相契合,其分析结果将与《大纲》要求中的词汇量化指标和学生既有词汇量进行对比,以期解答以上研究问题。

首先,本研究将所选取的目标教材自建成小型语料库,分别是每套教材中第一册的阅读课文(text 1和text 2)。将《新编》共30篇,15 241个形符;《综合》共28篇,24 384个形符,作为本研究分析的语料。英语单词的形符包括以空格断开的英文单词、字母、缩略等,但不包括标点符号[15]。

随后,预处理自建小语料库,以排除Range进行语料分析时的干扰因素。预处理后的形符数为《新编》15 078,《综合》24 369。预处理具体包括:

1)拼写检测。修正文本转换时个别单词的拼写错误;同时为了匹配语料库词汇表中的英式英语,需要转换美式英语词汇,以免软件将该类词汇错判为“词表外类符”。

2)连字符替换。Range软件会将带连字符的复合词编入“词表外类符”列表中,但这些复合词中的单词大部分是前14层级的词汇。因此对语料库进行分析前,将连字符批量替换为空格。

然后,借助Nation和Beglar开发的“词汇量测试”工具[16]对本校入学的大一新生(129人)进行词汇量测试。该测量工具的开发是基于“14级BNC1000词族表”设计的。

二、结果及讨论

(一)教材词汇覆盖量统计和大纲要求的词汇量匹配度

I.S.P.Nation[17]认为:“词汇覆盖率是读者所认识的词汇在文本总词数中的比例,是判断文本能否被充分理解的最佳测量口径。”虽然词汇覆盖率对阅读理解的影响随文本类型变化而变化,但M.Hu[18],B.Laufer[19],N.Schmitt[20]等学者的研究均证明:词汇覆盖率和阅读理解之间存在线性关系,即阅读理解水平随着词汇覆盖率的提高而提高。针对二语学习者,认识文本中95%的词汇,基本能保证阅读理解,而要充分理解,则需要认识98%以上的词汇。换言之,在教材文本中,如果每50个词中有4个生词(覆盖率为92%),学生在字典或教师的帮助下理解文本是可接受的。

词汇学界的研究数据[21]还表明:最高频的1 000层级词汇(第1词级)约占一般文本78%~81%的词汇覆盖率,高频的第2和第3词级各占8%~9%,3%~5%;中频的第4和第5词级占3%;中频的第6到第9词级占2%;低频的第10到第14词级仅占文本的1%。

在《大纲》对英语专业学生各语言知识能力的要求中,对词汇量明确提出要求:“一年级学业完成后,应该掌握4 000~5 000认知词汇(包含中学已学2 000个),正确而熟练地使用其中2 000~2 500个及其最基本的搭配。”[22]由此可推断,一学期课程(第一册)学习后,学生的词汇量至少为4 000个,另外1 000个词汇的增加可在第二学期学习期间获得。为了使学生在第一学期结束时达到所要求的词汇量,根据以上提及的词汇研究数据,第一册教材文本中的词汇应该在第1词级到第4词级达到92%~95%的覆盖率,才能提供可理解性的语言输入和足够的词汇学习量。

表1 Range BNC对《新编》和《综合》第一册词汇覆盖率分析结果

注:?表示该类形符(《新编》75个,《综合》54个)在词级中未出现,Range软件无法统计数量。

根据词汇学研究[23],要考查文本中词汇量宜从词类入手。例如:在It is easy to say it correctly中有7个形符,但其中it重复,词类只有6个。因此基于词类计算词汇总量是比较科学、可行的。

从表1中,我们可发现两套教材均未在第1至第4词级时达到92%的最低词汇覆盖率,《新编》为82.75%(第1词级4.16%+第2词级21.33%+第3词级9.04%+第4词级48.22%),《综合》为82.05%(第1词级3.92%+第2词级20.66%+第3词级9.54%+第4词级47.93%)。另外,若两套教材所有词类都计算在内,只有《综合》达到了4 000以上,看似达到了大纲对教材文本词汇总量的要求,但两套教材较低的词汇覆盖率(82%左右,即每50个词中有9个生词)无形中增加了教与学的难度。

另外,两套教材在第4词级所占比例均陡然上升,说明教材设计者为了在较短的教学期间(一学期)后满足大纲对学生词汇量的要求,所选择的文本无形中放弃了前3 000个高频词(第1至第3词级)的覆盖率。如果在教材中没有针对高频词学习提供足够的语言输入,刚刚达到《大纲》入学要求(“认知词汇不少于2 000个,掌握1 200个左右的常用词和习惯用语及固定搭配”)的学生便很难在一学期后达到《大纲》中词汇教学一级的另外一个要求:“正确而熟练地使用其中2 000~2 500个及其最基本的搭配。”

虽然英语专业的学生还可以通过其他专业课程和课外阅读增加对高频词的接触,但对于基础偏低(原词汇量2 500左右)的学生,高频词(前3个词级)词汇覆盖率低的文本,不适宜其在基础阶段(大一)夯实基础,对其而言文本难度大(第4词级词汇覆盖率较高)。所以在实际教学中,从词汇覆盖率的角度分析,这两套教材更适合原词汇量大于3 000的学生开展语言学习;若从词汇总量来看,则只有《综合》达标。

从理想角度分析,该教材的编写情况自然衔接了高中毕业生的英语词汇水平和《大纲》的词汇要求。在《中学英语课程新标准》中明确表明至高中毕业,学生应该掌握3 000个单词和400~500个习惯用语或固定搭配。但能达到该毕业标准的学校多集中在经济发达地区,国内大部分地区的实际教学水平并未如此。楚雄师范学院英语专业生源来自全国各地,多集中于中西部地区。通过“词汇量测试”工具对楚雄师范学院大一新生进行测量后发现,新生的词汇量没有达到中学英语课程标准所示的毕业水平。如表2所示,只有个别的学生接近3 000,平均水平2 500都不到。

表2 大一新生词汇量描述统计结果

在生源质量中等偏下的地方本科院校中,针对这两套教材,学生给出“生词过多,影响理解”的评价(楚雄师范学院2017级用《新编》,2018级用《综合》)也显得合理。

(二)词汇复现率统计与词汇学习机会

研究表明在阅读中碰到同一个生词的频率会影响词汇学习[24]。只碰到一次的话是不会产生学习机会的,只有随着次数的增加,学习的潜在机会才会增加。S.Rott[25]研究发现,生词复现6次才可习得。R.Waring[25]等研究认为非目的性的学习至少要20次的复现率才能习得生词。由于教材文本是基于课堂教学,是有目的地学习,所以本研究复现率统计组距最大设定为“10以上”。

此外,针对复现率统计,词汇测量单位采取的是词族,而不是前个研究问题中的词类。词族包括词头和它的屈折(语法)形式及派生形式。研究表明,习得某词族中的一个单词将有助于习得该词族中的其他单词[27]。例如,学习者知道safe,他就能在文本阅读中识别出safely,safer,safest,safety,unsafe等和safe属于同一词族的词汇,也更容易习得。所以在统计输入性语料的词汇复现率时,词族是个合理的测量单位。

根据前面的数据分析,高占比的词类和词族均集中在第4词级,因此针对两套教材在该词级的词族复现率进行统计,更能探究教材文本是否能给学生提供适宜的词汇学习机会。

表3 属于第4词级的词族复现率

如表3所示,10次以上的复现率,《新编》仅为17.4%;而《综合》却相反,达到26.9%。即使是考察5~7次的复现情况,《新编》的复现率14.3%也低于《综合》的14.8%。通过以上分析,在提供词汇学习机会方面,《综合》比《新编》更适宜。但数据也显示,两套教材中低于5次复现的词族均占到了一半以上(《新编》60.9%,《综合》53.2%),这说明只通过教材的学习,一学期后学生只能掌握一半的生词,也就无法达到预期增加1 000词汇量的需求,达不到《大纲》的要求。因此在实际的教学中,教师可利用词频分析工具,明确低复现率的词族,通过设计多样化的练习形式来弥补复现率低所带来的的词汇学习困难。

本研究基于Range软件,对《新编英语教程》和《综合教程》第一册进行了词汇量化分析,检验其词汇覆盖率和词族复现率,对照《大纲》词汇教学要求,对比分析了两套教材的文本词汇特征。结果显示,两套教材均增加了中频词(第4词级)的占比,基本符合英语专业《大纲》词汇教学的一级要求,但其低复现率说明只依赖教材文本的学习无法达到《大纲》要求的词汇量标准。同时,高频词(第1至第3词级)词汇覆盖率低、第4词级的高占比也忽视了《大纲》中词汇教学的入学要求,高估了学生的入学水平,不利于生源基础较差学校的教学。在教学过程中,教师除了要针对教材中低复现率的词汇设计学习机会,还需要额外提供给学生大量的高频词占比高的输入性语料,以便学生夯实基础。这无形中给教学增加了很大的负担,导致教学效率低,效果差。但若单从词汇分析的角度选择,《综合》每单元学习后设计了大量的词汇练习,更有助于教学。

本研究只选取了两套教材的第一册进行文本分析,语料库方面还有待进一步的充实。笔者将在今后的研究中备齐两套教材的册级,除了对比分析教材间的差异,还应进一步分析教材内部册级之间的衔接。也期待其他志同道合之士能针对英语专业教材开展各种形式的量化研究,为一线教师的实际教学提供数据支撑和教改依据。

猜你喜欢

大纲词汇量英语专业
50个重要的知识点 一份“学习大纲”帮您梳理党的二十大报告
交互式教学在英语专业阅读课改中的应用研究
论英语专业语法教学中三种思辨能力的培养
用词类活用法扩充词汇量
Receptive and Productive Vocabulary in Language Teaching
紧贴实战落实《大纲》要求推进航空体育训练创新发展
西方修辞教育传统及其对我国英语专业教育的启示
词汇量测试对语言水平的预测性的实证研究
英语专业泛读课教学探究
单词记不住怎么办:8种方法助你提升词汇量