APP下载

大学英语教学要求视域下四六级真题词组特征分析

2015-11-27周加林

肇庆学院学报 2015年4期
关键词:真题跨度词组

周加林

(肇庆学院 外国语学院,广东 肇庆 526061)

一、研究背景

词组,是英语中具有固定意义的多词组合。词组具有多种称谓:“语串”“词组”“词汇短语”“统计短语”“多词项”“词丛”“语链”和“语块”等[1]9,还有研究者将其称之为“预制语块”。研究者通过语料库的数据发现,大约有70%的自然话语都是由预制语块构成的。也就是说,人们实际使用的语言是通过储存在记忆中的语块来实现的[1]14。对词组或语块的掌握直接影响语言使用者的语言交际能力,它决定了语言使用的正确性、连贯性和流畅性,可见,词组的应用能力是语言能力的重要组成部分。国家教育部高等教育司《大学英语课程教学要求》(以下简称《课程要求》)列出的共有1 870个词组的“大学英语词组表”,对大学生的英语词组应用能力提出了一般、较高和更高三个不同层次的要求,根据这三个不同层次的要求,大学生应掌握的英语词组数量分别为700个、1 200个和1 870个[2]。大学英语四六级考试是以《课程要求》为设计依据的大学英语水平考核体系。《课程要求》词组表中的词组(以下简称《课程要求》词组)在四六级真题中的实际应用数据是很值得探讨的问题。本研究通过中国知网数据库以“四六级真题”“词组”和“词块”作为关键词进行了检索,结果表明在近10 年来有相当数量的、与英语词组研究相关的论文发表在不同的学术期刊上,但暂未发现针对《课程要求》词组在大学英语四六级真题的应用特征做系统性研究的论文或其它研究成果。因此,本文运用语料库检索的研究方法,依托计算机软件对2006 年6 月至2014 年6月的大学英语四六级真题进行了统计与分析,以观察《课程要求》词组在四六级真题中的应用数量、频率、跨度、类别和结构等特征,以填补这一研究领域的空白。

二、研究设计

(一)研究的对象与目的

《课程要求》是国家教育部针对大学英语的教与学而设立的标准。大学英语四级考试是衡量大学生是否具备《课程要求》中所规定的“一般要求”的测试体系,而大学英语六级考试则是检验大学生在英语上是否达到“较高要求”和“更高要求”的测试体系。本文的研究对象为2006年6月至2014年6月大学英语四级真题与六级真题各25套,共50套,目的是通过统计分析观察《课程要求》词组在过去9年来在四六级真题中的应用特征,从而检验《课程要求》词组在四六级真题中的应用是否符合《课程要求》中所提出的各项标准。

(二)研究的问题

1.四六级真题中《课程要求》词组的应用数量。

2.四六级真题中《课程要求》词组的使用频率与跨度。

3.四六级真题中《课程要求》词组的重合度比对分析。

4.《课程要求》词组及四六级真题中《课程要求》词组的类别及结构特征。

(三)研究的工具、方法与过程

本研究使用的计算机软件主要有三个:Antconc3.4.3w,Range 和Excel。Antconc 是由日本早稻田大学科学工程学院科学工程英语教育中心的Laurence Anthony博士开发的一款绿色免费语料库检索工具[3]。从庞大的语料中检索提取某个词语或短语的所有词条,是Antconc 的基本功能。Antconc 的检索分为基本检索和高级检索。基本检索功能可以实现对固定词和词组的检索[4]。Range是由新西兰维多利亚大学语言学与应用语言学院的Paul Nation 与Averil Coxhead 教授设计,由Alex Heatley 编程的免费软件。该软件可通过系统自带的、或者是研究人员自制的基础词表(Baseword Lists)来分析文本中的词汇情况;可统计出基础词汇表中的单词在文本中出现的频率(frequency)、单词在不同文本中的使用跨度(range),等等[5]。Range是用于词汇检索的工具,本身并不具备对词组的检索功能,但是经过人工的特殊处理(将基础词表和语料中的各词组内的单词用连字符连接起来使系统默认该词组为一个单词),也可以达到检索词组的目的。Excel 是微软公司Microsoft Office 办公软件系列的一个子软件,主要用于数据的统计、计算和排序。

本研究首先将2006 年6 月至2014 年6 月的50套四六级真题(含听力原文、译文以及作文的参考答案)输入计算机并保存为适合计算机语料库检索软件使用的纯文本(txt)格式备用。将《课程要求》词组表的词组存为纯文本格式作为对语料检索的基础词表。在制作基础词表的过程中,本研究在基础词组表中加入了所有动词词组的屈折形式,以便Antconc可以把语料中同一词组的各种变化形式都能统计在内。例如:在fall off 这个词组下增加了falls off,fell off,fallen off和falling off四个词组。这样,语料中fall off这个词组无论以何种形式出现都会被软件检索出来。

本研究将已经转化为文本文档的四六级真题逐套导入Antconc 的语境共现(concordance)栏中,将《课程要求》词组表的词组作为对语料进行检索的目标,软件检索之后会把语料中出现过的基础词表中的词组以高亮方式显示出来并报告检索出的词组总数,从而获得《课程要求》词组在各套真题中的应用数量(含词组的屈折形式以及重复使用的数据)。为了能够在Range软件中统计各套真题中《课程要求》词组的使用跨度和频率,本研究将在Antconc检索到的词组以及《课程要求》词组表里的词组都进行了人工处理(即用连字符将各词组内的单词连接起来),使Range软件在统计时将一个词组视为一个单词来进行统计。本研究首先将50 套四六级真题中所使用过的《课程要求》词组的文本文档逐套导入Range,以自制的《课程要求》词组表作为基础词表对其进行检索,排除了词组的屈折形式和重复使用的数据,得出词组在各套四六级真题中实际应用的数量。

最后,将25套四级真题的《课程要求》词组作为一组被检索的语料,而将25 套六级真题的《课程要求》词组作为另一组语料,分别导入Range中,以《课程要求》词组表作为基础词表对被检索语料进行再次检索,从而得出《课程要求》词组在历年四六级真题中的使用频率和跨度等相关数据。经过使用Excel软件对各种检索结果的排序整理,得到各种数据与结果。

三、结果与分析

(一)四六级真题中《课程要求》词组的应用数量

运用上述方法对2006 年6 月至2014 年6 月的50套四六级真题进行分析处理,《课程要求》词组在四六级真题中的应用情况如图1所示。

图1 《课程要求》词组在历年四级与六级真题中应用数量统计柱状图

图1 表明:在25 套四级真题中,每套真题使用的《课程要求》词组大致在100~110 个之间;而25套六级真题中,每套真题使用的《课程要求》词组约在100~120 个之间。另外,在25 套真题中,有7 套六级真题的《课程要求》词组的数量少于同年同月的四级真题。其中,2010 年6 月的六级真题中,《课程要求》词组的应用数量比同年6 月的四级真题少了80个。以上数据说明两个问题:

1.在每套四级或六级真题中,总数为1 870个的《课程要求》词组只有100 多个得到了应用,这样的应用量大约等于《课程要求》词组表中词组总数的6%左右。这表明在各套四六级真题中只有少量的《课程要求》词组得到了应用。《课程要求》词组在单次考试中的使用率相对偏低。

2.大学英语六级是考核学生是否具备“较高”或“更高”能力的测试体系,其试题的难度应该比大学英语四级考试更高。但是,在9 年的25 套试题中,大部分六级真题的《课程要求》词组的应用数量与同年同月的四级真题非常接近;另有7套试题的《课程要求》词组的数量低于同期的四级真题,这样的现象显然不符合常理,表明六级真题在词组考核的难度上没有与四级真题拉开应有的距离。这只能说明六级真题的设计,至少在考核词组应用能力的试题设计方面尚有待改善。

(二)四六级真题中《课程要求》词组使用频率与跨度分析

通过分析处理,《课程要求》词组在四六级真题中使用频率情况如表1所示。

《课程要求》词组在四六级真题中使用跨度情况如表2所示。

表1 与表2 数据统计显示:大部分四级真题与六级真题中的《课程要求》词组使用跨度和频率都相对较低。在使用跨度方面,只在1 套至5 套四级真题中使用过的《课程要求》词组为563 个,占使用过的《课程要求》词组总数量的82%。在1至5套六级真题中使用过的《课程要求》词组为609 个,占六级真题中使用过的《课程要求》词组总数量的81%。在使用频率方面,86%的《课程要求》词组在四级真题中的使用频率为1~9 次,87%的《课程要求》词组在六级真题中的使用频率为1~9次。大部分的《课程要求》词组使用频率和跨度都比较低说明四级与六级真题文本的内容都比较丰富,每套试题的内容都不雷同,所以才会出现每次考试所使用的词组都不一样的现象。

表1 四六级真题中《课程要求》词组使用频率统计表

表2 四六级真题中《课程要求》词组使用跨度统计表

(三)四六级真题中《课程要求》词组的重合度比对分析

使用Range软件,将每套四级真题使用过的《课程要求》词组作为Range的基础词表,将同年同月的六级真题使用过的《课程要求》词组作为检索对象,导入Range后得出表3中的各项数据。

表3 六级真题《课程要求》词组与四级真题《课程要求》词组应用重合度对比统计表

从统计结果发现,《课程要求》词组在25套四级真题与25 套六级真题中的重合度约为30%,有约70%以上的词组为非重合词组并在历年的考题中基本保持这一比例。词组重合度小,说明两个级别的试题文本内容存在差异。同时,在历年25套试题中均基本保持这一比例,显示了试题设计的稳定性。

(四)《课程要求》词组表词组与四六级真题的《课程要求》词组的类别特征与结构特征对比

为了观察四六级真题应用过的《课程要求》词组的在类别特征与结构特征上是否与《课程要求》词组表里的词组相同,本研究用Excel 软件把历年50套四六级真题使用过的《课程要求》词组以及《课程要求》词组表里的词组进行筛选排序后,得出如下统计结果(见表4,表5):

表4 四六级真题中《课程要求》词组与《课程要求》词组表词组的类别特征

在表4 中,我们用A 表示四级真题中《课程要求》词组数量;B 表示占词组总数的百分比比例;C表示六级真题中《课程要求》词组数量;D 表示占词组总数的百分比比例;E 表示《课程要求》词组表词组数量;F表示占词组总数百分比比例。

表5 四六级真题中《课程要求》词组与《课程要求》词组表词组的结构特征

在表5 中,用A 表示四级真题中《课程要求》词组的数量;B表示占词组总数的比例;C表示六级真题中《课程要求》词组数量;D表示占词组总数比例;E表示《课程要求》词组表词组的数量;F表示占词组总数比例。

表4与表5数据显示,四六级真题应用过的《课程要求》词组与《课程要求》词组表中的词组在类别与结构特征上基本相符。动词词组在三者中的比例都超过50%,其次为介词词组,占21%~26%左右。在结构上二词词组在三者中数量最多,约占词组总数的62%~73%,三词词组占21%~27%左右,四词词组约占5%~8%。这些数据信息对大学英语教师把握《课程要求》词组的教学重点以及广大考生复习掌握《课程要求》词组备考四六级具有一定的参考价值。

四、结论

本研究将《课程要求》中的“大学英语词组表”作为语料检索的基准,利用计算机软件对25套四级真题以及相同套数的六级真题的文本进行了检索、筛选和排序后,发现在9 年来的50 套四六级真题中,每套考题里只有约6.4%的《课程要求》词组得到了应用。25 套四级真题应用过的《课程要求》词组相加后为684 个,基本达到《课程要求》中大学生需掌握700个词组的“一般要求”。问题比较明显的是25套六级真题,首先在《课程要求》词组的应用数量上与四级真题并无太大的差别,有7 套六级真题的《课程要求》词组数量甚至还少于同年同月的四级真题的词组数量,这明显是不合理的倒挂现象。25套六级真题应用过的《课程要求》词组共743 个,距《课程要求》规定的大学生需掌握1 200个词组的“较高要求”相差甚远,更无法达到《课程要求》规定的大学生需掌握1 870个词组的“更高要求”。这是六级真题在考核词组能力的试题设计方面存在的比较明显的瑕疵。

另外,本研究发现80%以上的《课程要求》词组在四六级真题中呈使用跨度窄、使用频率低的状态,说明四级与六级真题的文本内容的丰富性,文本没有雷同现象。在同年同月的四级与六级真题的比对中发现《课程要求》词组使用的重合率仅为30%,非重合词组约为70%左右,从另一角度说明四级真题与六级真题文本内容的差异性。

本研究还发现,在词组类别上动词词组和介词词组占四六级真题中所应用过的《课程要求》词组总数的70%以上。在词组结构上二词词组的数量占四级真题《课程要求》词组使用总数的73.54%,在六级真题中,二词《课程要求》词组的数量占使用总数的72.27%。四六级真题的《课程要求》词组的类别与结构特征与《课程要求》词组表的词组特征基本一致。这提示大学教师和考生:在《课程要求》词组的教与学中,动词词组、介词词组以及二词词组是需要注意和把握的重点。

研究者期待本研究的数据可以为四六级试题设计者提供客观的参考依据,同时也能对大学英语教师和考生在《课程要求》词组的教与学中提供有益的帮助。

[1]周正钟.语块教学法新探——理论、实证与教学延伸[M].苏州:苏州大学出版社,2014:9-14.

[2]教育部高等教育司.大学英语教学课程要求[M].上海:上海外语教育出版社,2007:3-5.

[3]何安平.语料库辅助英语教学入门[M].北京:外语教学与研究出版社,2010:12.

[4]王春艳.免费绿色软件Antconc在外语教学和研究的应用[J].外语电化教学,2009(1):45-48.

[5]周加林.大学英语四级考试真题的词貌特征——基于2006 年6 月—2013 年6 月大学英语四级考试真题的统计与分析[J].大学英语教学与研究(《考试与评价》大学英语教研版),2014(3):82-87.

猜你喜欢

真题跨度词组
缓粘结预应力技术在大跨度梁中的应用
玩转高考真题——比较大小问题
玩转高考真题——集合
高层建筑大跨度钢结构连廊设计分析
玩转高考真题——几何图形中的不等式篇
大跨度连续钢箱梁桥设计研究分析
大跨度连续刚构桥线形控制分析
玩转高考真题——集合篇
副词和副词词组