APP下载

基于形成性评价理论的英语专业学生学业测试模式改革的实证研究

2011-01-22

关键词:现行英语专业学业

(大连外国语学院 英语学院,辽宁 大连 116044)

0 引言:英语专业学业测试与评估改革的缘起

语言测试是语言学习成果的一种检验方式,是学习者的语言能力需要借助测试来检验。在我国,各种形式的英语考试表明英语测试在英语教育领域占据了相当大的市场。测试者与被测试者均投入了大量的时间和精力,但效果却不尽如人意。这些现象引起了国内英语教学工作者和测试研究方向的专家学者的关注,他们从各个不同的视角对测试进行了广泛而深入的研究和探讨(马丽雅,2007)。

考察我国高校现行的学业评估方式可以发现,大多数外语专业都把每学期的期中、期末考试作为主要的学业评估方式,而且都是以单一科目考试的形式出现的。这种传统的学业评价方式能够从一定程度上考查学生课程学习的效果,对授课教师教学也具有一定的反拨作用。但是,在多年的评估和测试实践中,我们逐渐发现了传统学业评价方式存在的一些弊端:

首先,传统的评估模式,不能有效监控学生平时的学习状况,缺少对学生平时学习情况的反馈。传统的英语专业评估,主要是采用期中、期末考试的形式,没有把学生平时的课堂表现、平时的进步情况纳入学生学业评价体系之中。期望通过期中和期末两次大规模考试来全面考查学生的学业水平是不现实的,也没能对学生平时的学习起到督促和检查的作用。集中进行期中期末考试,也使得学生产生了“平时不学习,考前大突击”的应试模式,不能有效地指导学生在平时反思自己的学习,没能起到促进学生自主学习的作用。

其次,传统的评估模式,不能客观全面地反映学生的整体学业水平。每个学期通过组织两次大规模考试,完成对学生学习状况的评估与评价是有失公允的。一方面,平时积极努力的学生很可能因一时的疏忽、精神面貌欠佳、睡眠不足等客观原因,造成考试成绩不佳的后果。另一方面,也会有部分学生平时很少学习,考前突击,最终获得了较高的考试成绩。

最后,期中和期末考试过于集中,科目过多,给教务部门、教学部门、教师评卷等造成诸多不便。

基于传统评估模式的几点不足,本研究通过对某外语院校英语专业两个年级实施“平时多次考核+期末多科综合水平测试”测试改革实践,探讨新的评估模式的可行性、学生认可度以及该评估模式对学生学习产生的主要影响和存在的主要问题。

1 形成性评价理论

形成性评价是旨在通过对日常表现的反馈,最终实现提高或加速学习作用的一种评估模式(Sadler,1998)。形成性评价是对学生日常学习过程中的表现、所取得的成绩以及所反映出的情感、态度、策略等方面的发展作出的评价。也就是说,形成性评价关注的是学生知识、技能与态度的“形成”过程,它是基于对学生学习的全过程持续观察、记录、反思而作出的发展性评价。英国中等教育委员会(SEC)在20世纪80年代采用了“基于学校日常教学的评估”(school-based assessment),美、日、法等世界教育强国也已把形成性评价作为提高教学质量的强有力手段(苏鸿,2001),认为这种评价可以测量出“某些不能轻易或充分地从(终结性)试卷所获得的学生的学业成绩”(转引自曹荣平,2004)。《大学英语课程教学要求》(2007)也明确指出:“形成性评价特别有利于对学生自主学习的过程进行有效监控,在实施基于计算机和课堂的教学模式中尤为重要。”

从现有的文献来看,英语专业的形成性评价模式的研究还处于探索和总结的阶段。本研究也是基于形成性评价理论,尝试性地对英语专业学生学业测试和评估进行改革,以期充实英语专业形成性评价模式的理论和实践经验。本研究中的形成性评价模式实际上是吸取了以上多种评价模式的优势,通过整合而形成的一种可能适合英语专业学生特点的学业测试和形成性评价模式。

2 研究设计

2.1 研究工具和方法

本项研究主要采用了测试、问卷调查和访谈等方法。测试的具体形式根据课型的不同有些许变化和调整,但都不脱离“平时多次考核+期末多科综合水平测试”考核方式的总体设计。问卷调查主要在测试完成后,收集参与此次学业评估改革学生的反馈信息,为下一步改革的开展提供真实的数据。问卷主要由两部分组成:第一部分主要涉及学生对评估模式改革的态度、改革产生的积极影响和消极影响;第二部分主要涉及新的评估模式的主要优势和不足。访谈获得的数据是对问卷调查数据的补充,访谈的问题与问卷相似,研究者希望通过访谈获得数据进一步佐证问卷调查的统计数据。

2.2 研究对象

本项研究针对某外国语学院英语专业2008级(共264人)和2009级(共297人)两个年级的全部学生共计561人采用了“平时多次考核+期末多科综合水平测试”的考核方式。全部学生都参与了调查问卷的数据采集。

2.3 研究的主要问题

1)英语专业实施平时测评与语言水平测试相结合测评模式的可行性及学生认可程度;

2)英语专业实施平时测评与语言水平测试相结合测评对学生产生的主要影响;

3)英语专业实施平时测评与语言水平测试相结合测评过程中的主要问题与应对策略。

表1 “平时多次考核+期末多科综合水平测试”学业测评模式的构成情况

2.4 测试模式的总体设计

本项研究在语言测试相关理论的基础上,开创性地将高校英语专业现行的分科目的期末学业考试形式进行了改革。本研究主要是改变了原有的学业评估模式,即每学期的期中、期末考试作为主要学业评估方式,而且相关考试都是以单一科目考试的形式出现的。改革所采用的学业评估和测评模式是:平时测评与语言水平测试相结合的考核方式。其中,平时的多次考核为阶段性的成就型测试(achievement test),主要考查和监控学生的日常学习情况,期末多科综合水平测试为能力测试(proficiency test),题型以英语专业四八级考试题型为主,主要考查学生的整体语言能力水平。相关科目采集综合水平测试的相关部分成绩作为该科目期末总评成绩的一部分。例如,综合英语为5次平时测验占总评50%和一次期末英语水平测试的部分项目折合为总评成绩的50%。而英语泛读课程的评价模式是由一次课堂展示、一次课堂测试、一篇小论文和期末测试组成,各占总评成绩的10%、20%、20%和50%,也就是说学生要作一次占总分10%的课堂展示,课堂测验占20%,在日常学习中,写1篇论文,占总分20%,而期末考试只占总评成绩的50%。英语听力课则通过4次平时的学业测验积累总评的50%和一次期末英语水平测试的部分项目折合为总评成绩的50%。

3 结果与讨论

3.1 现行评估模式的学生认可度

调查问卷中题目1为“这种平时多次考核+期末多科综合水平测试的考核方式你是否喜欢?”学生通过选择“非常喜欢、喜欢、无所谓和不喜欢”四个选项中的一项表明个人对现行评估模式的认可程度。通过对2009级和2008级学生的调查,获得的统计数据如下(见表2):

表2 现行评估模式的学生认可度调查统计(1)

从以上数据可以看出,2009级的194名同学“非常喜欢”或“喜欢”现行的评估体系,占2009级被调查总数的65.3%。这说明一半以上的被调查者赞同现行的学业评估模式。仅有27名学生选择了“不喜欢”,占调查总数的9%。

2008级的调查结果与2009级数据大体相当:选择“非常喜欢”或“喜欢”选项的学生共计172人,占2008级被调查总数的65.2%。而选择了“不喜欢”的选项的被调查者,占2008级被调查总数的11.4%。

总体看来,两个年级的参与测试改革的学生都对现行的测试评估体系持支持态度。通过访谈我们发现,不喜欢现行评估体系的被调查者主要提到了如下原因:首先,平时考试过于频繁,会出现某一周有多科考试的情况;其次,平时测验的公平度难于控制,考场秩序难于控制;最后,平时考试占用过多复习时间,只为了应付平时考试而学习,忽略了素质的全面提高。

问卷调查的题目6也能从一个侧面反映学生对现行评估模式的认可程度。题目是“你认为‘平时多次考核+期末多科综合水平测试’的考核方式以后应该坚持、坚持但需要改进、取消还是无所谓?”相关统计数据如下(见表3):

表3 现行评估模式的学生认可度调查统计(2)

从表3的统计数据可以看出,绝大多数学生都希望继续沿用现行的评估体系。2009级的支持者达到97.6%,2008级的支持者达到93.2%,可以肯定地说,此项学业评估与测试改革得到了绝大多数被调查学生的支持。

但是不可否认的是单纯选择坚持现行评估模式的学生也不容忽视。为了更好地了解改进现有评估体系的具体方法,我们对部分参与此项改革的学生和教师进行了访谈。对改进现有评估体系的具体方法,将另辟章节详细论述。

3.2 现行评估模式对学生学习产生的主要影响

3.2.1 现行评估模式对学生学习产生的积极影响

为了了解现行的评估体系对学生产生了哪些积极影响,我们设计了开放性问题(问题2):这种“平时多次考核+期末多科综合水平测试”的考核方式对你产生了哪些积极影响?希望通过被调查学生的回答,了解学生对测试改革效果的看法。

表4 现行评估模式的学生认可度调查统计(3)

表4即是被调查学生看法的汇总,主要得到了三个方面的积极影响,即督促平时学习、减轻期末压力、保持学习热情三个方面。数据显示,现行的评估体系在监督和督促学生平时复习和学习方面,的确达到了预期的效果。在访谈中,就有学生说:“为了能在综合英语进行的小测验中取得好成绩,每两三课就要全面复习一次。如果没有平时的这些小测验,可能就要等期末一起突击复习了。”

另外,2009级和2008级分别有28.28%和26.52%的被调查学生认为现行评估体系能够帮助学生有效“减轻期末压力”。的确,这种“平时多次考核+期末多科综合水平测试”的考核方式,正是将原来期末考试终结性评价的劣势,最有效地转化为平时多次考核的优势。平时的多次评估与测试,更能反映学生的日常学习情况,也有助于客观公正地对学生学业水平作出评价和判断。

3.2.2 现行评估模式对学生学习产生的消极影响

全新的测试与评估体系,在一定程度上不可避免地对学生产生了消极影响。通过对调查问卷中获得数据的汇总统计,我们发现,现行评估模式对学生学习产生的消极影响主要集中在以下四个方面(详见表5):

表5 现行评估模式的学生认可度调查统计(4)

这里值得注意的是,2009级和2008级分别有139人和126人都将“过多测试产生焦虑与压力”列为最主要的消极影响,比例接近全部被调查者的一半(两个年级共计265人,占总数的47.2%)。评估和测试改革对学生造成的情感焦虑和压力,是研究中在改革之初未曾预测到的。有的被调查者就提及:“在为测试做准备时感到很痛苦。此外,学生很少有时间聚在一起,并非所有学生都投入相等的精力准备课堂展示和课题项目。过于复杂会使内向和害羞的同学落后,从而失去学习兴趣。”如何有效地化解这些情感焦虑和压力,成为我们进一步研究的主要对象。

另外,通过表5我们可以看出,2009级和2008级学生中,仅有46人(占两个年级总人数的8.2%)认为现行的评估体系对学生的学习没有产生任何消极影响。这说明,现行评估体系仍然会产生较多的消极影响,还有很多方面需要进一步完善,力求将消极影响降到最低,同时最大化的发挥这种形成性评估体系的优势。

3.3 现行评估模式的优点和缺点

由于此项研究的最终目的是探讨适合英语专业学生、并能够全面反映学生学业水平、有效监控学生平时学习的学业评价模式,因此,考查现行评估与测试体系的优缺点是很有必要的。

3.3.1 现行评估模式的优点

表6呈现的便是现行评估模式的主要优势。其中,2009级和2008级分别有99人和74人认为现行的评估模式摒弃了传统期末考试终结性评价的“一考定成绩”的弊端,分别占两个年级被调查者总数的33.33%和28.03%。另外,不少学生认为现行模式有“平时考查全面,便于客观评价”、“督促平时学习”、“减轻期末复习压力”和“夯实基础”等主要优势。这恰恰证明了研究者在实验开始前设想的,希望通过这种“平时多次考核+期末多科综合水平测试”的模式实现“全面考查学生学业水平、监督学生平时学习状况、减轻期末复习压力”的目的。通过问卷调查的数据(详见表6)可以看出,研究者的这些初衷不同程度地得到了学生的认同。

表6 现行评估模式主要优势调查统计

根据对部分教师和学生的访谈,我们又得到了有关现行学业评估体系优势的其他信息。

1)将课堂展示纳入评估体系,具有多方面优势。本次评估测试体系改革的课程中,都不同程度地将课堂展示作为评估体系的一个部分。在师生看来,学生在准备做课堂展示的时候,为了更好地理解内容,学生通常需要准备足够多的额外知识。这就督促学生查阅资料,并吸收、归纳和总结相关信息。这无形中训练和培养了学生收集资料并加工的能力,为他们提供了大量阅读的机会。由于课堂展示通常以小组的形式进行,将课堂展示作为评估体系,也使得学生学会了合作学习,增强了团队的合作意识,提高学生交流与合作的能力。同时,对于课堂上的“听众”而言,他们能够轻松地从课堂展示中学习相关知识,课堂展示使原本枯燥乏味的课堂变得生动有趣。

2)将写作纳入评估体系,有助于学生对知识的整体把握。通过访谈,研究者发现,将写作(即小论文)纳入评估体系的作用十分明显。因为写作要求精心安排和逻辑思维能力,是显示学生综合能力的重要方面。学生从深入了解内容的过程中受益良多,小论文的写作为学生提供了发挥潜能的机会。有的学生表示“只要我能写出一些内容来,就可能会记住很长一段时间。通过查找相关资料,我也可能学到其他相关的很多知识。我也学会了如何把这些知识和信息进行整合。”

3)平时的持续监测,有助于全面考查学生学业水平。很多被调查者都提到,由于平时的测试与期末考试同样重要,他们都会非常认真地对待平时的测试和评估。这就有助于学生培养一种好的学习习惯。“课堂展示+平时测验+小论文+口试”多种组合的评估模式,可以从说、读、写、译多个方面对学生学业进行评估与评价。小测试可以帮助学生记住有用的词汇和表达方式,是对课堂内容的有效检验。课堂展示既培养了学生的团队协作能力,又能有效监控学生的口语能力发展状况。

表7 现行评估模式的缺点调查统计

3.3.2 现行评估模式的缺点

针对现行评估模式的缺点和不足,被调查者提到了诸多需要改进的方面(详见表7)。通过统计可以发现,被调查学生认为现行评估模式的缺点主要为(以两个年级的总数计):各科目平时测试过于集中(95人,16.9%);只注重书本知识,应试为主,忽略综合能力(112人,19.9%);考试纪律难以保证,难以实现考试公平(48人,8.6%);考试过于频繁,影响新内容预习(92人,16.4%);期末试题过难,题量过大(23人,4.1%);填写其他缺点的为132人,占被调查总数的23.5%。

调查问卷显示,“各科目平时测试过于集中”、“考试纪律难以保证”、“考试过于频繁”等问题比较突出。如何将平时各科目的测试与评估合理分布?如何保证平时测试的考试纪律?如何在保证形成性评价效果的基础上,合理设置考试数量?这些问题有待研究者深入研究。

3.4 现行学业评估模式存在的问题和解决策略

针对调查问卷所反映的主要问题,我们对部分教师和学生进行了访谈。希望对现行学业评估模式中的主要问题作进一步研究。

1)平时考试过于频繁,学生产生焦虑情绪,影响学生自学计划的问题。

在访谈中,我们发现很多同学都提到平时的很多时间都是忙于准备平时的测试和考试,很少有机会按照自己的需要安排时间,也很难按照自己的需要学习想学的内容。多数情况是,哪门课程要考试,就多关注哪门课程;老师要考什么,就学习什么。有个别访谈者提到:我每天好像就是为了考试而学习,生怕平时测验的成绩不理想,影响最后的总成绩,所以心理压力比较大。

针对这一问题,接受访谈的教师表示应该更加合理地分配和安排平时测试的时间。例如,在学期初由教研室统一安排和调整全部课程的测验时间,避免在某一周出现多科考试的情况。教师希望能够将所有科目的平时测试分散到各个教学周,这样既有利于学生合理安排学习时间,也避免了某一周全部科目都考试情况的出现。

2)平时考试的考场纪律难于监控,部分评估项目客观性难于保证的问题。

在访谈中我们发现,平时测验的主要形式是随堂笔试。但是,随堂的笔试很难像大规模考试一样,做到A卷B卷座位混排。普遍的情况是按照大家上课的座位进行随堂测试。这就造成部分学生相互抄袭情况的出现。另一方面,由于任课教师不同,同一次测试的测试时间很难安排在同一时间进行。这就给部分学生创造了可乘之机,他们可以提前向其他班级同学了解测试内容,甚至提前获得测试题答案。这使得我们很难保证平时测试的公正性。

另外,有的教师认为课堂展示的评价标准比较模糊,很多教师都是凭借个人的判断给出总体印象分,因为没有比较细化而且科学的评价标准。

针对以上问题,研究者认为除了应该从思想上纠正学生的错误观念之外,还应该在平时随堂测试的组织形式上有所改进。例如,同一门课程如果在不同时间进行测试,应该将测试题目替换为同等难度的不同试题,而不应当使用完全相同的测试题目。对于主观性较强的课堂展示和小论文,需要统一各门课程的评估标注。例如,课堂展示的评分标准可以细化为内容、逻辑性、语言、合作意识等几个方面,争取对学生作出客观评价。

3)教师课堂授课时间有限及教师负担过重的问题。

新的评价和评估模式也给授课教师带来了一定的困扰。最突出的问题表现在课程内容上。这些课程内容的课时安排比较有限,每周仅有2学课授课时间。教师不得不加快进度来完成教学任务,没有更多的时间让学生做课堂展示。接受访谈的教师就指出:“我必须在一堂课之内讲完一个章节,而每一个章节中有太多的重要内容和语法现象需要解释。因此,如果我为学生提供讨论和课堂展示的机会,我就不可能完成教学任务了。只能把展示这一环节留到学期末来完成,由几个同学代表整个班级进行课堂展示。所以,我没有办法了解到每位同学在小组准备中的真实表现,更别说他们的能力了。”其他的教师也提及“每个小组只有15分钟的时间来表达想法时间未免太短了”。

另一个问题是新的学业评估模式给授课教师带来了很大的作业批改压力。例如,每位教师负责4—7个班级不等的授课任务。除了完成教学任务外,还要经常性地给每个学生批改测验题或是小论文,他们的工作量可想而知。接受访谈的一位老师就说到:“由于时间有限,我不可能仔细阅读每个学生的作文,并且在读完之后给予有效的反馈。有时我真的想从中挑取一些角度新颖、说服力强的文章作范文,有助于其他同学能力的提高。可是,我有太多的要看,所以也逐渐地对他们失去热情。”其他的三位老师也同样认为:在一个学期中,批改数目浩大的作文是很重的负担。

对于教师提到的负担过重问题,我们认为教师完全可以发动学生的力量。随堂测试等包含客观性试题的部分,并不需要教师亲力亲为,完全可以将测试题在班级内部组间交换批改。但对小论文等需要评判的部分,则需要教师认真对待,细化标准,作出客观公正的评判。

4 结论

本项研究将英语专业学生的学业测试与评估手段作为主要的研究对象,经过科学的实验设计和数据统计分析,最终得出了如下结论:

1)本研究发现教师及学生对现行的学业评估模式总体上持支持态度。

研究数据表明:2009级的297名被调查者中,194名同学“非常喜欢”或“喜欢”现行的评估体系,占2009级被调查总数的65.3%。这说明一半以上的学生赞同现行的学业评估模式。2008级的调查结果与2009级数据大体相当:选择“非常喜欢”或“喜欢”选项的被调查者共计172人,占2008级被调查总数的65.2%。这说明学生对现行的评估体系大体持支持的态度。同时,调查数据也显示:大多数学生希望继续沿用现行的评估体系。2009级的支持者达到97.6%,2008级的支持者达到93.2%,可以说,此项学业评估与测试改革得到了绝大多数被调查者的支持。

2)本研究总结了现有评价模式的三方面积极影响和四方面的消极影响。

通过调查问卷和访谈,我们总结了现行评估模式的三方面主要积极影响,即督促平时学习、减轻期末压力、保持学习热情三个方面。其中,2009级接受调查的297人中,有229人提及了现行评估体系有助于“督促平时学习”这一点,占到了被调查总数的77.1%;2008级的264人中,有77.65%的被调查者也提到了这一点。这说明,现行的评估体系在监督和督促学生平时复习和学习方面,的确达到了预期的效果。

研究也发现,现行评估模式对学生学习产生的消极影响主要集中在以下几个方面:平时过多测试给学生带来了情感焦虑与压力、平时过多考试影响课余活动与自学计划、部分同学主要是为了应付考试而学习、期末考试没有方向,缺少对课本整体把握四个方面。

3)本研究总结了现行评估模式的五点优势和五点不足。

接受调查的学生中,2009级和2008级分别有99人和74人认为现行的评估模式摒弃了传统期末考试终结性评价的“一考定成绩”的劣势,分别占两个年级被调查者总数的33.33%和28.03%。另外,被调查者分别提及了“平时考查全面,便于客观评价”、“督促平时学习”、“减轻期末复习压力”和“夯实基础”等主要优势。

通过统计可以发现,被调查者发现的现行评估模式的缺点主要为(以两个年级的总数计):各科目平时测试过于集中(95人,16.9%);只注重书本知识,应试为主,忽略综合能力(112人,19.9%);考试纪律难以保证,难以实现考试公平(48人,8.6%);考试过于频繁,影响新内容预习(92人,16.4%);期末试题过难,题量过大(23人,4.1%);填写其他缺点的为132人,占被调查总数的23.5%。

4)本研究提出现行评估模式的主要问题和解决方法。

针对问卷调查数据所反映的主要问题,我们对部分教师和学生进行了访谈,希望对现行学业评估模式中的主要问题进行进一步研究。(1)平时考试过于频繁,学生产生焦虑情绪,影响学生自学计划的问题;(2)平时考试的考场纪律难于监控,部分评估项目客观性难于保证的问题;(3)教师课堂授课时间有限及教师负担过重的问题。研究者也针对这些问题,提出了相应的尝试性的解决方案。

[1]Knowles,M.How do you get people to be self-directed learners[J].Training &Development Journal,1980a(34):96-99.

[2]Knowles,M.Malcolm Knowles on The magic of contract learning[J].Training &Development Journal,1980b(34):76-77.

[3]Nicol,D.and Macfarlane-Dick D.Formative assessment and self-regulated learning: a model and seven principles of good feedback practice[J].Studies in Higher Education.2006,31(2):199-218.

[4]Sadler,D.R.Formative assessment:revisiting the territory[J].Assessment in Education,1998,5(1):77-84.

[5]曹荣平,张文霞,周燕.形成性评估在中国大学非英语专业英语写作中的运用[J].外语教学,2004(5):67-73.

[6]教育部高等教育司.大学英语课程教学要求[M].北京:外语教学与研究出版社,2007.

[7]韩宝成.语言测试的新进展:基于任务的语言测试[J].外语教学与研究,2003(5):352-358.

[8]刘津开.英语水平考试与教学评估[J].外语研究,2002(5):70-73.

[9]苏鸿.国内外索质教育的基本理论与经验[M].北京:中国少年儿童出版社,2001.

猜你喜欢

现行英语专业学业
艰苦的学业
抓现行
音乐提升学生学业表现
树起学业担当之心
浅谈我国现行的房产税
被抓了现行
现行企业内部控制制度探讨
英语专业学生思辨能力培养研究
35
英语专业泛读课教学探究