APP下载

TEM-4公平性的影响要素分析

2014-03-29贺满足

赤峰学院学报·自然科学版 2014年12期
关键词:考试内容评卷公平性

贺满足

(湖南第一师范学院, 湖南 长沙410205)

TEM-4公平性的影响要素分析

贺满足

(湖南第一师范学院, 湖南 长沙410205)

作为全面检测高校英语专业基础阶段学生对教学大纲规定的语言知识和技能掌握情况的一种手段,TEM-4需要具备公平性以体现社会公正.考试公平性涉及多个因素,是考试赖以存在的基础.本文从考试机会、考生群体、考试内容和考试结果评阅四个方面对TEM-4考试的公平性加以分析.

TEM-4;考试公平性;要素

当今社会,公平已成为各个领域的重要价值追求目标.社会的进步,推动了公平的实现,也加深了人们对公平的认识,提高了对公平的期待与要求.在教育领域,教育公平问题是当前我国社会生活和教育领域十分关注的热点问题.考试作为选拔人才和检查教学质量的一种重要手段,其公平性也备受关注.作为一个规模大、风险高的考试,TEM-4考试本身的质量以及考试的公平性尤为重要,值得深入研究.

1 英语专业四级考试

英语专业四级考试 (Test for English Majors-4,简称TEM-4),全称为全国高校英语专业四级考试,考试对象为高等院校英语专业二年级学生,自1991年起由教育部实行,每年举行一次,以笔试形式考核,无口试.该考试以《高等学校英语专业英语教学大纲》为依据,全面检查英语专业(本科层次)二年级学生对基础阶段所要求掌握的英语语法结构和词语用法以及听、读、写基本技能的掌握程度.因此,TEM-4属尺度参照性教学检查类考试.考试由教育部高等学校外语专业教学指导委员会英语组组织有关测试专家命题,外语专业教学指导委员会办公室负责考试的实施[1].

作为检查各高校贯彻和落实教学大纲情况,以促进英语专业教学,提高教学质量的一种形式,TEM-4自开考以来,其权威性在不断提高,在教学中的评估功功能也在不断突显.该考试成绩不仅作为学生是否达标的依据,更是英语专业本科教学评估指标体系中的一项指标.当前,研究者从不同层面对TEM-4展开了研究,如邹申、王海贞、孔文等研究了TEM-4的效度;侯艳萍、李清华等、彭康洲研究了TEM-4阅读和写作的难度;陆远、邹申等研究了TEM-4写作评分过程及评分效度;张喆等、颜静兰等、秦秀白研究了TEM-4对教学的反拨效应等.这些成果,特别是构念效度研究成果,提高了TEM-4测量的准确度和分数的解释力度,有助于提升考试的公平性.

2 考试公平性

考试的公平性是指在考试的各个环节(包括试卷设计、开发、施考、评卷和成绩公布),对所有考生公平对待、一视同仁,不存在只影响部分考生的其他相关因素,考试结果仅仅反映考生个人在考试中的知识和能力水平情况[2].根据美国教育研究学会等机构编制的《教育与心理测量标准》[3],考试公平性体现在以下几个方面.第一,没有偏颇(lack of bias).考试偏颇可由考试内容、答题形式所致,也可能因为考试的使用,导致对不同考生群体而言,考试结果意义不一致.这种偏颇会使考试结果出现偏差,不能准确反映所测的目标(知识、技能或能力),从而降低考试的构念效度.第二,考试过程的公平.包括考前准备过程中,所有考生都应有机会得到考试复习资料;考试实施过程中所有考生都受到公正待遇,具有同等机会来展现考试所测的知识或能力,以及给考生提供合适的条件,以便他们在考试中发挥正常.第三,基于考试结果(成绩)决策的公平.标准参照类考试(CRT)结果需确保不同考生群体之间的通过率具有可比性;选拔性考试(属常模参照考试)应让所有考生有同等的选拔机会.第四,就学业考试而言,考生应有均等机会学习考试相关内容.

从以上分析不难看出,考试公平性涉及多个因素,涵盖考试效度(包括内容效度和构念效度)、考前准备、考试实施、考试结果的使用和学习考试内容的机会.这些因素既包括考试自身的质量,也包括考试的外部条件;既有考试结果的使用,也有考试成绩本身;既涉及考前,也涉及考试过程和考后阶段.因而,考试公平性的概念涉及面广,贯穿甚至超越整个考试过程,是任何考试赖以存在及使用的基础[4].在实际工作中,语言测试工作者(命题、施考及评阅人员等)要将确保考试公平性放在首位,并具体落实到考试的每个阶段.

3 影响TEM-4考试公平性的因素

TEM-4考试用来检查学生是否达到教学大纲所规定各项语言技能/能力、语言知识的目标,其考试结果被用作评判考生是否达标(即考试通过或不通过)的唯一依据,这就要求考试本身质量、考试用途等方面都要具有公平性.影响TEM-4公平性的因素有考试机会、考生群体、考试内容和考试结果评阅等.

3.1 考试机会

为了降低考试成本,提高考试效率,TEM4每年只举行一次.Bachman&Palmer认为影响考试分数的因素有四类:个人特点(如性别、年龄、母语等)、情感因素、考生所具备的背景、专业和文化知识和语言水平/能力.这四类因素中,语言水平/能力对考试成绩起决定作用,但不能排除其它三类特征影响考生在考试中的表现[5].由此可见,一次考试往往不能准确测试所有考生的真实水平,仅以某次考试结果作为学生是否达标的依据,在公平性上有失偏颇.为了弥补这一不足,TEM4考试未达标的考生可以参加下一年的考试.即使这样,这些考生需要为第二次考试机会的到来等待一年,在时间、精神压力等方面付出代价也不容忽视.

3.2 考生群体

TEM-4自开考以来,考生数量快速增加.据外语专业教学指导委员会办公室统计,1992年参考院校为155所,参考学生为8554人;到了2010年,参考院校为827所,考生人数高达27万.这些参考学生都来自全国各高等院校的英语专业:综合大学、外语院校、理工类大学、师范院校、其他院校以及独立学院等.

这些院校既有沿海发达地区的,也有内陆省份和边疆地区的.表面上,TEM-4考生均为在校英语专业学生,具有同质性,但仔细研究后不难发现,由于学校师资、课程设置、地理位置等方面的原因,这些考生存在许多不同特征.就语言能力而言,考生群体间(或学校之间)存在着显著差异.影响语言能力发展的因素有多个,包括性别、年龄、外语学习起始期、专业知识/背景、学习风格、认知风格、对所学语言国家文化与社会的了解/认同程度等.这更说明科学甄别差异、合理解释差异的必要性.因而“在分析和持续研究阶段,需关注不同考生群体的实际差异或潜在差异,采取措施避免差异成为影响考试结果或分数解释的因素”[6].

3.3 考试内容

考试内容的公平性是指考试内容对于所有考生应有同等的作答机会和相同的答题条件,能力相当的考生都能获得相同的成绩,不致因考生背景的不同而导致正确作答几率的严重失衡.影响考试内容公平性的原因是多方面的:①考试答题是否需要特殊的专业/背景知识;②试题是否原创;③试题对于全部考点的代表性.由于背景/专业/文化知识可能影响考试结果,在语言水平相当的情况下,是否具备试题内容涉及的背景知识就有可能成为决定TEM-4考试中阅读、听力或写作考试成绩高低的因素.因此,在考试规划和命题段,命题小组需兼顾考生因素,使试卷具有包容性.以2011年的TEM-4为例,考试材料具有较好的代表性和较广的覆盖面,主题包括时事热点、金融贸易、文化习俗、社会与生活、人物介绍、科技通讯等方面.材料主题广泛有效避免了因考试材料选取的缺陷而产生的偏颇,为提升考试公平性打下了基础[7].由于TEM-4考试属于标准参照教学检查类考试,对教学的影响不断增强,研究考试的反拨效应的必要性已日趋突显.因此,对TEM-4考试影响的研究也应成为提升TEM-4考试公平性的一大举措.在这方面积极开展研究可以帮助我们加深对考试目的、用途以及作用的认识[7].

3.4 考试结果评判

考试结果评阅是指将考生的解答与试题标准答案进行对照,根据两者的吻合程度给考生评分的过程.为保证评分的公平性,TEM4考试阅卷小组从以下几个方面进行了严格的把关:制定科学、全面、可行的评分标准;认真挑选评分样卷;培训评卷人员以及监控整个评卷过程.在实际的评分过程中,评卷者之间可能会存在较大的差异,其原因包括:长时间的评卷导致疲倦,注意力不集中;对评分标准自由度的把握,评卷教师自身的知识水平、经验等.因此评卷者之间存在主观上的差异,相同评卷者在不同的时间内也具有不稳定性,在评分的准确性、严厉度等方面,同一评卷者难以在多次评分中保持一致,不同评卷者对于相同被试的评分也难以相同[8].

那么,在评卷过程中如何维护考试的公平性呢?笔者认为可以从控制阅卷的随机误差和系统误差入手.考试评阅小组对随机误差的控制可以通过选择评卷人员、强化评卷人员的责任心以及强化统分、登分环节的逻辑校验来实现.对评阅过程中系统误差控制的措施有:①加强对评分系统的操作数据进行逻辑校验;②对评卷教师进行严格的培训,组织他们认真研究评分标准并试评,确保他们真正全面把握评分细则;③采用网上评卷,对评卷教师随机发放试卷,实时监控评卷中教师对评分细则的把握情况[9].如 果对同一份测评卷,评卷教师的评分差异超出了可接受的范围,则需由另一评卷老师进行评阅.

为了提升评卷的公平性,从2009年起TEM-4考试阅卷小组开始改变评卷模式,实行计算机辅助评卷.这一评卷系统将先进的计算机技术与人工评卷的丰富经验有机结合,采用随机误差和系统误差控制模型对整个评分过程进行实时监控,极大地推进了评分的标准化,尽可能确保了每个考生所得分数客观、公正,有效提升了评分的公平性.

4 结语

作为全面检测高校英语专业基础阶段学生对教学大纲规定的语言知识和技能掌握情况的一种手段,TEM-4需要具备公平性以体现社会公正.如前所述,影响TEM-4公平性的要素有考试机会、考生群体、考试内容和考试结果评阅等.

这些要素密切相关,缺少任何一个都将影响到考试整体的公平性.只有从这些影响要素入手,逐一分析其产生不公平的原因,才能有效地采取针对性措施,确保和提升TEM-4的公平性,从而稳固其作为评价、甄别学生及教学评估指标的地位.

〔1〕邹申.关于考试科学属性的思考[J].中国外 语,2006(2):14-18.

〔2〕Brown JD.Testing in Language Programs[M].London: Prentice Hall(international),1996.

〔3〕American Educational Research Association,et al. Standards for educational and psychological testing[Z]. W ashington,D.C:American Educational Research Association,1999.

〔4〕邹申.提升考试公平性———以英语专业四、八级考试为例[J].外语教学与测试,2011(1):42-50.

〔5〕Bachman L F&Palmer A S.Language Testing in Practice[M].Oxford:Oxford University Press,1996.

〔6〕邹申.提升考试公平性——以英语专业四、八级考试为例[J].外语教学与测试,2011(1):42-50.

〔7〕邹申,方秀才,陈炜.2011年英语专业四/八级考试分析报[J].外语测试与教学,2012(1).

〔8〕贺满足.多层面Rasch模型分析写作测试中评卷者的偏差性[J].长沙铁道学院学报(社科版),2011(1).

〔9〕郭 光 明 ,高 考 公平 性 的 影 响要 素 分 析[J].教 育 理 论 与 实践,2010(6).

H31

A

1673-260X(2014)06-0214-02

湖南第一师范学院科研立项课题“TEM-4考试的构念效度与公平性研究”(XYS12S25)

猜你喜欢

考试内容评卷公平性
高管薪酬外部公平性、机构投资者与并购溢价
2019年对口升学考试网上评卷考生答题注意事项
我国成人高考内容改革的探索与研究
“画海”评卷
大规模考试网上评卷中趋中评分的成因探析
论能力测评导向的高校考试改革
浅析全国计算机等级考试一级MSOffice考试内容及应对策略
关于公平性的思考
厦门市2009—2014年体育教师入职技能考试内容分析
基于普查数据的我国18个少数民族受教育程度及公平性统计分析