APP下载

海南师范大学英语口语机考探索与研究

2013-07-18黄峥峥

海南开放大学学报 2013年1期
关键词:机考口试英语口语

黄峥峥

(海南师范大学外国语学院,海南海口 571158)

引 言

随着人们对外语水平和能力认识发展,交际能力在语言教学和测试中得到越来越广泛关注。越来越多高校将测试学生口语能力作为考核学生英语水平必不可少一部分,口语测试必要性已毋庸置疑。面对数量庞大的非英语专业学生,如何进行有效、可信、实用的大规模口语测试是一个值得认真研究的课题。科技的发展给考试改革和实施方式改进提供了广阔前景。2005年2月,4、6级考试委员会正式出台了《全国大学英语4、6级考试改革方案(试行)》,明确提出:“将积极研究开发计算机口语测试,以进一步扩大口语考试规模,推动大学英语口语教学。”计算机辅助大学英语口语测试(以下简称口语机考)的推出为语言测试注入了新活力,各大高校开始对这种考试模式进行尝试。

对于这种新的口语测试形式,国内诸多学者已展开过研究。较早探索英语口语机考的是复旦大学外文系邱东林[7],其对口语机考利弊进行了分析;蔡基刚[3]的研究更加深入,验证了口语机考的信度和效度。然而,研究也发现口语机考中存在着问题。孙元春[9]的研究表明:在机考口语测试环境下学生焦虑度要高于面试环境;金力[5]认为机考缺乏互动性,试题类型缺乏双向交流性。目前无论是国外还是国内,计算机口试正处于实验和探索阶段[3],还未成为一种成熟的大规模考试形式,因此有必要对其开展进一步研究。

一 海南师范大学口语机考探索

为切实达到提高学生口语表达能力目标,海南师范大学(以下简称“海师”)自2005年起建立起由课堂教学和网络自主学习两大部分构成的教学模式,除了课堂听说教学外,学生每周有2个学时网络测试和人机听说练习。因此,学生对机考并不陌生。大学英语自主学习中心也为实施口语机考提供了必要硬件设施。口语测试是海师大学英语课程测试一个重要组成部分(占各学期总评成绩的10%)。长期以来,海师非英语专业学生口语测试模式主要为面试,但随着大学扩招,学生人数不断增加,这种口语测试方式日益显示出一些弊端,如:需要大量考场和考官,费时费力,效率低等。为适应新形势发展,自2010年6月起,海师成为海南省第一所尝试和推广英语口语机考高校,利用桂林洋校区班级作为试点,采用“外教社大学英语口语考试系统”组织大学英语期末口语机考。2012年1月初,大学英语教研室根据大学英语口语教学及考试大纲、现用教材,基本完成了具有主题和等级级别的口语机考试题库建设,内容主要涵盖朗读、回答问题、看图说话、评论四种题型,并利用试题库中资源对2010级与2011级非英语专业普通本科学生分别进行了大学英语(三)和大学英语(一)期末口语机考。但对于这一新型口语测试方式,学生作为受试者的感觉不容忽略。为了解学生对口语机考和面试型口试态度,我们对2010级与2011级参加完期末口语机考后的485名学生进行了问卷调查。调查结果显示,有37.53%的学生在“我喜欢在计算机上参加口语考试”这项上表示完全同意(30人)和同意(152人);有34.43%(167人)的学生表示不一定;而表示不同意(95人)和完全不同意(41人)的占28.04%;42.27%的学生赞同“面对计算机,说话表达感觉不太真实自然,难以开口。”然而学生也并没有明显青睐传统的面试型口语考试,在“相对口语机考而言,我更习惯进行面试型口语考试”这项上40%(194人)的学生表示不一定;表示完全同意(36人)和同意(124人)的只占32.99%;在机考/面试型口语考试更能让学生发挥真实水平这两项上均有过半学生表示不一定(分别为52.37%和54.43%)。由此可见,学生对口语机考这种新的测试形式并未完全接受,对其信度和效度仍带有怀疑态度。口语机考是否能真实反映海师学生的口语水平?笔者及研究成员对其进行了实验研究。

二 面试型口试与口语机考对比研究

(一)研究目的

本研究将通过实验,对比面试型口语考试和口语机考的测试结果,论证口语机考的可替代性。

(二)研究对象

本次实验时间为2012年6月底,研究对象为桂林洋校区已接受问卷调查的2011级涉外金融班及2011级公管班,共87名学生。

(三)选用题型

由于海师南校区大学英语网络教学实验中心于每年6月均被划为海南省高考改卷专用点,因此全校性大规模口语机考测试只能于第一、三学期末进行,第二、四学期末仍需采用面试形式进行口语测试。受此周期性影响,口语题库中题型也未能在机考中全部试用。此外,由于考试软件局限性,口语机考暂时无法采用对话形式,题库中使用频率较高的题型为朗读和回答问题。根据教学大纲对学生口语能力要求,本次研究口语机考题型采用回答问题,主要检测学生基本表达能力,难度为二级,内容出自试题库。

(四)校标选择

国内在研究口语测试校标效度中,有以下几种选择:面试、录音、机考、笔试。金艳、郭杰克[6]在进行录音口试可替代研究时,使用面试成绩作为校标,62名受试者两种测试分数相关度为0.674,做例外处理后达到 0.7000。文秋芳[10]在1994年进行录音口试测试时,使用四级笔试成绩作为校标,69名学生两种成绩相关系数达到0.66,P值为.000。蔡基刚[5]在进行口语机考替代性研究时,使用面试成绩作为校标,182名学生在两个考试中成绩相关系数为0.7058。

鉴于海师在英语期末考试之前没有笔试,本研究采用的校标为面试口试成绩。面试是最传统、直接的英语口语测试方式。在测试过程中,面试官与考生充分交流,可以较为全面地了解考生口语情况,故这种校标表面信度、效度优势最为明显。但这种测试方式也存在缺点,如:面试成绩受面试官主观影响较大,不易得出客观分数。为克服以上缺点,保证校标准确性,本实验设置了两位教师同时面试,取其平均分作为考生最终面试口语成绩,以减小面试成绩主观性误差。

(五)研究方法

对同一批学生在一定时间间隔内进行面试型口试和口语机考,两次考试均采用同样测试题,参照同样评分标准进行打分。以面试型口语考试成绩为校标,利用相关分析法检验口语机考成绩与面试口语成绩相关度。非面试型口语考试与面试型口语考试对比研究,即两者可替代性研究,很大程度上依赖于两者相关程度(Shohamy等)[2],也就是说,如果同一批考生在两个考试中成绩高相关,则证明两个考试测的是同样能力,而低相关则证明两个考试测的是不同能力。

(六)面试型口试实验

每位学生面对两名教师回答问题,共10道考题供学生抽签作答。学生抽题后有3分钟准备时间,答题时间为3分钟。两位面试教师按四、六级口语考试评分模式和标准,从语言准确性和范围、灵活性和适切性、话语的长短性和连贯性三方面进行打分,评分为百分制,取两位教师平均分作为学生口语分数,即本试验中代表学生真实口语能力的校标。

为检测成绩有效性,本研究采用spss软件两变量相关分析对评分者进行信度分析,结果如下表所示:

表1 面试评分者相关系数Correlations

如表1所示,面试评分者相关系数为0.808,相关系数 Sig.值为 0.000,小于 0.01,说明两位评分者评分相关性是较为显著的。由此可见,取面试评分者平均分作为校标是有说服力、可取的。

(七)口语机考实验

口语机考测试于面试型口语考试结束后第二天进行,测试对象为同一批学生。考试地点为海师桂林洋校区大学英语自主学习中心,两个班87名学生分为两场考试,每场考试时间为20分钟,其中答题时间为6分钟(3分钟准备,3分钟答题)。考试所采用的题型、题量、内容和难度与面试型口语考试完全一致,试题由计算机随机抽取,每场考试试题有所不同。考试结束后,服务器自动生成不带个人信息的录音文件。每位学生成绩仍由两名教师评定,取其平均数。两名阅卷教师采用相同评分标准,此前均接受过阅卷培训。

口语考试中,无论是面试型口试还是口语机考,都属于主观测试,阅卷为主观阅卷。要想考察考生成绩中掺杂多少评分者主观因素,仍需要进行评分者信度分析。通过两变量相关分析,两位口语机考阅卷教师信度对比结果如下:

表2 口语机考评分者相关系数Correlations

从表2可看出,两位机考阅卷教师评分相关系数为.883,相关系数 Sig.值为 0.000,小于 0.01,说明两位评分者评分具有显著相关性。

通过对比表1和表2结果可发现,机考测试中两名评分者具有更高相关度。分析原因可能有如下两点:

首先,本试验中,参与机考阅卷的两位评分者在阅卷之前都参加了评分标准培训,而面试口试两位评分者在评分前没有共同分析评分标准。

其次,机考阅卷评分者只能听到考生声音,无其他信息干扰,评分较为客观;在面试口试中,评分者除了听到考生声音外还可以从表情、肢体语言等方面观察考生,而这些信息有可能使评分者产生不同主观感受,影响成绩评定。

由此可见,在机考阅卷之前,对阅卷教师进行培训,统一评分标准是非常必要的。机考测试评分在无考生信息和个人印象情况下评定,更趋于客观。

三 实验结果

两次口试评分结束后,利用spss软件对测试结果进行相关性比对和描述性分析,结果如下:

表3 面试成绩和机考成绩相关系数

表4 面试成绩和机考成绩描述性表格Descriptive Statistics

当两个不同测试进行同期效度研究,如果相关系数达到0.7,则是比较满意的(金艳、郭杰克)[6]。表3表明,两次口语测试结果相关系数为.746,达到中高相关;相关系数的 sig.值为.000,小于.001,说明两者具有较显著相关性。

表4结果显示:面试口试平均成绩稍高于机考口试成绩,两者最高分几乎无差别,但最低分差异较大。通过查找机考生成的音频文件,分析差异原因可能在于:面试口试中,评分者可以面对面与考生交流,看到考生丰富的表情和状态,并可适时给予一些提示,因此考生得分不至于太低。在机考中,评分者只能听到声音,比较单调,无其他信息进行参照,因而打分较为保守;此外,考生在答题过程中,紧张或思路中断时无法得到提示,导致发言简短,空耗时间,甚至出现话不对题情况,因而得分偏低。

结 语

与面试型口试相比,口语机考虽缺乏交际真实性,但本实验相关研究数据以及评分一致性数据表明,两者相关性较高,具有较高效度和可替代性,测试结果不存在显著差异。由于口语机考不带有主观印象,成绩更具客观性,因此很大程度上能有效反映考生真实口语表达能力。此外,机考中生成的录音文件可以形成语料库,有助于教师进一步分析语料,查找影响学生口语能力发挥因素。因此口语机考是解决考生人数多、师资不足、测试信度等问题有效途径之一。但由于本次实验参与人数样本偏小、计算机口试场次偏少、题型尚缺乏多样化,实验结果普遍性有待进一步证实,对新形式测试信度、效度研究应该反复多次,采集大量数据进行分析,才具有稳定性和说服力。

从本次实验研究来看,口语机考施测信度和评分信度较高,内容信度还需通过加长测试时间及丰富测试题型等方式得到进一步提高;增强口语机考真实交流情境仍有待技术层面支持。学生在两种测试形式中表现及对口语机考态度表明,教师需引导学生利用网络自主学习系统加强人机听说练习,设计机考试题时可充分利用计算机图文并茂的多媒体功能,为学生创造较为轻松语言环境,以缓解学生考试时可能产生的不自然或焦虑感,使其发挥出真实水平。海师口语机考探索研究尚需深化,口语机考对受试者和教学影响将是后续研究重点。口语机考实施的日臻完善,能为英语口语教学提供一个更具有现实可操作性口语能力测试手段,也为省内其他高校开展口语机考测试提供一定经验和借鉴。

[1]Arthur Hughes.Testing for Language Teachers[M].北京:外语教学与研究出版社,2000.

[2]Shohamy E,Gordon C,Kenyon D,and Stansfield C.The Development and Validation of a Semi- direct Test for Assessing Oral Proficiency in Hebrew[J].Bulletin of Higher Hebrew Education,1989(4).

[3]蔡基刚.大学英语4、6级计算机测试效度、信度和可操作性研究[J].外语界,2005(4).

[4]高丙梁.计算机口试与面试的比较研究[J].外语电化教学,2007(4).

[5]金力.计算机辅助大学英语口语测试研究[J].外国语文,2011(4).

[6]金艳,郭杰克.大学英语4、6级考试非面试型口语考试效度研究[J].外语界,2002(5).

[7]邱东林,季佩英,万江波等.大学英语听说机考尝试[J].外语界,2005(4).

[8]司耀龙.基于计算机的大规模商务英语口语诊断测试实践研究[J].外语电化教学,2008(1).

[9]孙元春.机助与面试英语口语测试中学生焦虑度对比分析与研究[J].长春师范学院学报,2007(4).

[10]文秋芳.英语口语测试与教学[M].上海:上海外语教育出版社,1999.

猜你喜欢

机考口试英语口语
中国注册会计师协会关于更新注册会计师考试机考练习网站的公告
我省将于7月25日前公布高考成绩及录取分数线
初中生的我们怎么训练英语口语?
雅思机考落地中国大陆半年这些问题你应该心中有数
ACT将于2017年在所有国际考试中心推行机考
PETS口试评分培训效果的多面Rasch分析
如何加强及应用英语口语教学
浅谈加强高中英语口语教学
BEC加试:口试成了成败关键
英语口语常见谚语(二)