APP下载

基于核心素养的英语学考与高考命题探讨

2017-07-31陶百强

中国考试 2017年4期
关键词:大纲课标题型

陶百强

(江西金太阳教育研究院,南昌 330032)

基于核心素养的英语学考与高考命题探讨

陶百强

(江西金太阳教育研究院,南昌 330032)

我国高中英语课程标准规定英语学科学核心素养含语言能力、文化品格、思维品质和学习能力四个方面,为基于英语学科核心素养的综合素质评价与学业水平考试(简称学考)、高考命题确立了指导方针。高利害测试性质的学考与高考命题宜有机融汇学科核心素养的考查或导向,利用测评对教学的正面反拨作用,为发展我国学生的英语学科核心素养和立德树人的教育宏观目标服务。本文从考试大纲研制、考查内容、命题素材或命题情境、命题技艺等方面,探讨如何基于核心素养进行英语学业水平考试和高考命题。

课程标准;核心素养;高考改革;学业水平考试;高考命题

1 引言

党的十八大报告把立德树人作为教育的根本任务,立德树人首次被确立为教育的根本任务。党的十八届三中全会要求坚持立德树人、加强社会主义核心价值体系教育、完善中华优秀传统文化教育等。教育部为贯彻十八大精神,启动立德树人工程,2014年3月,教育部发布《关于全面深化课程改革落实立德树人根本任务的意见》,提出落实立德树人工程的十大关键领域,其中,研制学生发展核心素养是首要环节,并提出把核心素养体系作为研究学业质量标准和修订课程标准的依据[1]。核心素养指学生应具备的、能够适应终身发展和社会发展需要的必备品格和关键能力。基于核心素养框架修订的高中英语课程标准(以下简称课标),在我国课标研发历史上首次制定了基于核心素养的学业质量标准,提出了评价建议和学业水平考试(以下简称学考)和高考命题建议。

在此国策背景和课标统领下,高考改革(含学考体系)必将体现并基于核心素养理念。教育部考试中心副主任于涵认为,高考是核心素养落地的重要环节,高考对课标落实有极大的推动作用,核心素养和高考目标、方向是一致的,即立德树人[2],这为高考命题基于核心素养提供了可能性。

早在20世纪中后期,世界发达国家和经合组织等国际组织就研究核心素养课题,国外对在学生评价中融入核心素养的研究早在20世纪90年代就出现了,如澳大利亚昆士兰州1996年便有了有关报告[3]。我国核心素养框架在2016年9月发布,基于核心素养的各科高中课标同年9月完成征求意见稿,故关于学科高考命题如何融合核心素养的公开文献暂较少[4-6]。本文试图从考试大纲研制、考查内容、命题素材或命题情境、命题技艺等方面探讨如何基于核心素养进行英语学业水平考试和高考命题。

2 考试大纲研制

2.1 考试大纲的重要意义

考试大纲研制是试题开发重要的前端环节。我国从1989年首次颁布高考英语科考试说明(后改名考试大纲)。李筱菊认为,考试大纲是打破考试神秘化的文件,因过去的考试喜欢把考试神秘化,一不公布考试大纲,二把题型变来变去,影响考试公平[7]。考试大纲以前作为测试蓝图,用于指导命题,在现代效度理论中,测试研发本身被视为验效程序的一个部分,考试大纲被视为一个验效证据[8]。美国2014版教育与心理测试标准提到考试大纲要素包括:测试目的与用途、测试内容、题型、考试时间、考试形式、施测、评分、分数报告等[9]。世界著名语言测试均发布考试大纲,因无法囊括考试大纲的要素,课程标准无法完全代替考试大纲,参考课标设计科学的考试大纲对指导命题和考生备考意义重大。

2.2 考试大纲研制依据

考试大纲研制在总体上可参考Bachman和Palmer提出的对语言测试的评价六原则,即效度、信度、真实性、交互性、后效、可操作性[10]。

2.2.1 基于当代语言测试理论与国情

考试大纲研制应依据当代语言测试理论,特别是效度理论。Weir阐述的基于证据的效度验证框架因可操作性强,值得借鉴,效度验证基于5个方面:基于理论的效度、语境效度、评分效度、校标关联效度、后效效度[11]17-40。“我国没有专门针对外国语言文字的国家语言规划,目前学界在讨论国家语言能力这一概念,从相关项目和研究中包含外国语言方面的内容……基础和高校外语教学方面的要求可算作规划的内容。”教学或测评相关文件缺乏国家外语语言规划的宏观指导,导致社会和学界对英语语言和语言能力定位与地位、题型权重观点各异。英语在我国定位为外语(EFL)而非二语(ESL)决定了我国英语测评不宜过度重视听说能力,而宜读写领先[12],故在考试大纲研制中听说部分权重不宜偏大,特别是阅读,它是我国大多数人今后吸收域外信息的最重要方式,在考试大纲研制中可着重体现,以体现高考综合改革的基础性原则。

效度解释和测试用途相关,我国高考勿唯西方国家马首是瞻,因高考和国外语言考试目的不同,宜结合国情和高校与职场外语需求分析开发基于中国国情和国际视野、具有中国特色的高考外语考试大纲。此外,我国高考综合改革方案确定英语一年两考,涉及外语考试有效期的理论问题,根据语言损耗理论和国外外语考试有效期实践,规定高考外语成绩有效期为两年。

2.2.2 基于核心素养

本轮新课程改革,特别是高中课标修订的两个突出特色是将学生发展核心素养和学业质量标准有机地融入新的课程标准之中,而且特别强调学生的学业质量标准是基于学生核心素养构建的[13],所以考试大纲研发应基于学科核心素养。

中国学生发展核心素养以培养“全面发展的人”为核心,分为文化基础、自主发展、社会参与三个方面,综合表现为人文底蕴、科学精神、学会学习、健康生活、责任担当、实践创新六大素养,具体细化为国家认同等18个基本要点。结合学科特点,英语学科核心素养综合表现为四大素养,即语言能力、文化品格、思维品质和学习能力。核心素养应体现在高考改革中,否则就会导致核心素养被“悬置”[14],但要避免直接而生硬[2],应避免“贴标签”,而应考虑到测试目标的可测性或可测量性(testabili⁃ty),正如爱因斯坦所言,“并非所有重要的东西都能被测量,并非能被测量的东西都是重要的”[15]。高考与课标衔接不能简单搬用,也不宜为体现课标而“言必称核心素养”,如文化品格这一重要的核心素养非常重要,但却不具备可测性(精确地表述为可测量性,下同),虽然文化知识可测,但若用考生的文化知识测试的得分来推断或支持考生的人文修养和行为取向等文化品格素养,效度很低。核心素养的综合性、情境性、内隐性和适应性等特点造成其评价困难,目前欧盟国家的一种思路是将核心素养转换为可观察的外显表现,进而开发出相应的测量工具和量规,通过态度调查问卷、表现性评价等形式对核心素养开展评价[16]。

我国课标务实地在命题建议中提到“侧重考查语言运用能力,同时考查其他核心素养”[17]77,且在英语学业水平考试和高考宜侧重考查“可以通过考试来考查的内容”[17]81。

严格说来,学考和高考英语只能直接测评语言能力,文化品格与思维品质可通过终结性评价间接测试来反拨教学,如测试文化知识或在语言能力测试中融入思维认知能力测试。无法直接测试的学习能力目前只能通过形成性评价实现并体现到考生综合素质评价中,但实行基于互联网的机考可间接测试部分学习能力。有些核心素养在测试中的体现宜“润物细无声”或“潜移默化”。

对思维品质的测试可有机融入到语言运用能力测试中,在语言运用能力测评中有机融合认知层级,考试大纲可用认知层级中的行为动词细化认知能力要求,体现学考和高考的不同认知分级,因英语学科重视语言综合运用能力测试且英语科属技能导向型学科(skill-based subject),课标《附录A英语学科核心素养的水平划分》对命题的具体指导似有限[17]96。

总之,考试大纲制定应务实而为可为之处,对于目前不可测量的核心素养,可利用形成性评价或跨学科任务考查并体现到作为招生录取参考依据的综合素质评价中,但可融入与相关素养相关的知识,以对目前终结性测试技术无法测试的素养培育进行导向。

2.2.3 基于课标分级要求

课标第六章之“实施建议”含“学业水平考试与高考命题建议”,从考试的性质与目的、命题建议、考查内容、考试形式四个层面提出了一些具体建议[17]75-89。课标含学业质量标准,以核心素养为统领,将具体教学目标进行水平划分,形成基于核心素养的学业质量标准,在帮助学生学习、进行过程性学业评价、指导学业水平考试和高考命题中发挥作用[17]2。鉴于学考和高考要求不同,测试性质不同(学考为标准参照测试,高考为常模参照测试),学考和高考的考试大纲应分别研制,如体现在内容和认知分级要求等方面。考试大纲研制结合课标内容标准、学业质量标准、附录A核心素养的水平划分三处相关内容,提取具有可测性的内容和认知要求。学考和高考考试大纲的考试要求应清晰明确,避免因命题人员不同而产生自由裁量权,如参照托福和雅思考试等明确对阅读理解词数的上下限要求,而非仅约定下限。

根据我国高考综合改革宏观方案,学考由省级教育行政部门命题,语数外高考科目由教育部统一命题。既然学考要求都基于全国统一的课标,合格性学考的要求理论上全国是相同的,定位为标准参照测试的学考考试大纲为了节省研制成本和确保科学性,似可研制全国统一的学考大纲。

2.3 考试大纲研发内容

“考什么,怎么考”是测评的根本和永恒主题,考试大纲研发的核心内容是“考什么,怎么考,怎么评”。考试大纲研制影响深远,影响效度并具有强大的教学反拨作用,故考试大纲研发应该基于理论与实证研究。随着语言测试理论和实践的发展以及基于实际测试中的新问题、新发现,考试大纲也应相应修订和不断完善,如全国高考英语科考试大纲在语法填空施行一年后于2015年及时修订完善[18]。

2.3.1 考什么

课标规定学考与高考“侧重考查语言运用能力,同时考查其他核心素养”[17]77,不排除语言运用能力基础的语言知识(新增语用和语篇知识)考查,但整套试卷直接考查语言知识部分权重应低于语言技能(听说读看写)的权重,侧重读写更适合中国国情,建议偏重阅读,因阅读是今后国民最主要的信息输入方式。条件成熟后实施听说机考,赋予合适权重以引导基础英语教育不忽视听说教学。“看”(viewing)的技能指解读视觉媒体,如图片、图画、图表、地图等,或电视互联网光盘媒介上的视频资料,如可以在听说机考设置视频片段,或在阅读理解或写作素材中用图画、图表等体现。

具体考试内容的确定结合测试内容与认知层级[19]。最新的认知目标分类为:记忆、理解、应用、分析、评价、创造[20]。考查内容应特别关注可测性因素,某些目标适合用形成性评价如档案袋测评[4]。高考录取参考依据的综合素质评价可融合无法用终结性评价手段直接或间接测试的教学目标,避免核心素养标签化。具体测试内容参见课标分级要求(遵循课标内容标准、学业质量标准和附录A英语学科核心素养的水平划分),特别是课标中相对详细的内容标准部分,取自课标的高中英语课程语法知识内容标准,如表1所示。

2.3.2 怎么考

怎么考指题型设计。题型本无优劣,其选择取决于特定测试目的和施测者优先考虑的方面,被广为诟病的多项选择题若命制得当也可测试高级思维能力[21]。语言理解能力测试宜用选择性反应题,语言表达能力测试宜用建构性反应题[22]。对于大规模高利害测试的学考与高考,题型规划应考虑到测试信度或阅卷的可操作性和效率。

表1 高中英语课程语法知识内容标准

新题型的引进应基于理论研究、文献研究、实证研究和调查论证,即使题型的考试时间和题量等细节也应进行实证研究,避免基于考试大纲决策者的偏好。新题型引进可基于Weir认知-语境效度框架进行效度验证研究[23],如全国高考英语科考试大纲中新题型引入前都进行严谨研究[24]。

老题型的改革也应与时俱进,根据当代语言测试理论的发展改革或废除,如在很多国外测试中已经消失的完形填空题型值得研讨,该题立足语篇测试语言知识(词汇辨析能力),但词汇测试的广度囿于命题语篇而极其有限,且在理论上,该题型与Weir主张的认知-语境效度框架相去甚远。根据课标命题建议,“设计试题时,要尽可能提供语义相对完整的语境,要尽可能使考试题型接近或类似现实生活中语言使用的实际情况,也就是说,试题要求学生做的事情(答题)应接近或类似现实中使用语言来完成的事情”。从此角度考虑,完形填空题型也不符合课标理念。真实性原则是语言测试中的一个重要原则[25],真实性研究涉及输入的真实性(如测试文本、测试任务)、输出的真实性和情景的真实性[26]。Weir语境效度关注的是测试要尽可能接近“情境真实”(situational authenticity),此观点也被语言测试权威J.C.Alderson强调[27]2-3。

高风险测试的题型规划必须非常慎重,课标建议题型有的只适合课堂测试,如阅读简答题并不适合学考与高考,因答案可控性存疑,该题型被语言测试权威专家J.C.Alderson提出质疑为难以控制答案完整性,因考生回答无法预料,需试测等[27]227。我国高考为全球最大规模的考试,考生人数多,阅卷人力资源有限,更应考虑评分可操作性。此外,课标提到“考试题型既要相对稳定,又要有适当的灵活性和可选择性”,此举在学考和高考中亦须慎重,因为不同题型的考查内容和难度客观上存在差异,若没有技术校验措施,可能威胁测试公平。我国外语高考实施多考制后,不同考次之间的题型是否可变值得探讨,题型变化后对考生的内容和认知要求均变了,可能威胁考试公平,即使采用等值技术处理,但等值需满足条件而并不能彻底解决不同考次试题的难度差异问题。国外学者认为,等值操作有前提,等值应满足3个理想条件:待等值的试卷完全平行或非常接近平行、考生群体基本稳定、等值样本具代表性且足够大以让等值误差最小化。在现实中若无法满足理想条件,等值误差是必然的,等值有先天局限性,只适合对难度差异很小的试题进行等值,若试卷间难度差变大,等值也不可靠[28]。在测评实践中,美国教育考试服务中心(ETS)数据分析显示,等值局限于校准不同考次之间的细微难度差异[29]。

最后,题型设置也应考虑公平性,对公平高度追求的美国ETS经数年酝酿研究后,基于公平性因素等考量,在2016年3月后施测的英语试题将写作改革为选考而非必考部分。

2.3.3 怎么评

长期以来,在作文评分的思想性、内容丰富性、结构、逻辑、语言、书写、卷面整洁等评分要素的相对比重中,一直是存在争论的,不同的评分规则,会影响到效度,影响到分数的解释。对此,是需要论证的”[30]。作为高利害测试的学考和高考,评分制度对确保测试的质量和效度、信度至关重要。

Weir效度框架将传统的“信度”称为“评分效度”,把它作为整体效度验证的证据之一[11]22。命题者宜从科学性和人文关怀角度制定答案与评分标准,特别是在我国高考因高度保密性而无试测机制的国情下。因为阅卷等原因,美国SAT考试2016年 3月后实施的测试取消了原来必考的写作,而改为选考。

我国课标对评分标准也很重视,要求“合理制定评分标准”[17]80。选择性题型可通过机器自动评卷,怎么评的问题主要涉及建构性试题,如口语和写作测试等。课标提到主观性试题命题既要考虑效度,更要考虑阅卷等工作的可行性,合理制定评分标准……如听力部分主要考查学生的听力理解能力,那么评分标准就应该以学生是否听懂为依据,评分标准要灵活处理书写的准确性问题;写作部分主要考查学生以书面形式表达意义、传递信息、再现生活经验的能力,因此评分标准应该侧重评价这些方面的能力[17]80。

关于我国高考英语写作要求的词数问题,现行高考大纲要求词数100左右,且在考试大纲说明的书面表达评分原则中规定:词数少于80和多于120的,从总分中扣去2分。在高考高度紧张的环境下,考生很容易误判词数。纵观世界各主要英语语言测试的写作要求,鲜有同时规定写作文本的下限和上限的,而倾向于规定下限,即规定不少于多少词,如IELTS考试写作(学术类)作文一(应用文类)要求考生文章字数不能少于150字,否则将会被扣分,字数多于150字不会被扣分;作文二(论述性)要求考生文章字数不能少于250字。建议今后不宜苛求考生精确将写作词数控制到某个闭区间,而只约定词数下限。

改革高考写作评分办法。高考书面表达的评分区间太大(0~25分),导致评分主观性较大,且高考阅卷因为时间非常紧张,尽管有双评制,评分员可能给保守分。实际上,国际上大型英语语言测试的评分区间都很小,这是充分考虑到了人本身的认知局限性,如托福写作(含综合写作和独立写作两节)均从0到5的评分标准进行评分,两项写作任务的平均分数最终再被转换为0到30分,而不由评分员直接在0~30分赋分区间评分。2016年3月后实施的SAT考试将写作改革为选考,实行双人评分,每位评分员分别针对阅读、分析和写作能力赋分,赋分区间为1~4分,然后将两个评分员的赋分相加,最后考生在SAT作文部分得到3个分数,分别针对阅读、分析和写作能力,每项的得分区间为2~8分。评分员无法被训练成精密的测量仪器,无法获得区间较大的刻度感。笔者建议评分也应该借鉴自然科学领域的“实验具有可重复性”原则,否则无法确保评分的公平性,最终威胁测评效度。借鉴国外阅卷,改革我国语言测试作文赋分和阅卷方法,以确保测试公平,并让写作测试促进学生写作能力的提高[31]。

3 命题素材

选择合适的命题素材或命题情境是重要的命题前期核心环节,各个题型都涉及命题素材的选择,如听力测试、听说综合技能测试、阅读理解、写作或读写综合测试等。国外著名测试机构对命题素材的选择很重视,对命题素材就有专门文件约定筛查审核环节,涉及对命题语篇话题、语篇类型、词汇难度、语言难度或文本易读度(readability)、长度、敏感性,公平性等。我国高考命题对素材等已有严格全面的规范,如高考命题质量标准中规定了多项政治性、公平性要求[32]。

3.1 导向性

基于核心素养的课标意在最终教育目标——立德树人,作为学考或高考的命题素材应体现思想性、教育性,让考生潜移默化受到正面隐性教育。《教育部关于全面深化课程改革落实立德树人根本任务的意见》(教基二[2014]4号文件)要求加强考试招生和评价的育人导向。立德树人的教育目标并非口号,它有利于提高国民素养,各国均重视德行教育,如美国重视对学生个性品质、价值观方面的教育,培养诚实公正礼貌责任尊严忠诚宽容等品德,使学生形成良好的品德和正确的价值观,以提高公民素养[33]。

部分命题素材体现社会主义核心价值观或中外文化,树立文化自信。命题素材兼顾人文性与科学性,间接体现核心素养培养目标。课标对命题语篇有明确建议,如“在阅读理解部分,可以适当选择涉及文化背景和文化差异、情感态度和价值观的语篇”[17]77。但是,选择命题素材时应考虑测量目标,如富含中国传统文化元素的文本就不适合用来测试阅读或听力理解能力,因存在信息差先天缺陷,内容可能对一般考生缺乏挑战性,可能沦为主要测试考生的中国文化知识,此类语篇如命制语法填空题型等更妥当。

高考命题素材来源宜规避我国一般师生较易接触到的命题来源,且应频繁而无规律变化,以应对备考方出于押中命题素材的心理而进行投机性备考,否则可能强化愈演愈烈的题海战术。

3.2 课标吻合度

课标对文学性语篇进行了强调,文学作品是潜移默化培养读者人文情怀、人文修养和文化品格的重要媒介,高考适当选用优秀文学语篇将对教学产生正面影响。课标在传统听说读写的基础上增加了语言技能——“看”,这个新要求在纸笔测试中可通过选用非连续性文本或混合文本作为阅读理解等命题素材来体现。

文化知识可融入到命题素材中,涉及中外文化知识,并根据考查题型而科学选择匹配的题型进行命题。关于命题素材的语篇类型,参见课标多样化的语篇类型。就命题主题来看,严格地说,学考和高考有差异,例如,课标学业质量标准二级水平即学考语篇建议为“学生能够围绕有关社会生活、品行与道德、人与自然等话题……”,四级水平即高考要求建议语篇为“学生熟悉或不太熟悉的话题”,学考选择一般学生相对熟悉的话题,而高考则未加限制,可以选择“不太熟悉的话题”作为命题素材。

3.3 语言的真实地道性

面向21实际核心素养的测评原则之一是选择真实情境考查问题解决能力[34],经合组织研发的PISA测试对真实性特别重视,如科学部分的命题注重选择实际生活情境。语言测试的真实性原则从命题素材或命题情境的选择就开始体现。英语测试也应依据真实的生活情境或素材,如招聘广告类命题素材不能缺乏简历投递截止时间和联系方式等真实生活中招聘广告的必需元素。

课标也在教学和测试材料中提倡“真实、多样的语篇材料和语篇形式”[17]17,“学生有机会接触更多真实生活中的语篇”[17]38,“考题的设计……在选择语言素材时,要尽量使用真实、地道、典型的当代英语素材,可根据考试的目的和学生的语言水平,对真实的语言材料进行适当的删减和改写”[17]79。但还应关注删减改写时命题者首先要充分理解原文,并确保加工后的文本保持语篇意义的独立性、完整性和衔接性。

英语测试素材必须高度关注语言质量,语言地道至关重要,在某些题型中甚至直接影响到答案制定而可能导致命题瑕疵。

4 命题技艺

命题是一项高度专业性的任务,从20世纪80年代后期以来,我国高考命题技艺水平一直在改革与完善,已积累较成熟的命题制度和经验。借鉴美国ETS的测试审题标准和我国现行高考命题原则,研究者提出高考命题质量审查原则包括:原创性、科学性、敏感性、公平性、编校规范性[28],如何在常规命题原则的基础上进一步融汇核心素养因素以直接或间接考查或导向是一个宏大的课题,本文仅作简述。

4.1 语言能力

语言能力的考查是终结性学考和高考的核心。对作为语言技能的基础语言知识部分,课标进行了改革,语言知识包括语音、语法、词汇、语篇和语用知识,其中的语篇和语用知识以前也要求或测试,课标单独提出以凸显其重要性,这点也宜体现到命题者挖掘对语篇和语用知识点的命题。除了命题关注外,在评分标准的制定上也可体现,如写作评分标准提高对考生语篇能力的要求。为了导向我国基础英语教育真正扭转过分重视知识而轻语言技能与语言运用能力的状况,命题不宜设计偏难怪的语言知识考点,而将命题重心置于语言技能或语言综合运用能力考查。

4.2 文化品格

文化品格是指对中外文化的理解和对优秀文化的认同,是学生在全球化背景下表现出的文化意识、人文修养和行为取向,文化品格的培育有助于学生树立世界眼光,增强国家认同感和家国情怀,学会做人做事,成长为有文化修养和社会责任感的人[17]5。文化品格无法用终结性测试考查,但文化知识可测,虽文化知识考查主要体现在命题素材的选择上,但是在命题环节也可体现,“试题的设计可以引导学生对其中的文化差异进行理解和判断,对语篇反映的情感态度和价值观进行分析和阐释,写作试题可引导学生对现象、观点、情感态度进行比较和分析,并在此基础上发表自己的观点、态度和价值判断……”[17]77。

4.3 思维品质

本轮各科课标修订目标都非常重视思维品质,表现在逻辑性、批判性和创造性等方面。课标提倡要通过语言材料的选择、考查重点的设置、考试项目和考试形式的设计等,直接或间接地考查考生的思维品质[17]77,本文以阅读理解和写作任务的命题为例,简述如何关注思维品质的考查。

阅读理解一直是我国高考英语科重要的被测技能,命题时首先提炼课标对学考和高考的分级思维目标要求。课标之学业质量标准分级进行了思维要求,要准确把握这些目标描述中使用的“阐释”“评价”“分析”“比较”“理解”“区分”“找出”等描述词语的内涵差异[35]。明确思维考查层次后,命题者在具体试题设计中予以体现,命题者考虑到我国高中生的思维现状,避免考查过多低级思维层次的题目。对批判性思维能力的考查,我国高考现有阅读理解多项选择题题型也可考查[36],有的思维层级若无法在现行题型考查且对考生发展和人才培养又非常重要,可进行题型改革,如借鉴国外测试进行新题型引入与改良,美国SAT阅读测试中的双语篇阅读(Paired Passages)很利于考查批判性思维能力。

关于写作测试,考察国外母语或外语写作测试实践,兼顾考查独立思考能力、逻辑思维能力以及语言表达能力等。我国也应在教育测量中注重对独立思考和自由表达能力的考查,在教育考试中具体体现“鼓励创新、鼓励独立思考”,通过命题为核心素养培育目标作出贡献。我国课标认为“写作试题可以引导学生对现象、观点、情感态度进行比较和分析,并在此基础上发表自己的观点、态度和价值判断,以考查学生的思维能力”[17]77。英文写作是重要的英语语言表达和书面英语交际技能,写作也是发展问题解决能力和批判性思维技能的重要渠道[37],但也是中国英语学习者的弱项。我国传统高考英语写作应用文比例偏高,建议减少考查功能有限的应用文比例,而增加议论文等语篇类型的写作任务,选取贴近学生生活、贴近现实和社会的题材,如增加社会文化类话题,通过语言测试的反拨作用引导学生关注社会、生活和人生,培养学生的社会责任感和人文素养等,增强问题解决和批判性思维能力,发挥教育测试的隐性育人功能,扭转学生“两耳不闻窗外事,一心只读圣贤书”的状况。2016年10月,高考综合改革试点省浙江启用了有利考查考生思维力的读后续写题型,提高了对考生思维内容组织能力的要求。为了用写作题型培养思维品质这项核心素养,建议进一步研发基于证据的读写综合 题 型(Evidence-based reading-into-writing tasks),并考虑认知效度、语境效度和评分信度。

5 结语

基于核心素养的英语学考与高考命题是一个宏大的话题,本文仅从部分维度抛砖引玉。核心素养的培养任重道远且有跨学科性,首先应体现到学校课程规划与管理、学校教学活动中,作为教育中重要环节之一的教育测评也应承担这项重要责任,有效运用形成性评价并科学且尽量“去功利化”地体现到综合素质评价这一高考参考依据中,以纠正师生“考什么教什么,考什么学什么”的功利化思想;同时,在终结性评价如学业水平考试和高考命题中对核心素养教育目标进行科学、有效体现和导向。同时,学界和社会应对学考与高考秉持合理科学的期待,因高考环节无法也不能荷载所有的教育期待,只有各环节系统推进和践行,才能逐渐推进我国核心素养、立德树人宏伟教育不断前行。

(感谢北京外国语大学韩宝成教授提供有关交流信息。)

[1]林崇德.21世纪学生发展核心素养研究[M].北京:北京师范大学出版社,2016:2.

[2]于涵.2016明德论坛:高考改革与核心素养[EB/OL].(2016-11-07)[2016-11-08].http://edu.china.com.cn/2016-11/08/content_ 39658617.htm.

[3]Board of Senior Secondary School Studies.Final Report:Integrating the Key Competencies into the Assessment and Reporting of Stu⁃dent Achievement in Senior Secondary Schools in Queensland[R].Queensland,1997.

[4]胡知凡.基于高中美术学科核心素养的命题与测评[J].教育参考,2016(4):9-17.

[5]吴成军.基于生物学核心素养的高考命题研究[J].中国考试, 2016(10):25-31.

[6]幸世强.聚焦数学学科核心素养的高考命题视角——以2016年四川高考数学试题为例[J].教育科学论坛,2016(10):48-51.

[7]李筱菊.语言测试科学与艺术(第2版)[M].长沙:长沙湖南教育出版社,2001:78.

[8]KIM J,DAVIDSON F.Effect-Driven Test Specifications[C]//The Companion to Language Assessment II:7:47.2013:788-795.

[9]American Educational Research Association,American Psychologi⁃cal Association,and National Council on Measurement in Educa⁃tion.Standards for Educational and Psychological Testing[M].Wash⁃ington,D.C:American Educational Research Association,2014:76.

[10]BACHMAN L F,PALMER A.Language Testing in Practice[M].Ox⁃ford:Oxford University Press,1996:17.

[11]WEIR C J.Language Testing and Validation:An Evidence-Based Approach[M].Basingstoke:Palgrave Macmillan,2005.

[12]董亚芬.我国英语教学应始终以读写为本[J].外语界,2003(1): 2-6.

[13]辛涛.学生发展核心素养研究应注意几个问题[J].华东师范大学学报(教育科学版),2016(1):6-7.

[14]崔允漷.追问“核心素养”[J].全球教育展望,2016(5):3-10.

[15]BACHMAN L F.Modern language testing at the turn of the centu⁃ry:assuring that what we count counts[J].Language Testing,2000, 17(1),1-42.

[16]刘新阳,裴新宁.教育变革期的政策机遇与挑战——欧盟“核心素养”的实施与评价[J].全球教育展望,2014(4):75-85.

[17]教育部.普通高中英语课程标准(征求意见稿)[S].2016.

[18]陶百强,李明楷,李建平.对我国高考英语命题中建构性题型答案可控性的探讨[J].中国考试,2014(10):22-34.

[19]HALADYNA T M,RODRIGUEZ M C.Developing and validating test items[M].New York,NY:Routledge,2013:28.

[20]ANDERSON L W,KRATHWOHL(Eds.).A Taxonomy for Learn⁃ing,Teaching,and Assessing:A Revision of Bloom’s Taxonomy of Educational Objectives[M].New York,NY:Longman,2001.

[21]HALADYNA T M,DOWNING S M.A taxonomy of multiplechoice item-writing rules[J].Applied Measurement in Education, 1989:37-50.

[22]陶百强,陈效.我国高考英语考试大纲(说明)的问题与思考[J].教育与考试,2008(4):29-34.

[23]CHAN,SATHENA HIU CHONG.Establishing the validity of read⁃ing-into-writing test tasks for the UK academic context[D].Univer⁃sity of Bedfordshire,2013.

[24]刘庆思,程蒙蒙.关于高考英语科启用语篇型语法填空题的研究[J].中小学外语教学,2013(11):1-5.

[25]LEWKOWICZ J A.Authenticity in language testing:some outstand⁃ing questions[J].Language Testing,2000,17(1):43-64.

[26]黄大勇.语言测试中的真实性概念[J].语言教学与研究,2004(2):77-80.

[27]ALDERSON J C.Assessing Reading[M].Cambridge University Press,2000.

[28]陶百强,刘清华,李明楷.关于高考实施社会征题的思考[J].中国考试,2016(5):48-57.

[29]ETS.How the SAT is Scored[EB/OL].(2015-08-20)[2016-04-16].https://sat.collegeboard.org/scores/how-sat-is-scored.

[30]谢小庆.测验效度概念的新发展[J].考试研究,2013(3):56-64.

[31]陶百强.2016年高考英语全国卷命题比较研究与建议[J].考试研究,2016(5):14-30.

[32]李光明,等.教育考试国家题库——理论与实践[M].北京:高等教育出版社,2014:49-50.

[33]王定华.美国基础教育:观察与研究[M].北京:人民教育出版社,2016:181.

[34]刘晟,魏锐,等.21世纪核心素养教育的课程、教学与评价[J].华东师范大学学报(教育科学版),2016(3):38-45.

[35]程晓堂,赵思奇.英语学科核心素养的实质内涵[J].课程·教材·教法,2016(5):79-86.

[36]乔辉.批判性思维及其在英语阅读中的考查[J].中国考试,2010(4):45-49.

[37]DEMPSEY,et al.Helping preservice teachers learn to assess writ⁃ing:Practice and feedback in a Web-based environment[J].As⁃sessing Writing,2009,14(1):38-61.

An Exploration into Item Writing for the English Achievement Test&NMET

TAO Baiqiang
(Sunducation Educational Research Institute,Nanchang 330032,China)

Four core competencies including linguistic competence,cultural literacy,thinking quality and learning capacity are stipulated in China’s latest high school English Curriculum Standards,thus establishing the guiding principles for English subject core competencies-based comprehensive quality assessment and item writing for the achievement test and National Matriculation English Test(NMET).It is recommended that the core competencies should be directly or indirectly integrated into item writing for the achievement test and NMET,and consequently producing positive washback to learning,teaching and ultimately to the fundamental task of education—fostering and promoting all-round personal development.The paper explores how to conduct core competencies-based item writing for the achievement test and NMET from four dimensions—test specification design,test content,item stimuli and item writing techniques.

Curriculum Standards;Key Competencies for English Subject;College Entrance Examination Reform; High School Achievement Test;Item Writing for College Entrance Examination

G405

A

1005-8427(2017)04-0025-9

10.19360/j.cnki.11-3303/g4.2017.04.005

(责任编辑:周黎明)

本文系2014年度国家社会科学基金项目“学校利益相关者视角下实施高考新方案的教育功效研究”(项目批准号:14BGL128)的研究成果之一。

陶百强(1971—),男,金太阳教育研究院英语教研组长,研究员。

猜你喜欢

大纲课标题型
50个重要的知识点 一份“学习大纲”帮您梳理党的二十大报告
离散型随机变量常考题型及解法
常见数列创新题型归纳
巧妙构造函数 破解三类题型
依托课标 夯实基础 精准备考
高中生物新旧课标比较——以实验版课标和2017版课标为例
随机抽样题型“晒一晒”
2016年全国课标卷透视与2017年备考展示
“转化策略”在课标卷选考题中的应用途径探析
紧贴实战落实《大纲》要求推进航空体育训练创新发展