APP下载

基于标准化的职业教育考试题库建设研究
——以江苏中职学考题库建设实践为例

2022-09-01柴永生喻小琴

职业技术 2022年9期
关键词:题库命题试题

柴永生,喻小琴

(1.江苏省教育考试院,南京 210024;2.江苏省教育科学研究院,南京 210013)

0 引言

题库(Item Bank)是以一定的教育测量理论为基础,编制、收集具有一定质量要求,并附有代表试题特性的参数,经过分类编码便于检索的大量试题的集合[1]。江苏省中等职业学校学生学业水平考试(以下简称“江苏中职学考”)采用标准化考试方式进行,是面向该省中职学生进行的学业水平检测考试,在学业水平检测考试中,标准化题库发挥了极其重要的作用。

1 建立题库的现实背景

随着计算机技术和教育测量理论的发展,国内外部分考试机构建立了适应大规模考试的题库,其核心目标是实现命题及考试的科学化、标准化和规范化。

1.1 建立题库是考试招生制度改革发展的必然要求

题库有利于实现考试“一年多考”的目标,有利于实现考试形式由纸笔考试向机考、网考的转变,有利于实现考试的科学化、标准化、专业化、规范化、经济化。随着考试技术的发展,题库成为考试机构专业化的重要体现。《国家中长期教育改革和发展规划纲要(2010-2020 年)》提出“完善国家考试科目试题库”[2],国务院印发的《关于深化考试招生制度改革的实施意见》提出“加强国家教育考试机构、国家题库和外语能力测评体系建设”[3],《教育部关于普通高中学业水平考试的实施意见》提出“加快题库建设”[4],均把题库建设放在国家教育改革和发展的战略高度。随着职教高考制度的逐步建立,各级各类职业教育统筹发展,职业教育内部多种升学通道的考试招生体系需要大规模题库来支撑。可见,建立题库是我国各级各类教育考试发展的必然要求。

1.2 建立题库具有一定的理论和实践基础

就理论基础而言,建立题库需要遵循相关教育测量理论。部分研究者将心理测量理论、经典测量理论、项目反应理论、自适应模型等运用于题库建设,深度挖掘试题试卷的价值,推动了题库的发展。在实践方面,国外不少专业考试机构已建立起具有科学性、稳定性、权威性的题库,以适应大规模考试,如美国的TOEFL、SAT、GRE,英国的UCLES(剑桥大学考试委员会)主导的EFL(英语作为外语)水平考试等。我国在题库建设方面也进行了一些探索,如汉语水平考试、全国英语等级考试以及部分省份的考试题库等。这些探索在促进考试实施的经济性、命题的灵活性和科学性以及考试标准的稳定性方面发挥了积极作用。

1.3 建立题库是标准化考试的内在要求

尽管标准化考试本身有其优缺点,但是否选择标准化考试取决于考试的目标、方式、要求及效益等。江苏中职学考实行标准化考试,主要考虑6个因素:一是考核目标,通过考试检测中职学生是否达到教学标准规定的水平;二是考试性质,该项考试为标准参照考试,也是合格性考试;三是考生人数,每年符合报考条件的考生十余万,覆盖所有中职专业学生,规模较大;四是考试课程,有4门公共基础课程及33个专业大类基础课程,数量较大;五是考试方式,除思想政治、语文、数学外,英语和专业基础课程实行机考;六是考试条件,要求基本完成考点标准化建设,具备组织标准化考试的软硬件条件。采用标准化考试方式,题库必不可少,它直接关系标准化考试水平的高低,在多方面对标准化考试给予有力支撑。

2 职业教育考试题库的系统设计

目前,题库已不再是传统意义上的题卷存储库,而是集命题队伍管理、征题审题、组卷考试、统计分析、对接机考等功能于一体的综合管理平台。在设计职业教育考试题库系统框架时应注意以下方面:

2.1 指标体系

题库建设指标关系题库的总体水平,决定着题库的科学性、专业性和公平性。20世纪90年代,就有研究者从命题质量评价的角度提出了信度、效度、难度、区分度等定量指标。随着对试题试卷质量研究的不断深入,后来也出现了一些新的指标。例如:有研究者提出标准化题库的六大要素,包括难度、区分度、标准偏差、效度、信度、覆盖率。也有研究者从命题质量角度提出了“四度六性”,“四度”包括信度、效度、难度、区分度,这是命题质量评价的定量指标,“六性”包括科学性、准确性、公平性、适用性、合法性、完整性,这是命题质量评价的定性指标[5]。在职业教育考试题库建设实践中,考试机构应根据不同的考试目标和要求确定相应的定量和定性指标,构建有利于实现考试目标、发挥题库功能、科学完整的指标体系。江苏中职学考题库建设指标中包含了定量指标和定性指标,其中定量指标包括信度、效度、难度、区分度、覆盖率等,定性指标包括科学性、标准性、规范性、安全性等,这些指标构成了有机统一的指标体系。

2.2 试题属性

试题属性指试题包含的各类特征信息,对试题的命制、管理及质量评价等起到关键作用。从全面性方面讲,试题包括很多属性。有研究者提出,试题的属性指标主要分基本信息、学科属性、测量属性、素材属性、等值属性5类[6]。在这种分类中,每类属性均规定了试题不同方面详细的内容,例如:基本信息包括题型、预期难度、测试类型、评分方式、答案、编写日期等。题库中的试题并非一定要包含所有属性,而是要根据考试目标、试题功能、题库需要等确定试题属性。江苏中职学考题库中的试题包括自然属性、内容属性、形式属性、统计属性等方面,其结构如图1所示:

图1 江苏中职学考题库试题属性

可以看出,江苏中职学考题库试题的属性体现了考试目标、内容要求和考试方式,且具有统计分析特性,为实现目标、命题管理、成绩分析和使用等奠定了基础。

2.3 题型的选择

标准化考试的试题编制和组织实施由专门的考试机构负责,考试题型主要采用以选择题为主的客观题型,考试计分和合分采用统计学方法,考试分数的解释采用常模[7]。标准化考试包括试题编制标准化、考试实施标准化、阅卷评分标准化及分数使用标准化等,其中试题编制标准化是题库建设的重要内容。在编制试题前,确定试题的题型至关重要。江苏中职学考实施标准化考试方式,根据考试科目特点设置多种题型。机考英语课程题型与采用纸笔考试方式时相同,基本都是选择题;其他机考专业课程,仅设置单选题、多选题和判断题三种题型。机考课程的题型选择兼顾了考试内容、学科特点、知识覆盖、考试效率等因素,均从规定的选项中选择正确答案,从这个意义上看,江苏中职学考的基本题型是选择题。需要说明的是,标准化考试不等于选择题考试,部分主观性试题如填空题、解答题等,也能运用于标准化考试。江苏之所以将选择题作为题库的基本题型,就是因为综合考虑了考试的目标、形式、效率和效益等因素。

2.4 题库系统设计

对职业教育考试题库的系统设计一般要考虑以下几方面:建设题库的目标、所组试卷的功能定位、试题质量控制、试题参数设置与校准、组卷策略等[6]。这是对题库管理系统进行的整体设计,属于题库系统设计的“微观”方面。随着计算机技术的快速发展和教育测量理论的深入应用,考试技术不断成熟,为建立集试题管理系统、试卷生成系统和命题教师管理系统等于一体的大规模题库系统提供了技术支撑。在当前复杂的外部环境下,应注重职业教育考试题库的系统性和整体性,也就是说,在设计题库系统时,既要关注题库内部因素,如题库的目标、功能、参数、题型、策略等,又要关注题库外部因素,如安全、标准、基础条件等。江苏中职学考题库系统包括五个部分:标准规范体系、安全保障体系、基础设施、数据存储体系、题库管理系统。

标准规范体系。标准规范是题库系统建设和运行的依据,包括命题管理标准、试题质量标准、评价标准、信息编码标准、试题试卷标准等。有了这些标准规范,才能实现征题与命题、命题与考试、命题与统计分析等模块之间的业务承接和数据贯通,在不同模块之间建立联系,形成有机整体,最终实现建设高水平职业教育考试题库系统的目标。

安全保障体系。安全是题库系统建设和运行的重中之重,在建设过程中要加强环境、数据、软件等信息化层面的安全管理。

基础设施。这是题库系统建设和运行的重要保障,确保题库系统在保密办公环境中运行。

数据存储体系。统筹命题及资源数据的存储结构和使用模式,将基础信息库、题库、资源合为一体,为实际应用提供数据资料。

题库管理系统。这是题库建设的核心,包含系统业务模块、基础业务模块、征题业务模块、第三方工具等建设要素。

3 职业教育考试题库的实践探索

建设基于标准化的职业教育考试题库是一项周期长、投入大、人力多的系统工程,仅就编写试题而言,从确定试题属性各类指标、组织大批学科教师编写和修改试题,到对试题的科学性和有效性抽样测试,以及对试题参数进行评估和校正等,都需要投入大量的人力、物力、财力以及时间统筹建设。

3.1 命题规范的制定

命题规范包括考试目标、命题思路、工作原则、技术标准及编制程序等重要内容,是试题编制的指导性文件,能够指导命题教师按统一的标准编制试题。试题设计的质量关系到整个题库的质量,关系到考核的准确性和有效性。试题要有科学性、纲领性、有效性、严谨性、公平性和针对性[8]。江苏省根据中职学校教学实际,建立了一套符合中职学考特点和要求的命题规范。有了科学完整的命题规范和素质较高的命题队伍,题库试题的质量就有了重要保证。

3.2 题库建设的推进

职业教育考试题库建设是一个复杂的系统工程,需充分调研,周密计划,有序推进。江苏中职学考具有与普通高中学业水平考试不同的特殊性和复杂性,涉及上百个中职专业和数十个专业综合课程。每个课程都有单独的考试大纲和要求,情况十分复杂。考试分为笔试和机考两种形式。3个笔试科目命制10余套电子试卷,存储于题库中。34个机考课程每科命制3000道及以上试题,命题任务量大。江苏专门制定题库建设总体规划,大致分为调研筹备、系统研发、征题审题、组卷考试、维护升级等五部分。每个部分制定详细具体的工作计划,并加大人力、物力、财力保障力度,稳步推进题库建设工作。

3.3 题库系统的管理

职业教育考试题库建成后,试题内容的修订、组卷策略的调整、试题参数的校准、题库系统的维护等便成为题库管理工作的主要内容。首先,要定期或不定期修订题库试题,处理好试题曝光、知识更新等原因造成合格试题数量减少的问题;其次,要跟踪试题的各项参数指标,不断提高试题的质量,特别是用于考试后的试题,要及时统计它们的实测难度,然后对命题教师预估的难度进行校准,使试题的“真实”难度更准确;再次,对实测数据进行统计分析,合理调整组卷策略中的能力层次、覆盖面及知识点比例,使所组试卷更有效地实现考试目标;最后,还要对题库系统的软硬件环境进行检查和维护,采取防护措施,确保题库运行的安全性。

3.4 题库使用的效果

当前,职业教育考试题库的使用主要包括组卷考试及统计分析两个方面。组卷考试是题库使用的重要内容,所组试卷对试题质量和教学质量进行检验,才能发挥题库的检测功能。江苏加强对中职学考题库的研究,根据部分中职学生模拟测试结果,研究确定组卷策略,组卷后由部分中高职院校专业教师对试卷进行审查校对,最后用于考试。从目前情况看,江苏中职学考题库容量大,试题较为成熟,已具备多次考试的基础。每次入闱组卷时间较短,约一周;需要的专业教师不多,约20人;根据考生人数确定组卷套数,每次组卷数百套,试卷数量大。可以看出,江苏中职学考题库极大地节约了每次封闭命题付出的经济成本,题库使用的经济效益显著。

题库作为教育测量工具,更重要的功能是收集测试数据,进行统计分析,从中发现试题编制、教学过程以及学生学习的问题。江苏中职学考每次考试结束后,教育部门均组织专家对考试成绩进行统计分析,形成分析报告,评价中职学校教学质量和中职学生学业水平,从而促进中等职业教育的发展。由此可见,江苏中职学考题库蕴含着巨大的社会效益。

4 题库发展趋势展望

当前,题库促进了命题模式和工作方式不断变化,使教育考试进一步科学化、标准化、专业化、规范化。从长远发展的角度看,题库将促进现行考试命题理论和技术的改进,推进教育考试改革。题库已成为一个由计算机管理的动态的质量控制系统,它不仅是试题本身的管理平台,也是命题工作的管理平台,将来还是实现自适应考试的平台。随着计算机技术、网络技术和命题技术的不断发展,题库建设将呈现以下发展趋势。

4.1 智能化

所谓题库智能化,就是由题库系统自身的逻辑算法对题库内部试题进行分析,能动地实现题库管理目标和要求,这是标准化题库建设追求的重要目标。根据当前题库建设发展的要求看,题库智能化主要包括:一是智能分析试题质量。这是一种考前进行的题库内部分析,主要用来检测试题的规范性问题。即根据题库实际,将关于试题规范性和重题等质量方面的人工审查项目交由题库系统自身来检测,并将发现的问题反馈给管理者,由管理者组织专业教师修订。尽管这一分析对提高试题质量的作用有限,但这种尝试有利于提高修订效率,修订记录也可作为分析试题质量的参考。二是智能组卷。目前的题库根据考试机构制定的规则,即通过组卷策略实现自动组卷,而组卷策略却不能通过题库系统智能生成。今后的题库应能够通过系统分析各门课程的试题情况,综合考虑覆盖面、题型、难度、题量等指标,自动生成组卷策略,减少主观因素对试卷的影响。三是智能等值,即通过对几年实测数据的智能分析,将由题库系统所组各套试卷的难度控制在规定区间,尽量做到试卷间的“同质性”,确保考试的客观公平。

4.2 网络化

题库网络化指基于安全和效率,在网络中对题库进行建设、维护与管理,主要包括前端网络化和后端网络化两个方面。前端网络化指题库建设过程中征题、审题等工作在公共网络中进行,需要两个前提:一是公共网络的安全,即采取措施防范网络安全风险,确保网络安全;二是试题内涵的界定,按传统思路,国家题库属于涉密信息系统,按照涉密相关的管理规定,国家题库的功能定位很难与外部交互[9]。因此,准确界定试题内涵对题库网络化十分关键。由于试题的正式入库有个过程,故应将正式入库前与试题有关的内容定性为试题素材,命题教师在公共网络中进行操作,但仍需要求命题教师保密。后端网络化指审定合格的试题进入正式题库后,题库的修订、组卷、维护等工作在涉密网络中进行,实行网络化管理。前端网络化与后端网络化并非是完全隔绝的两个阶段,随着网络安全技术的日趋成熟及网络化考试技术的不断发展,题库最终会实现“完全意义”上的网络化。

4.3 自适应化

题库的自适应化能够满足题库客观精准地考查学生学业水平的要求,与之对应的是“计算机自适应测验(Computer-Adaptive Test,CAT)”。在题库系统的构建中,通常以经典测量理论(CTT)作为参数设置、选题策略的指导[10]。通过大数据技术,由计算机根据被试能力水平自动选择测试题,最终对被试能力进行评估。也就是说,如果考生之前的题目正确率较高,接下来为考生分配更难的题目;如果考生之前的题目正确率较低,接下来为考生分配更简单的题目。随着分配试题的变换,计算机系统对被试能力的估计精度越来越高,最后的估计值将聚焦于一点,该点就是被试的能力水平较精确的估计值。这种测验要求题库具有很强的自适应能力,以便实现针对不同对象进行检测并得出相对客观准确的评价结论,从而提高自适应考试的针对性和有效性,这应是题库建设发展的高阶目标。

5 结语

建立基于标准化的职业教育考试题库,无论是促进考试招生改革发展,还是推动教育整体发展,都具有深远意义。职业教育考试招生是十分复杂的系统工程,考试面向的对象不同,涉及的学科门类众多,选拔的目标要求不一,对于题库建设具有较高的要求。建立大规模、多课程、全覆盖的职业教育考试题库,要综合考虑考试的性质、目标、内容、特点等因素,明确题库建设的定量指标和定性指标等技术性要求,建立完整、详细且满足需求的指标体系。在此基础上,系统设计题库的总体框架,加大相应投入,建设并完善题库系统。在条件成熟的情况下,逐步探索满足智能化、网络化、自适应化要求的职业教育考试题库,进一步推动职业教育考试招生的改革发展。

猜你喜欢

题库命题试题
2021年高考数学模拟试题(四)
“勾股定理”优题库
“轴对称”优题库
“轴对称”优题库
“整式的乘法与因式分解”优题库
2019年高考数学模拟试题(五)
《陈涉世家》初三复习试题
2019届高考数学模拟试题(二)
2012年“春季擂台”命题
2011年“冬季擂台”命题