试卷的设计指标和基于试题库的生成算法探讨
2021-05-26郑浩哲
郑浩哲
沈阳理工大学/信息科学与工程学院 辽宁 沈阳 110159
引言
在课程教学过程中,试卷设计是一项烦琐的工作,依据课程的教学大纲、考试大纲和试题库,自动生成高质量的试卷是近年来教学研究的一个热点问题。试卷设计的难点是如何调整试题的难度和区分度,使试卷满足预期的设计要求,文献给出了基于随机性或模糊性特征的试卷设计模型和试卷生成的遗传算法[1]、粒子群法[2]、改进的剪枝回溯法[3]和聚类的K均值算法[4]等,已有算法在空间复杂性、时间复杂性和实现的难易程度方面各有特点[5]。
本文从考试成绩的近似正态分布特征出发探讨考试及格率的度量方法;考试及格率指标与试卷难度系数和变差系数之间的关系式;试题难度系数和变差系数的估价函数;以及试卷的一种设计模型和基于试题库生成试卷的滑动窗口搜索法。
1 试卷设计指标和约束条件
1.1 考试及格率的指标变量
1.2 试卷指标间的约束关系
试卷的得分只能介于0与权重分数之间;试卷成绩尽可能趋近于正态分布。据此可以确定试卷指标间的一种约束关系为:
其中,为失真度,用于表示考试成绩偏离正态分布的程度,的取值范围在0~3之间。式(3)也是试题指标的一种约束关系,在设计试卷时,可以根据题型和试题的特点合理选取失真度的值。
2 试题选择的估价函数
试卷设计的难点是如何调整试题的难度系数和变差系数,下面给出一种简化的关系式。
对于一套由N道试题组成的试卷,试卷的可能得分s由式(4)确定。
3 基于试题库的试卷设计
3.1 设计模型
设计变量和设计目标:调整试题非负的难度系数和变差系数等设计变量,使考试的及格率达到预期的要求。
试题难度系数的界值可以根据试卷预期的难度指标确定;具体的试题变差系数可以根据题型和题目的特点确定。在设计试卷时,试题的选择也要满足知识点覆盖率、试题重复率和雷同率的设计要求。
3.2 生成算法
有多种算法生成试卷,这里给出一种基于试题库的滑动窗口搜索法。
试卷生成的滑动窗口搜索法概括如下:
步骤1 给出在试卷中的试题数量、及格分数线或规格化的及格分数线以及试卷及格率指标,并为每个试题分配权重分数;给出试题难度系数的界值等。
步骤4 按下述递推公式选择每道试题。
4 实验结果
试卷共25道题,每道题权重分数为4,按考试及格率95%确定设计指标;每道题有10道候选试题,候选试题的均匀分布随机难度系数介于65~85之间,失真度 取值在0.9~2.5之间。图1为典型迭代计算实验结果,试卷成绩的期望值为71.6,标准差为7。
图1 迭代过程
在用滑动窗口搜索法生成试卷过程中,由于试题库候选题目数量有限和设计变量的离散性,使试卷的设计目标值和试卷的设计指标会随着题目的调整而产生振荡,因此需要按预期的迭代计算精度捕捉试卷设计结果。一般情况下,用滑动窗口搜索法能够高效率地得到符合预期要求的一套试卷。
5 结束语
本文介绍了一种基于试题库的试卷设计技术,包括考试及格率的度量方法、试题的选择方法、以预期的考试及格率为设计目标建立试卷的设计模型,以及用滑动窗口搜索法生成试卷等。研究表明,本文方法概念清楚、计算形式简单和效率高,能按试卷的设计指标和约束条件,从试题库中选择试题和生成一套符合预期要求的试卷。