四参数Logistic题组反应模型的贝叶斯估计

2017-09-03付志慧王琳琳

沈阳师范大学学报(自然科学版) 2017年3期

关键词：渐近线题组先验

付志慧, 王琳琳

(沈阳师范大学数学与系统科学学院, 沈阳 110034)

统计学

四参数Logistic题组反应模型的贝叶斯估计

付志慧, 王琳琳

(沈阳师范大学数学与系统科学学院, 沈阳 110034)

项目反应理论中4PL项目反应模型是在3PL项目反应模型基础上发展起来的,它进一步对模型进行优化,加入失误参数,即引进一条上渐近线,使得估计结果更加准确。传统的项目反应模型往往忽略题目之间的相依性,所以为了使估计更加符合实际,将4PL项目反应模型与题组反应模型结合起来,提出了4PL题组反应模型。将这个模型运算出的结果与4PL项目反应模型的结果相比较,对比结果表明:题组效应不可忽略,2组参数估计结果差异显著。其中,针对4PL项目反应模型和4PL题组反应模型的参数数据,采用WinBUGS软件进行处理。

项目反应理论; 4PL项目反应模型; 题组反应模型; WinBUGS软件

项目反应理论(Item response theory,简称为IRT)是分析教育和心理测试结果的一种重要方法,它将被试的潜在心理特质与项目的特性参数化,并且直接用概率函数的形式来表示被试是否对项目做出正确的反应[1-2]。在多维项目反应理论领域中,以往人们研究的重点基本是单参,二参或者是三参数Logistic项目反应模型(3PL),考虑到被试在能力不足时靠猜测和运气答对较难题目的情况,3PL项目反应模型中引入了猜测参数。但是随着对3PL项目反应模型的深入研究,研究者们发现当3PL项目反应模型的上渐近线为1时,有高能力的被试答对简单题的概率为1,忽略了被试有可能马虎或者其他原因失误而答错题目的现象[3]。对于这种被试有高能力却因失误而答错,使被试的能力得不到准确估计的情况,Barton和Lord(1981)最早的提出了4PL项目反应模型,引入了第4个参数—失误参数, 即添加了一条小于1的上渐近线[3-4]。这弥补了3PL项目反应模型存在的问题,使有高能力的被试就算失误答错简单题目也能得到相应的合理评估,能更准确的估计被试的能力水平。随着时代发展,人们逐渐发现了4PL项目反应模型的潜在研究价值,对这个模型重视起来。比如在精神病理学领域,Reise和Waller(2003)因多向性格测量表的模型反应要考虑上渐近线,采用了4PL项目反应模型;遗传学领域中对于生物基因研究也运用到了4PL项目反应模型等[5-6]。

随着我国教育和心理测量体系的发展和完善,越来越多的研究者关注起了考试制度[7-9]。传统的项目反应理论建立在项目间局部独立理想化的情况下,而现实中考试要求被试在规定时间内发挥出最好水平,为了让被试得到多方面的测试,一些题目使用相同的材料或刺激(如文章,图片,影像等)的现象,比如英语,语文考试中的阅读题,他们称这些题目的集合为题组(Testlet)[7-9]。所以题组反应理论(Testlet Response Theory,简称为TRT)是项目反应理论的进一步推广和发展。当条件独立的假设被局部依赖性取代,这种带有题组的模型已经不能使用项目反应模型了,于是1999年Wang Xiaohui等改进了项目反应模型,引进了一个新参数—随机效应参数[8-13]。

1 四参数Logistic题组反应模型和先验假设

其中:yij表示第j个被试回答第i题的得分,yij=0时,回答错误,yij=1时,回答正确,i=1,2,…,I,j=1,2,…,J;ai表示第i题的区分度参数,i=1,2,…,I;bi表示第i题的难度参数,i=1,2,…,I;ci是第i题的猜测概率参数,控制模型下渐近线,表示就算被试能力低第i题不会也有可能猜对,i=1,2,…,I;di是第i题的失误参数,控制模型上渐近线,表示被试拥有高能力但是由于失误(紧张、注意力不集中、生病等)第i题答错了,i=1,2,…,I;θj表示第j个被试的能力水平参数,j=1,2…,J;γjk(i)是题组随机效应参数;K表示题组数;k(i)表示第i题所在的题组,通过方差来判别项目之间的依赖性,方差越大项目局部依赖性越强;γjk(i)=0则说明项目之间是相互独立的,i=1,2,…,I,j=1,2,…,J。

贝叶斯方法需要知道参数的先验分布,令项目的参数表示为ζi=(ai,bi,ci,di),则先验假设就可以写为

其中:能力水平的先验θj～N(0,1);题组随机效应参数的先验;项目的难度参数bi服从正态分布;项目的区分度参数ai服从截尾正态分布,例如N(1,0.6)I(ai>0)。对于猜测参数ci可以选择ci～Beta(5,17)。为了模型考虑,假设上渐近线函数接近下渐线,令di～Beta(17,5)。则后验π(γjk(i),θj,ζi|y)如下:

D表示比例常数。

2 成例研究

假定有学校三年级全体328人参加共12题的语文阅读测试,12道题分为3道大题,每题有4个小题。那么对于同一个短文下几道题的反应存在相依性的可能很大。用0,1来表示被试的反应,1表示回答正确,0表示回答错误,对反应数据进行2种方法建模,第1种是假设局部独立性依然存在,用4PL项目反应模型:

第2种是假设数据具有局部依赖性,用4PL题组反应模型:

利用WinBugs软件分别对这2种模型的参数进行分析。项目数I=12, 题组数目K=3,总人数J=328;假定人的能力参数θj已知,θj～N(0,1);模型参数的先验假设为:ai～N(1,1)I(0,),bi～N(-1,1),ci～Beta(5,17),di～Beta(17,5),γjk(i)～N(0,1)。

模型的贝叶斯估计结果如表1,列出了2种模型12个项目中4个参数的均值、蒙特卡洛误差、中值和显著性水平为0.025的置信区间。可以看出考虑了题组效应问题的4PL题组反应模型所得到的参数估计值和上、下渐近线要优于4PL项目反应模型。

表1 2种模型的参数对比

表2 两种模型的参数变化情况

结合表1,表2用4PL题组模型12个项目4个参数均值,蒙特卡洛误差1中值的均值减去4PL项目反应模型的参数均值,发现了显著的变化,说明加入题组随机效应参数对结果产生了影响。就该组数据而言,可以推断出第1种假设是不成立的,采用这种独立模型估计参数值是不准确的。

3 结论

经过以上研究,可以看出传统的项目反应模型的不足,使用承认题目依赖性的题组反应模型估计参数更加准确。将4PL项目反应模型与题组模型结合起来,就模型来说,是先进的,从估计参数准确性的角度来看,得出的结果是比较令人满意的。今后对4PL题组反应模型的研究还将继续扩展,它的价值还将继续等待人们发现。

[ 1 ]漆书青,戴海琦,丁书良. 现代教育与心理测量学原理[M]. 南昌:江西教育出版社, 2002.

[ 2 ]付志慧,李斌. 多维二参数Logistic项目反应模型的Gibbs抽样法[J]. 沈阳师范大学学报(自然科学版), 2014,32(3):380-383.

[ 3 ]孟祥斌,陶剑,陈莎莉. 四参数Logistic模型潜在特质参数的Warm加权极大似然估计[J]. 心理学报, 2016,(8):1047-1056.

[ 4 ]BARTON M A,LORD F M. An upper asymptote for the three-parameter Logistic item response model[J]. Ets Research Report, 1981,1:1-8.

[ 5 ]BAKER F B,KIM S H. Item response theory: Parameter estimation techniques[M]. 2nd ed. New York: Marcel Dekker, 2004.

[ 6 ]ERIC L,KELLY L R. Estimation of a four parameter item response theory model[J]. British Journal of Mathematical and Statistical Psychology, 2010,63(3):509-525.

[ 7 ]孟庆香. 关于题组随机效应模型的模型选择[D]. 长春:东北师范大学, 2008.

[ 8 ]徐宝. 基于题组判别参数的题组反应模型的参数估计及其应用[D]. 长春: 吉林大学, 2012.

[ 9 ]涂冬波,蔡艳,漆书青,等. 项目反应理论新进展-题组模型及其参数估计的实现[J]. 心理科学, 2009,32(6):1433-1435.

[10]付志慧. 多维项目反应模型的参数估计[D]. 长春: 吉林大学, 2010.

[11]LI Y,BOLT D M,FU J. A comparison of alternative models for testlets[J]. Applied Psychological Measurement, 2006,30(1):3-21.

[12]WANG X,WAINER H,BRADLOW E T. A general Bayesian model for testlets: Theory and application[J]. Applied Psychological Measurement, 2002,1:1-37.

[13]WANG W,WILSON M. The Rasch testlet model[J]. Applied Psychological Measurement, 2005,29(2):126-149.

Bayesian estimation of four-parameter logistic testlet response model

FUZhihui,WANGLinlin

(School of Mathematics and System Science, Shenyang Normal University, Shenyang 110034 China)

The four parameters Logistic (4PL) item response model in Item Response Theory is on the basis of 3PL item response model to further optimize the model, joining an error parameter. Its meaning is to join an upper asymptote, and it makes the estimated results more accurately. The traditional item response models ignore the dependence between the items. In order to make the estimated results practical, we combine 4PL item response model with testlet response model. The 4PL testlet response model is proposed in this case. Then we can compare the 4PL testlet response model with 4PL item response model. The results show that we can not ignore testlet random effect and the parameter estimation of the two models are very different. It is a good idea to process data by WinBUGS software.

item response theory; 4PL item response theory model; testlet response theory model; WinBUGS software

2017-05-04。

国家自然科学基金资助项目(11201313); 国家统计局全国统计科学研究项目(2014LY017)。

付志慧(1979-),女,辽宁沈阳人,沈阳师范大学副教授,博士。

1673-5862(2017)03-0315-04

O212.8

10.3969/ j.issn.1673-5862.2017.03.011