APP下载

Excel在效度计算与检验中的应用

2019-10-10张运明

中国教育技术装备 2019年3期
关键词:效度函数

摘  要 效度是教育测量中最基本、最重要的问题,是选择和评价教育测量质量的重要指标。人们常用统计分析方法计算与检验效度。对Excel而言,计算与检验效度非常准确且极为简便。以计算与检验点二列相关系数为例,作一简要介绍。

关键词 教育测量;Excel;函数;效度;点二列相关

中图分类号:G633.6    文献标识码:B

文章编号:1671-489X(2019)03-0052-03

1 前言

对于任何一种测量来说,信度都是必不可少的条件,但并非唯一的条件。而对教育测量来说,效度显得更为重要。在教育测量中,效度是某一测验能够正确地测量它所要测量的特征或功能的程度。测量结果与要考察的内容越吻合,则效度越高;反之,则效度越低。效度是相对的,仅针对特定目标而言,因此只有程度上的差别。不同于信度反映测验一致性的程度,效度反映测验的准确性程度。效度是教育测量中最基本、最重要的问题,是选择和评价教育测量质量的重要指标。使用传统方法计算与检验效度系数容易出错且相当低效,而使用Excel技术却是非常准确且极为简便的。

2 效度系数计算与检验的原理

考验效度的方法很多,其中J.W.弗伦奇和W.B.米歇贝(French & Michbel)根据测验目标,把效度分为内容效度、构想效度和效标关联效度。这种分类为美国心理学会在1974年发行的《教育与心理测验的标准》一书所采纳,成为通行的效度分类方法。其中,效标关联效度指测验分数与效度标准(简称效标)的一致程度,分为同时效度和预测效度。效标是衡量测验有效性的参照标准,常见的效标主要有学业成就、等级评定、临床诊断、特殊训练成绩、实际工作表现和其他测验成绩。由于可以进行量化分析,因而在教育测量中,效标关联效度应用最为广泛。

效标关联效度的计算方法较多,常用相关法、分组法、回归法、命中取舍法、预期表法。相关法又包括积差相关、二列相关、点二列相关、四分相关、Ф相关、列联相关等。由于相关系数是一种统计量,因此,这种效度又称统计效度。一种测验与效标之间的相关系数称为效度系数。效度系数越大,测验的效度越高。

点二列相关的一列变量是等距或等比的总体分布为正态的连续测量数据,另一列是真实二分称名数据。

连续变量是在一定区间内可以任意取值的变量,其数值是连续不断的,相邻两个数值可作无限分割。等距变量和等比变量属于连续变量。等距变量既有测量单位,又有相对零点,只能进行加、减运算,如考试分数、温度。等比变量既有标准的测量单位,又有絕对零点,可以进行加、减、乘、除运算,如身高、体重。

称名变量只说明某一事物与其他事物在属性上的不同或类别上的差异,数值一般都是整数形式,只计算个数,并不说明事物之间差异的大小。如果称名变量只有两类结果,则称为二分称名变量。二分变量又分为真正的二分变量和人为的二分变量两种。真正的二分变量是离散型二分变量,如男、女。人为的二分变量,是指该变量本身是一个连续型的测量数据,两种结果之间本来是一个连续统一体,但被某种人为规定的标准划分为两个类别。

在这种情况下,一个测量结果很明显地要么属于这个类别,要么属于另一个类别,两种类别之间一般也不会被看作是连续的,如合格、不合格。所谓点二列,就是连续数列的数据点与真正二分数列中的点存在一一对应的关系,这两个数列就是点二列。点二列相关系数的计算公式为:

式中,是与二分称名变量的一个值对应的连续变量的平均数,是与二分称名变量的另一个值对应的连续变量的平均数,p与q是二分称名变量两个值各自所占的比例(p+q=1),St是连续变量全部数据的标准差。

点二列相关系数的取值在-1~1之间,绝对值越接近1,相关越高,其显著性检验常用t检验法和临界值法。t检验统计量公式为:

使用临界值法时,如果实际计算的rpb大于等于临界值,则拒绝零假设,认为两个变量之间存在真正相关;如果实际计算的rpb小于临界值,则不能拒绝零假设,认为两个变量之间不存在真正相关。积差相关系数r的临界值可由自由度为n-2的t分布临界值计算得到,公式为:

二列相关的两列数据均属于正态分布,其中一列变量为等距或等比的测量数据,另一列是人为二分称名数据。计算二列相关系数有两个等效公式:

二列相关系数的显著性检验可近似地进行Z检验:

点二列相关与二列相关的区别在于二分变量是否为正态分布。如果不是十分明确,此时就不管二分变量是真正的二分变量还是人为的二分变量,就统一用点二列相关;只有确认二分变量是正态分布时,才选用二列分布。

除了用于计算效度,点二列相关、二列相关还常用于计算判断题、主观题的区分度,而区分度又要受难度的影响。其他各类相关都有相应的计算公式与检验方法,这里不再赘述。

3 效度系数计算与检验的实例

在Excel中,计算与检验效度系数是非常方便、快捷的,本文以点二列相关法为例作一介绍。

【例】有一位教师自编一套测验题,用来预测一年后的英语成绩。自编测验题按百分制评分,一年后进行英语测验,把学生分为及格与不及格两类进行评定,及格记为1,不及格记为0,测验结果如图1所示。试估计自编测验题的预测效度并进行检验。(α=0.05)

【分析】自编测验题得分为连续变量,一年后的英语测验为二分称名变量(效标),由于难以判断二分变量是否为正态分布,本例就计算点二列相关系数。

【解】为便于理解,将两次测验的成绩与点二列相关系数的计算与检验都布局在一张Excel工作表中,布局如图1所示。在F列各单元格输入函数公式,以实现自动计算。

F2单元格的公式为“=COUNT(B3:B16)”。COUNT函数计算包含数字的单元格以及参数列表中数字的个数。

F3单元格的公式为“{=AVERAGE(IF(C3:C16,B3:B16))}”。

式中,IF函数是用于逻辑比较的函数,其语法形式为“如果(内容为TRUE,则执行某些操作,否则就执行其他操作)”,第三参数为“FALSE”或“0”时可省略。IF函数在这里的作用是将C列空单元格对应的B列的数据转换为逻辑值FALSE。IF函数判定的结果为“{65;12;26;44;66;45;60;

FALSE;28;FALSE;FALSE;28;35;30}”,該结果作为AVERAGE函数的参数。AVERAGE函数返回参数的算术平均值,如果区域或单元格引用参数包含文本、逻辑值或空单元格,则这些值将被忽略,但包含零值的单元格将被计算在内,所以这里只计算“{65;12;26;44;66;45;60;28;28;35;30}”等11个数字的平均值。“{}”为数组公式的标志,不要手动键入该花括号。在编辑栏输入公式后,按下“Ctrl+Shift+

Enter”组合键,就会自动锁定数组公式。

F4单元格的公式为“{=AVERAGE(IF(C3:C16,TRUE,B3:

B16))}”。式中,IF函数在这里的作用是将C列不为空的单元格对应的B列的数据转换为逻辑值TRUE。IF函数判定的结果为“{TRUE;TRUE;TRUE;TRUE;TRUE;TRUE;TRUE;25;TRUE;

24;32;TRUE;TRUE;TRUE}”,该结果作为AVERAGE函数的参数。AVERAGE函数只计算“{25;24;32}”等三个数字的平均值。

F5单元格的公式为“=COUNTIF(C3:C16,1)/F2”。式中,COUNTIF是一个用于统计满足某个条件的单元格数量的统计函数,其语法形式为“=COUNTIF(要检查哪些区域,要查找哪些内容)”。

F6单元格的公式为“=1-F5”。

F7单元格的公式为“=STDEV.P(B3:B16)”。式中,STDEV.P函数计算基于以参数形式给出的整个样本总体的标准偏差(忽略逻辑值和文本)。如果只计算样本的标准偏差,则使用STDEV.S函数。这里没有使用原始公式或推演公式进行计算。

F8单元格的公式为“=(F3-F4)/F7*SQRT(F5*F6)”。式中,SQRT函数返回一个参数正的平方根。该式按照点二列相关系数的公式进行计算。

F10单元格的公式为“=F2-2”。

F11单元格的公式为“=F8*SQRT(F2-2)/SQRT(1-F8^2)”。

该式按照t检验统计量公式进行计算。

F12单元格的公式为“=T.INV.2T(F9,F10)”或“=T.INV(1-F9/2,F10)”。式中,T.INV.2T函数返回学生t分布的双尾反函数,其语法形式为“T.INV.2T(与学生t分布相关的概率,自由度数)”。T.INV函数则返回学生t分布的左尾反函数,其语法形式为“T.INV(t分布概率,自由度数)”。借助t分布的Excel函数,计算出点二列相关系数的临界值,就免除了查临界值表的手工操作,能显著提高工作效率。

F13单元格的公式为“=SQRT(T.INV.2T(F9,F10)^2/(F10+

T.INV.2T(F9,F10)^2))”。因为t分布的平方等于F分布,所以式中的“T.INV.2T(F9,F10)^2”也可以用“F.INV.RT(F9,1,F10)”代替。F.INV.RT函数返回右尾F概率分布函数的反函数值,其语法形式为“F.INV.RT(累积分布的概率值,分子自由度,分母自由度)。使用该函数计算t分布临界值,也就不需要再查临界值表了,工作效度得以提高不言自明。

F14单元格的公式为“=IF(F11>F12,"拒绝H0","不拒绝H0")”。本例t=1.219

rα(n-2)=0.532 4,rpb小于其临界值,故结论也是自编测验题的效度较低。

F9单元格可设置数据验证(数据有效性),以方便选择。使用“序列”类型,序列为“″0.01,0.05”。

两次测验的成绩、点二列相关系数的计算与检验结果如图1所示。

4 结语

在Excel工作表中可以按需要灵活地进行布局。运用函数公式时,要注意对单元格或区域的行、列的相对引用或绝对引用,以提高自动化计算水平。对B、C的原始数据,可以定义为名称,嵌套在上述有关公式中,这样就能做出一个高效模板,原始数据个数增加或减少都没有关系,不必去删除或插入行,或费力地修改函数公式的引用,使得点二列相关这种效度系数的计算与检验简便易行。

此外,对信度、难度、区分度等教育测量指标的计算,Excel也是轻而易举的,完全可以满足人们从事教育测量研究的需要。■

参考文献

[1]朱德全,宋及庆.现代教育统计与测评技术[M].重庆:西南师范大学出版社,1998.

[2]张厚粲,徐建平,现代心理与教育统计学[M].北京:北京师范大学出版社,2015.

[3]冯伯麟.教育统计学[M].北京:人民教育出版社,2005.

[4]张运明.Excel2016数据处理与分析实战秘籍[M].北京:清华大学出版社,2018.

猜你喜欢

效度函数
二次函数
第3讲 “函数”复习精讲
二次函数
函数备考精讲
慈善募捐规制中的国家与社会:兼论《慈善法》的效度和限度
被看重感指数在中国大学生中的构念效度
外语形成性评估的效度验证框架
复杂图形测验对区分阿尔茨海默病与非痴呆的诊断效度