APP下载

不同实验教学模式满意度分析中统计方法的选择及在SPSS19.0软件上的实现

2018-12-10丁雪梅陈承祯孙博兴丁洪浩张晓君唐明祥丛彦龙谭智敏李玉梅包国章卞建民曲大为

实验室研究与探索 2018年11期
关键词:卡方计数资料

丁雪梅, 陈承祯, 孙博兴, 丁洪浩, 张晓君, 唐明祥, 丛彦龙,王 艳, 谭智敏, 李玉梅, 包国章, 卞建民, 曲大为

(吉林大学 1a. 动物科学学院;2b. 教育技术中心;1b. 植物科学学院;1c. 动物医学学院;1d. 图书馆,长春 130062;吉林大学 2a. 教务处;2c. 新能源与环境学院,长春 130012;3. 药学院,长春 130021)

0 引 言

在实验教学中,教学效果一般通过学生的实验报告成绩进行客观评价,通过问卷调查进行主观评价[1-6]。按变量属于定性或定量,可将资料分为3种类型,即计量资料(定量资料、数值变量资料)、计数资料(定性资料、无序分类变量资料、名义变量资料)和等级资料(有序分类资料、半定量资料)[7]。一般可将计量资料转换为二分类计数资料或等级资料。如将计量资料的学生实验报告成绩转换成计数资料:优秀和非优秀,或者转换成等级资料:优秀、良好、及格、不及格。

对列联表进行教学效果评价时,数据分析方法的选择因研究目的、分组变量与指标变量资料类型以及属性相同与否等的不同而不同。在实际应用中,经常由于数据分析方法的混淆而得出错误的结论。SPSS是国际上公认的权威统计分析软件,与 SAS、SATA 相比,SPSS 突出的优点在于不需要编程,几秒钟之内便可以直接输出数据分析的结果,因而被广泛应用于自然科学与社会科学研究中[8-10]。

本文通过教学效果评价中的典型案例,运用SPSS19.0功能模块进行统计分析,以期为实验教学效果评价提供实践参考。

1 实验教学效果评价中常用的统计分析方法

例1动物科学专业某门课程实验教学,对2009级学生采用传统教学模式,作为对照组;对2012级学生采用翻转课堂教学模式,作为试验组,学生的满意度数据见表1。分析不同教学模式之间的学生满意度是否存在差异。

表1 不同组别学生的满意度 人

例2例1中,以性别分层(即性别为分层变量或控制变量),学生的满意度数据见表2。分析不同教学模式之间的学生满意度是否存在差异。

表2 不同性别和组别学生的满意度 人

例3例1中,若满意度分为3种,学生的满意度数据见表3。分析不同教学模式之间的学生满意度是否存在差异。

表3 不同组别学生的满意度 人

例4动物医学学院和动物科学学院某门课程实验教学,对2009级学生采用传统教学,作为对照组;对2011级学生采用翻转课堂教学模式,作为试验组。学生的满意度数据见表4。分析不同学院以及不同教学模式之间的学生满意度是否存在差异。

表4 不同学院和组别学生的满意度 人

例5例4中若满意度分为3种,学生的满意度数据见表5。分析不同学院以及不同教学模式之间的学生满意度是否存在差异。

表5 不同学院和组别学生的满意度 人

在实验教学效果评价中,经常遇到例1~5 5种类型满意度分析资料。例1、2的指标变量为计数资料,例2在例1基础上又以性别分层,因此例1、2分别采用四格表卡方检验和分层卡方检验。而例3的指标变量为等级资料,须采用秩和检验或Ridit分析。Ridit 分析,即参照单位分析(relative to an identified distribution unit, it是unit的字尾)[11]。SPSS软件可直接进行秩和检验,虽然没有现成的模块进行Ridit分析,但也可不用编程间接来完成[12-13]。学生成绩、满意度高低同时受到诸多因素的影响,且因素间常相互影响和制约,宜用Logistic 回归分析[14],但需建立在大样本基础上。例4、5的指标变量分别为计数资料和等级资料,分别采用二分类Logistic 回归和有序多分类Logistic回归。

2 常用的统计分析方法在SPSS19.0上的实现

2.1 四格表卡方检验在SPSS19.0上的实现

(1) 四格表卡方检验步骤。①数据录入和数据加权。数据文件见图1。加权步骤:数据→加权个案,加权个案(W)→频率变量(F):频数→确定。②四格表卡方检验。分析→描述统计→交叉表,组别→行,满意度→列,统计量→卡方→继续;单元格→观察值,期望值,行→继续→确定。

图1 四格表卡方检验的数据文件

(2) 结果解读。P值取决于n(总数)和T(理论频数)的大小[15]。试验组的满意率为78.0%,对照组的满意率为60.8%。n=133>40,最小期望计数为18.63>5,P=0.034<0.05,即不同教学模式之间的学生满意度存在显著差异(见表6),翻转课堂高于传统教学模式的学生满意度。

表6 四格表卡方检验结果

注:a.0单元格(0.0%)的期望计数少于5;最小期望计数为18.63;b.仅对2x2表计算

2.2 分层卡方检验在SPSS19.0上的实现

(2) 结果解读。由频数分布表和卡方检验结果(见表7)可知,试验组男性的满意度为75.0%,对照组男性的满意度为54.3%,n=86>40,最小期望计数为14.42>5,P=0.047<0.05,即男性2个组别的满意度存在显著差异,男性试验组满意度高于对照组;试验组女性的满意度为84.2%,对照组女性的满意度为71.4%,n=47>40,最小期望计数为4.45<5,看第二行连续性矫正P值,P=0.506>0.05,即女性2个组别间的满意度无显著差异;试验组的满意度为78.0%,对照组的满意度为60.8%,n=133>40,最小期望计数为18.63>5,P=0.034<0.05,即2个组别的满意度存在显著差异,试验组满意度高于对照组。

图2 分层卡方检验的数据文件

性别值自由度渐进P值(双侧)精确P值(双侧)精确P值(单侧)男Pearson 卡方3.958a10.047连续校正b3.11310.078似然比4.02610.045Fisher 的精确检验0.0710.038线性和线性组合3.91210.048有效案例中的N86女Pearson 卡方1.032c10.310连续校正b0.44210.506似然比1.07010.301Fisher 的精确检验0.4850.256线性和线性组合1.01010.315有效案例中的N47合计Pearson 卡方4.471d10.034连续校正b3.71310.054似然比4.56810.033Fisher 的精确检验0.0400.026线性和线性组合4.43810.035有效案例中的N133

a.0单元格(0.0%)的期望计数少于5;最小期望计数为14.42;b.仅对2x2表计算;c.1单元格(25.0%)的期望计数少于5;最小期望计数为4.45;d.0单元格(0.0%)的期望计数少于5;最小期望计数为18.63

风险估计表给出了组别(试验组/对照组)的几率比。OR值(odds ration),即优势比。男性组OR=2.520>1,95%置信区间不包括1。女性OR=2.133>1,95%置信区间包括1。表明,对于男性而言,教学模式是发生满意度差异的危险因素,女性则不是。OR值的一致性检验表给出了层间差异的检验结果,表明用两种方法比较性别之间的OR皆无显著差异(P>0.05),即不同性别间教育模式与满意度的联系是相同的。由表8分层卡方检验的结果可知,将性别作为协变量,给出了CMH 卡方检验和MH 卡方检验两种结果,前者是后者的改进,PCMH=0.026<0.05,PMH=0.044<0.05,即分层卡方检验的结果表明,剔除性别这个影响后,教学模式和满意度仍然显著相关(P<0.05)。MH公共OR值的估计表表明,合并OR值为2.402,95%置信区间不包括1,且与1相比差异有显著性(P=0.028<0.05)。表明,去除了性别的混杂效应后,与对照组相比,试验组的满意度的优势比为2.402,说明翻转课堂教学模式更容易令学生满意。注意:OR值的一致性检验各层OR值有显著差异时,不宜计算公共OR值。

表8 分层卡方检验结果

2.3 秩和检验在SPSS19.0上的实现

(1) 秩和检验步骤。①数据录入和数据加权。数据文件见图3。加权步骤:数据→加权个案,加权个案(W)→频率变量(F):频数→确定。②秩和检验。分析→非参数检验→旧对话框→2个独立样本T检验(2),组别→分组变量,满意度→检验变量列表,定义组(D),分别输入1和2→继续,检验类型:Mann-Whitney U→确定。

图3 秩和检验的数据文件

(2) 结果解读。输出结果见表9、10。2个组别的满意度存在显著差异(P=0.019<0.05),由于试验组的秩均值为74.19,对照组秩均值为61.27,即试验组满意度高于对照组。

2.4 Ridit分析在SPSS19.0上的实现

(1) Ridit分析步骤。①数据录入和数据加权。数据文件见图4。加权步骤:数据→加权个案,加权个案(W)→频率变量(F):标准组→确定。②求标准组(对照组)各等级的Ridit值。求Ridit值步骤:转换→个案排秩(K),满意度→变量(V),秩的类型(K)→秩,比例估计,Rankit→继续→确定。③ Ridit分析。用对比组(试验组)人数替换第二列标准组(对照组)人数;数据加权。加权步骤:数据→加权个案,加权个案(W)→频率变量(F):标准组→确定。U检验。分析→比较均值→单样本T检验,Proportion Estimate of 满意度 using Rankit’s Formula[P满意度]→检验变量(T);检验值(V):0.5→确定。

表9 Mann-Whitney U检验

表10 检验统计量

图4 Ridit分析的数据文件

(2) 结果解读。输出结果见表11、12。对比组(试验组)R=0.597,P=0.000<0.05,表明对照组与试验组满意度不同。置信区间不包括0.5,即试验组的满意度高于对照组。

表11 单个样本统计量

2.5 二分类Logistic 回归分析在SPSS19.0上的实现

(1) 二分类Logistic 回归分析步骤。①数据录入和数据加权。数据文件见图5。加权步骤:数据→加权个案,加权个案(W)→频率变量(F):频数→确定。②二分类Logistic 回归。分析→回归→二元Logistic 回归,满意度→因变量,学院,组别→协变量,分类→学院,组别→分类协变量→继续;选项→Hosmer-Lemeshow拟合度(H),exp(B)CI(x):95%→继续→确定。

图5 二分类Logistic 回归的数据文件

检验值=0.5t值自由度P值均值差值差分的95%置信区间下限上限Rankit比例估计公式计算满意度3.863580.0000.0970.0470.147

(2) 结果解读。Hosmer和Lemeshow检验,P=1.000>0.05,即模型对数据拟合度较好。表13所示的Logistic 回归分析结果表明,自变量学院对模型无统计学意义(P=0.893>0.05),组别对模型有统计学意义(P=0.000<0.05),输出结果中exp(B)即OR值。组别间OR=2.094,置信区间不包括1,表明试验组是对照组满意度的2.094倍。

表13 二分类Logistic回归分析结果(无交互)

a. 在步骤1中输入的变量:学院, 组别

若要考察因素间的交互作用,需在主页面按左侧的“学院”,再按Ctrl(或Shift),最后按“组别”,此时两个变量同时被选中,“>a*b>”被击活,点击进入协变量,其他步骤同上,与上述输出结果主要差别在于回归分析表(见表14)。自变量学院、学院与组别间的交互皆对模型无统计学意义(P>0.05),组别对模型有统计学意义(P=0.007<0.05)。组别间OR=2.101,置信区间不包括1,表明试验组是对照组满意度的2.101倍。

表14 二分类Logistic 回归分析结果(有交互)

a. 在步骤1中输入的变量: 学院, 组别, 学院*组别

2.6 有序多分类Logistic 回归分析在SPSS19.0上的实现

(1) 有序多分类Logistic回归分析步骤。①数据录入和数据加权。数据文件见图6。加权步骤:数据→加权个案,加权个案(W)→频率变量(F):频数→确定。②有序多分类Logistic 回归。分析→回归→有序回归,满意度→因变量,学院,组别→因子,输出→平行性检验→继续→确定,其他默认。

(2) 结果解读。平行线检验,P=0.967>0.05,即认为位置参数(斜率系数)在各个响应类别中都是相等的。表15所示的有序多分类Logistic回归分析结果表明,不同学院间学生的满意度无显著差异(P=0.883>0.05);不同组别间学生的满意度差异显著(P=0.000<0.05)。OR值不能直接输出,需要在Excel中通过插入函数计算OR=exp(b)。组别间的OR=exp(0.730)=2.075,OR的置信区间为(1.420,3.031),置信区间不包括1。由于满意度赋值从低到高依次为1、2、3,故试验组的满意度显著高于对照组。

表15 有序多分类Logistic 回归分析结果

a. 因为该参数为冗余的,所以将其置为零

图6 有序多分类Logistic回归的数据文件

3 结 语

进行教学效果评价,当分组变量与指标变量属性不同时,无论分组变量为计数资料或等级资料,只要指标变量为计数资料,即使分组变量大于2,比较分组变量间的差异皆可采用四格表卡方检验相同的操作步骤,若有显著差异,再进行两两比较。分层卡方检验在去除分层因素下更准确地对行列变量的独立性进行研究,但分层卡方检验也具有一定的局限性,如:只能控制少数因素;定量资料需要分组,信息易丢失;不能对因素作用大小进行定量分析(交互作用)等。无论分组变量为计数资料或等级资料,只要指标变量为等级资料,比较分组变量间的差异须采用秩和检验或Ridit分析或Logistic回归分析。等级资料变量取值具有一定级别,但各级并非严格等价于算术意义上的数值[11]。本文中,秩和检验和Ridit分析两种方法统计分析结果是等价的。二者的主要区别在于,秩和检验可利用模块直接完成,而Ridit分析则需间接完成;Ridit分析需选定一个标准组;Ridit分析要求n>50,而秩和检验n无限制(尤其适合n较小时)[11]。因此,在应用SPSS软件对等级资料进行实验教学效果评价时,秩和检验较Ridit分析更为方便。Logistic回归分析对计量资料、计数资料和等级资料,多因素以及因素间交互作用均可进行分析。Logistic回归分析也具有一定的局限性,如对样本量要求较高。医学上病例和对照的人数应至少各有30~50例,变量的个数愈多需要的例数相应也愈大[6-7, 14],在进行教学效果评价时,样本至少大于100,大于500比较合适,一般每一个自变量至少需要10例结局。

开展教学效果评价前,要综合考虑研究的科学问题、研究目的、研究对象特点、资料类型以及每种数据分析方法的优缺点等,再设计调查问卷和确定样本量。

猜你喜欢

卡方计数资料
卡方检验的应用条件
卡方变异的SSA的FSC赛车转向梯形优化方法
卡方检验的应用条件
古人计数
递归计数的六种方式
Party Time
PAIRS & TWOS
JUST A THOUGHT
古代的计数方法
这样“计数”不恼人