APP下载

网络课程评价的统计分析

2014-02-22朱坤平刘剑平姚俊

关键词:回归分析远程教育因子分析

朱坤平 刘剑平 姚俊

[摘要]网络课程的评价是远程教育系统的一个重要组成部分,不同于以教师面授为主的常规教学手段,远程教育则是以学生的自主学习为主导。一门网络课程的成功与否不仅取决于该课程网络课件的优劣,更重要的是学生能否借助课程相关的学习服务支持系统取得良好的学习效果。本文综合利用多元统计分析的方法对学生自主学习的各个环节与最终学习效果的关系作定量的分析。

[关键词]远程教育 回归分析 主成份分析 因子分析

和传统的以教师为主的面对面的教学手段不同,远程教育[1][2]是一种学生与教师在时间和空间上分离的教育形式。远程教育以学生的自主学习为主导,课程的教学活动以多媒体的方式展开,学生与教师及教育组织之间通过现代化的通讯方式联系。而网络教育是以互联网技术为依托的远程教育的一种重要组成形式,它突破了时空的限制,具有开放,灵活的优点。网络远程教育系统的构成包括了网络课程的开发设计以及为网络课程提供学习支持服务的子系统,学习支持服务子系统又包括:信息与咨询,课程与资源,导学与指导,活动与交互,实践与实验,设施与技术,评价与激励 等诸多方面。因此,对网络课程的评价涉及到整个网络远程教育系统的各个环节,既包括对设施与课程资源等硬件方面的评价,也包括对咨询与指导等软件方面的评价。从目标管理的观点来看,对网络课程的评价最终还是要落实到网络课程的教学效果上,即所开设的网络课程是否能达到预期的教学目的,完成网络课程教学大纲的基本要求。

对于教学课程包括网络课程的考核在理论和实践上都已有点相当广泛的探索[3]-[7], 一个客观合理的考核的结果不仅能反映了学生对该课程的掌握程度,同时也体现了教师的教学效果,并能够从中发现教学中存在的问题。如果简单地从量的方面来评价一门网络课程,我们可以考察该网络课程的选课人数或比例,以及该网络课程考试及格率。自然,选课的学生人数越多基本代表了该课程越受学生的欢迎(必修课程除外)。而课程的考试及格率代表了达到课程教学大纲基本要求的学生比例,因此及格率越高在一定的程度上代表了该课程的教学效果越好。但是,一个基本的事实是: 一门选修类的网络课程的考试及格率与选课人数或比例密切相关,往往越是容易考试通过的课程选课的人数就越多。因此,选课人数和及格率等量的指标只能作为网络课程评价的参考指标。

从质的方面来评价一门网络课程,我们认为最有说服力的自然是学生对该课程总体满意程度。这方面的调查工作在我国还未受到足够的重视,也很少有这方面的数据分析及报道。目前对网络课程的评价和监管还主要是一种自上而下的形式,即由上级主管单位来负责实施。其实,自下而上的面向学生的问卷调查是一种最直接的对课程的评价形式,通过对问卷的统计分析,可以发现办学各个环节存在的问题,有利于对课程作出有针对性的整改和完善。

本文是用统计分析的方法,从办学机构为网络课程提供了哪些服务,这些服务的功效如何,课程的最终教学效果如何等方面来评价网络课程。我们随机选取了我校网络教育学院开设的其中七门网络课程,涉及共1385名学生的统计数据进行分析。原始数据包括:姓名,学号,专业,课件点击次数,在线学习时间,BBS发帖讨论次数,作业成绩,平时成绩,考试卷面成绩,和总评成绩等信息。一般说来,考试成绩应该近似服从正态分布,我们将首先对这些网络课程的卷面成绩作正态分布的显著性检验。只有通过了正态性检验的成绩我们才认为是正常的和有效的,并可以把该成绩作为评价对应网络课程教学效果的指标。其次,我们把课件点击次数,在线学习时间,BBS发帖讨论次数,作业成绩作为评价网络学院提供服务功效的指标,对网络课程的卷面考试成绩与这些指标的关系作相关分析和回归分析。最后,再对这些网络课程的统计数据作主成分分析和因子分析。我们希望用数据说话,通过统计分析来揭示上述指标的内在联系,找出办学中的薄弱环节,为进一步完善服务和提高教学质量提供帮助。

一、网络课程的成绩分布

作为评价一门网络课程教学效果的指标,我们选取课程的卷面成绩而不是总评成绩,是因为卷面成绩排除了人为因素的不利影响,比如无效的课件点击次数和在线学习时间(空挂着的)是很难鉴别出来的,而这些指标会拉升平时成绩从而拉升总评成绩。卷面考试成绩能较好地反映课程的教学效果,但前提必须是该成绩是正常有效的,没有出现考前泄题等异常情况。众所周知,传统教学模式下的考试成绩的一般近似服从正态分布。那么,教与学时空分离模式下的网络课程的成绩是否还近似服从正态分布呢? 如下,以线性代数课程为例我们对网络课程的卷面考试成绩作正态分布的显著性检验。图1是我校07级部分专业1385名学生线性代数网络课程卷面考试成绩的频率直方图。

图1:网络课程线性代数成绩分布频率直方图

在显著性水平α=0,01下,对考试成绩作正态分布N(μ,σ2)的x2检验,其中参数μ和σ2的极大斯然估计分别为样本均值x=70.37和样本方差s2=233.83。统计量的观测值为: , 统计量观测值小于临界值

, 故在显著性水平α=0,01下,可以认为考试成绩的分布为正态分布。综合卷面成绩及格率为77.32%和70.37的平均成绩,可以认为该课程的考试成绩是正常的,且试卷难度适中。整体上看该门课程收到了较好的教学效果。

进一步通过对其他六门网络课程成绩分布的x2检验我们发现, 在显著性水平α=0,01下其中五门课程成绩都可以认为是服从正态分布的。

综上,尽管网络学院的学生可能有更大的个体差异性,且网络教学模式与整齐划一的传统教学模式有很大的不同,但是,两种教学模式下考试成绩的分布并无显著性差异, 它们都近似服从正态分布。

二、网络课程指标的相关和回归分析

对网络课程教学各个环节指标的相关分析可以揭示这些指标之间的相关程度两个指标的相关系数的绝对值越接近于1,表示这两个指标的线性相关关系越强,反之,相关系数的绝对值越接近于零,表示他们的线性关系越弱。对于指标间的Pearson相关系数的可以用t-统计量进行检验。仍以线性代数网络课程为例,下表是根据1385名学生的统计数据用SPSS软件求出的各指标间的相关系数(表中的Sig.为相关系数显著性检验的概率p值)。

从表中可见,其中卷面成绩与总评成绩相关系数为0.901是强相关的。在0.05的显著性水平下,卷面成绩与点击次数的相关关系不显著,与其他指标的相关系数也很小。这个分析表明,课件的点击次数对教学效果即卷面考试成绩是没有显著性影响。究其原因大概是许多同学为提高平时成绩刷点击率造成的。尽管学院规定了连续三分钟之内的点击不计学习时间,但这个规定对监督学生学习的作用不大,有待改进。

进一步地,利用逐步回归的方法,我们希望找到卷面成绩与在线学习时间,点击次数,作业分数,讨论次数之间的函数关系。SPSS的分析结果如下:

上表说明,通过逐步回归的得出的两个模型,其复相关系数分别为0.099和0.133。

在0.05的显著性水平下F检验显示, 模型一中只有作业成绩对卷面成绩作用显著,而模型二中也只有作业成绩和学习时间对卷面成绩作用显著。

逐步回归的结果表明:在0.05的显著性水平下,课件点击次数和参与讨论的次数对考试成绩的影响不显著,即他们在回归方程中的系数可以认为是零。在线学习时间对卷面成绩的影响尽管可以认为是显著的,但其在回归方程中的系数也很小。最终的回归方程可表示为:

卷面成绩 = 59.432 + 0.132*作业成绩

综合上述分析结果:对网络课程的监管重点应放在对学生完成作业的监督和考评上。对学生的在线学习时间,课件点击次数,参见讨论的次数等可宜不作硬性要求。这些指标对卷面考试的影响是基本可以忽略的或仅作参考。

三、网络课程的因子分析

因子分析[8]的方法主成分分析的拓广和延伸,它最早由Charles Spearman提出, 1904年他在研究33名学生的六门课程(古典语(C)、法语(F)、英语(E)、数学(M)、判别(D)及音乐(Mu))的考试成绩得到了如下的相关系数矩阵:

Spearman注意到如果不考虑对角元素的话,矩阵中任意两列的元素大致成比例,比如对C列和E列有:

由此,Spearman提出了课程考试成绩的因子分析的模型:Xi=aiF+ei其中Xi为第i门课程标准化后的考试成绩,ei为只对第i门课程有影响的特殊因子,而F为影响所有课程的公共因子,一般F可解释为智力因素。对于网络课程的考试成绩是否也具有上述性质呢?我们随机选取5门网络课程的学生成绩,这些成绩的相关矩阵如下:

显然,矩阵中任两列的对应元素不具有比例关系。即网络课程的成绩不能适用于只有一个公共因子的模型。这可解释为对网络学院的学生来说,因为靠自主学习,影响其成绩的除智力因素外,还有很重要的自制力,毅力等因素。

通过对上述相关阵的KOM和巴特里特球度检验,其概率P值接近于零,即在显著性水平0.05下可以对成绩数据进行因子分析。

利用主成分分析方法提取三个因子,得

其中,三个主成分对原5个变量的方差累计贡献率超过90%,即只用三个主成分就可以很好地表示了原来变量的信息。三个主成分的因子载荷矩阵如下:

其含义为,比如:物理成绩=0.861f1-0.296f2-0.175f3

软件成绩=0.776f1-0.223 f2+0.552 f3

而因子得分的系数矩阵为:

从矩阵可以看出,各科成绩在因子f1的权重相当,第二因子f2中英语的权重突出,第三因子f3中软件课程的权重最大。因此,这三个因子分别可以解释为一般的智力因素,语言能力和动手能力。

因子分析对网络课程管理和评价的意义在于: 由于网络课程时空分离的特点,教师无法像课堂教学一样获得学生的实时反馈。因此网络课程在教学各环节的设置上就需要针对不同课程的特点作出有针对性的调整。因子分析可以从课程的统计数据出发提取出影响这些课程成绩的几个主要因子(这些因子往往具有直观的含义而又不能直接测量)。不同课程的特点就反映在它们这些因子上载荷的不同。据此就可以对不同的网络课程作出有针对性的引导和训练的设置。

四、结论

本文从统计数据出发利用统计分析的方法来定量地研究网络课程的评价问题,以网络课程的卷面考试成绩作为评价课程教学效果的主要指标,在0.01的显著性水平下对样本数据的检验表明网络课程的成绩也服从正态分布。通过对网络课程教学环节中的课件点击次数,在线学习时间,讨论次数,作业分数,和考试成绩等指标的相关和回归分析显示,考试成绩与作业分数低度相关,与课件点击次数(在0.05的显著性水平下的检验)不相关,与在线时间,讨论次数等指标弱相关。进一步地我们利用逐步回归的方法,得到了考试成绩与上述指标的回归方程。最后,我们对若干网络课程的统计数据进行了因子分析,揭示了影响网络课程教学效果的潜在因素,为进一步改进网络课程的教学提供了理论依据。

[参考文献]

[1]高小玲,吕鹏宇:远程教育系统,中国宇航出版社,2004

[2]张尧学:高校现代远程教育调查与思考,中国远程教育,2004(6)

[3]陈立贵:高校课程考核方式之我见,科技创新导报,2008(15)

[4]施继生,陈全中,张宏诚,杨海波:成人高等教育课程考核方式改革探索,中国成人教育,2006(4)

[5]沙丽亚:现代远程开放教育形成性考核初探,中国教育技术与装备,2010(36)

[6]杨孝堂:远程教育学习评测,中央广播电视大学出版社,2004

[7]邓风:多维实践教学评价及考核体系的探讨,中国科技信息,2013,(3)

[8]高惠璇:应用多元统计分析,北京大学出版社,2009

(作者单位:1.华东理工大学理学院 上海,2.华东理工大学网络教育学院 上海)

猜你喜欢

回归分析远程教育因子分析
教育信息处理在远程教育中的应用
从《远程教育》35年载文看远程教育研究趋势
网络远程教育学习行为及效果的分析研究
基于IPoverDVB—S单向传输模式的远程终端系统与数据维护技术
基于变形监测的金安桥水电站坝体稳定性分析
基于主导产业视角的战略性新兴产业识别以及实证研究
森林碳汇影响因素的计量模型研究
基于省会城市经济发展程度的实证分析
山东省县域经济发展评价研究
河北省城镇居民人均可支配收入与消费统计分析