APP下载

基于Python的高校线上课程学习成绩分析与研究

2023-03-24代爱妮王蕊

电脑知识与技术 2023年4期
关键词:计算机教育

代爱妮 王蕊

关键词:计算机教育;Python;线上教学评估;学习成绩分析

1 引言

高校在线教学涉及学生规模大,学生学习情况难以跟踪和把握,一定程度上影响了教学质量,也给高校教学带来了前所未有的挑战。机遇与挑战共存,在线教学平台也同时提供了大量的可供我们参考利用的在线教学数据,在当前信息时代的新工科背景下,众多学者利用大数据分析方法及人工智能算法对教学数据进行分析并建立了教学预警模型,引导学生开展了线上自主学习和师生线上自主合作研讨的教学模式。学者马玉玲研究了基于机器学习的高校学习成绩预测方法,其中提出了一种基于课程关联性的“课前”学生成绩预测方法,能够预测下学期成绩不及格风险[1]。学者张源设计了基于随机森林的线上教学智能学业预警模型,对学生行为和教师行为制定了精准干预措施[2];梁伟等学者基于Python大数据对在线教学情况进行了数据可视化分析与研究[3];黄家琦等学者建立了广义回归神经网络预测模型对学生成绩进行了预测,可识别不及格学生进行提前干预与教学辅导[4]。宋晓磊等学者采用了4种机器学习算法对教育数据进行分析,然后筛选出最相关的数据特征建立了多种预测模型对学业成绩进行预警[5]。此外,还有很多学者也相继利用大数据及人工智能算法對学习数据进行分析及预测,为高校课程学习成绩的数据分析及预测提供了参考[6-10]。

综上,如何利用人工智能算法对在线教学数据进行数据分析与应用是当前值得研究的热点方向之一。为有针对性地总结和辅助我校线上教学,揭示教学影响因素,实现教师及高校管理部门客观评价课程教学效果,本研究特选取《Python与人工智能》线上教学部分作为研究对象,通过收集该课程教学数据,基于Py⁃thon语言和数据分析技术,对该课程按不同特征汇总的数据分布情况、各教学行为特征与成绩相关性进行了分析,并建立了相关性矩阵,最后筛选得出影响高校线上教学成绩最相关的学习行为特征,实现了学习行为特征降维。本文相关研究成果为后续本研究进行数据聚类及建立教学预测模型提供了基础,也可为高校混合式教学模式的改革和教学指导提供了一定参考。

2 研究方法

《Python与人工智能》课程具有操作性和实践性较强的特点。本研究针对疫情期间开展在线教学特点,利用超星学习通收集的课堂教学数据,采用基于Python的数据分析方法,对教学数据分布情况进行了分析;其次对课堂内外教学核心环节各特征与成绩进行了相关性分析;最后给出了相关性分析矩阵,对选择什么样的特征数据进行了教学模块设计,为筛选强特征建立教学预测模型提供了重要参考。

3 数据采集

本文选取青岛某高校2019-2020第二学期超星学习通线上教学课程数据,涉及通信工程(物联网)和电信两个专业四个班级共107条学生的学习行为数据。数据集具体情况及各字段类型如表1所示,主要包括描述学生信息的“学生序号”“专业”“班级”“性别”四个特征,类型为object类型。数据分析时,本研究将专业、班级和性别进行了离散化处理。其他“课程视频”“章节测验”“讨论”“作业”“章节学习次数”“签到”“课程互动”“任务点完成百分比”“期末成绩”共11个学生行为特征数据为在线采集的最终转换为百分制表示的学习数据。学生成绩分布主要有A、B、C、D四个等级,分别代表的分数区间为[90,100]、[80,90)、[65,80)、[0,65)。此外,将数据集中期末成绩小于75分的给予不及格预警,用目标值0代替;而将考试成绩无不及格预警风险的数据,用目标1代替。

4 数据分布分析

为了更好地服务于教学质量的提升,构建高校在线学习成绩预测模型,跟踪高校学生线上教学及学生的学习情况,本研究首先对本学期数据分布情况进行了分析与归纳。

图1给出了各数值类型字段的总体箱型分布,从中可以看出,数据分布最集中的为课程视频得分,分布最分散的为章节学习次数和讨论得分。说明大部分同学能按要求看完视频,得分值差别不大,而课堂互动得分差异较大,说明有的学生互动比较积极,但有的学生参与积极性不够。

图2中左图反映了数据集平衡性分布情况,可以看出该数据集的学生学习成绩等级基本呈现正态分布。图2中右图反映了性别等级分布情况,可以看出男女比例差别较大,其中,性别为男性的数据占比为77.6%,性别为女性的数据占比为22.4%。

图3为按专业等级分布情况,从图中可以看出电信专业学生选学本课程人数为67人,占比为61.6%,通信(物联网外包)专业为40人,占比为37.4%。从成绩等级分布来看,成绩等级为A的同学全部在电信专业,而且等级为B的同学占比也高于通信(物联网外包)专业。因此,专业学生学习基础对学生学习成绩有一定影响,今后教学中可以针对不同专业学生制定不同教学策略,或者在教学中加强教学内容的核心教研,制定适合各专业的教学策略。如果是不同专业共同上这一门课程,则应该针对基础较弱的专业班级加强监督和学习辅导。

5 特征与成绩相关性分析

下面分析不同性别情况下,各学习特征与成绩等级相关性。图4为四级制等级与各学习行为特征之间的关系柱状图,可以看出,成绩等级A的同学在讨论、章节测验、作业、课程互动等学习环节中得分均较高,反之较低。由于在线教学过程中该课程的学习视频允许学生拖动,因此,从图4中也可以看出课程视频、任务点完成百分比分与各成绩等级变化对学生成绩的影响区别不大,可根据实际教学情况取消这两个指标,或设置不同权重合理使用该模块对学生学习情况进行分析。

图5反映了课程内学习互动与成绩等级关系。从图5可以看出,成绩等级越高的同学,参与课堂互动和讨论的分数越高,说明课堂互动指标和讨论可有效促进学习效果,提高学生学习成绩。图6反映了章节学习次数与章节测验、讨论与作业、作业与期末成绩、章节测验与期末成绩之间的关系。可以看出,大多数章节学习次数多的同学,章节测验分数也相对高;大部分课堂参与讨论多的同学,作业完成的分数也相对较高;此外,作业和章节测验分数高,大部分期末成绩也较好。因此,从以上分析可以看出,课堂内外学习情况与学习成绩有较大的相关性,今后教学过程中对在这些环节中得分较低的一部分同学应加强监督和督促,从而有效降低课程期末成绩不及格风险率,更好地促进教学效果。

6 特征选择

为充分利用各种学习特征,本研究也同时考虑了专业、班级和性别三个特征,并在相关分析之前对这三个特征进行了离散化数值处理。本研究利用Py⁃thon中皮尔森相关系数方法进行了不同特征相关性的分析,规定相关性系数大于0.70的学习行为特征为强相关,介于0.5到0.70之间为显著相关,介于0到0.5之间为弱相关,小于0为不相关。图7为各学习特征与期末成绩的相关性矩阵图。

从图7中可以看出章节测验、讨论、作业、章节学习次数4个学习行为特征为强相关;课程互动、班级和签到3个学习行为特征为显著相关;课程视频与任务点完成百分比2个学习行为特征为弱相关;专业与性别为不相关特征。在预测及预警分析中,可对强相关的学习行为指标重点监测或赋予较大的权重值,而对弱相关和不相关的特征可考虑去掉相关特征,实现特征筛选。因此,本研究筛选得出强相关和显著相关的7个特征变量作为影响高校线上教学成绩最相关的学习行为特征,分别为班级、章节测验、讨论、作业、章节学习次数、签到和课程互动,并作为后续研究建立预警模型奠定基础。

此外,本研究不仅研究了各学习行为特征与成绩的相关性数据,同时也研究了不同特征之间的相关性值,从中发现相关教学规律,为制定正确的教学策略提供参考。图8为各学习特征之间的相关性矩阵热力图。从图8中可以看出,讨论与课程视频的相关系数值仅为0.21,说明一个能把课程视频看完的同学,不一定会在课堂上参与讨论;此外,从图8中可以看出班级与期末成绩为强相关、讨论分别与班级、章节学习次数及课程互动也均为显著相关,与期末成绩为强相关,说明所在班级风气好的同学更愿意参与讨论、其学习主动性更高,课堂互动性也好,期末相对也能取得更好成绩,因此,可有针对性地对某些班级进行教学督促和管理,提高教学效果。另外,也可以看出章节学习次数与章节测验、讨论为显著相关,与作业为强相关等,说明章节学习次数多的同学,通常章节测验分数也相对较高,作业完成率好,从而最后期末也能取到更好的成绩,因此,平时教学过程中,课程教师可以对章节次数少的同学给予教学干预,协助监督这部分同学有质量地完成章节学习,从而有效提高学生的期末考试成绩。

7 结论

本研究通過收集线上教学平台数据,采用Python数据分析方法,对线上教学课程分布及学生的学习行为影响因素进行了分析,并筛选得出学生学习行为特征与学习成绩的相关性矩阵,对学习成绩影响因素最相关的学习行为特征进行了分析,该研究对提高线上教学效果及线上教学内容的设计有一定的指导和参考价值。研究结论总结如下:

(1) 从图1、图4和图5分析可以看出,课堂互动和讨论环节参与多的同学,最终成绩也较好,所以教学过程中可以恰当地设计教学互动环节,促进课程教学效果;而对于章节学习次数与章节测验、讨论与作业、作业与期末成绩、章节测验等学习环节中得分较低的一部分同学应加强监督和督促,从而有效降低课程期末成绩不及格风险率,更好地促进教学效果。

(2) 不同专业学生应制定不同教学策略。从图2可以看出,电信专业基础相对于物联网专业学生基础好一些,所以,电信专业平均成绩优于物联网专业,说明以后教学可针对性地对于基础较弱的专业应加强监督和督促,有效提高整体教学水平。

(3) 图7与图8分析了各行为特征与学习成绩的相关性,给出了弱相关、强相关和显著相关的学习行为特征数据。建立综合考评教学模型时,对于课堂内外学习情况与学习成绩相关性不大的学习行为特征,例如“课程视频”“任务点完成百分比”“专业”“性别”可以设置较小的权重或不考虑,而对于那些与最终学习成绩相关性很大的学习行为特征应重点考虑。本研究结合各行为特征与期末成绩相关性分析,给出“班级”“章节测验”“讨论”“作业”“章节学习次数”“签到”和“课程互动”作为后续研究建立预警模型的特征数据,同时教学过程中也应该对这些教学环节加强监督和管理,制定相应教学策略,对该部分环节得分低的同学进行教学干预。

猜你喜欢

计算机教育
艺术生计算思维的培养