APP下载

基于大数据的应用型本科院校教学管理改革研究

2019-11-07姜志旺张红霞申晨刘晓乐

无线互联科技 2019年15期
关键词:随机森林重要性

姜志旺 张红霞 申晨 刘晓乐

摘   要:文章針对不同课程各种课堂记录数据对学生成绩的影响,分析不同课程中的共同规律,从而得知哪些因素对学生成绩的影响更大,以使智慧课堂更好地指导和管理教学过程。

关键词:随机森林;重要性;学生成绩分类;智慧教学管理

通过大数据挖掘、机器学习的相关技术深入挖掘智慧教学尔雅课堂的相关数据,挖掘内在的规律和结论,可以更好地促进智慧教学管理改革,使教学管理更加智能化和精准化。在我国当前的发展过程中,许多新型教和学的模式已经逐渐开始出现,例如云教育、泛在学习、移动学习、一对一数字化学习,而这些模式的特征均是交互性的、嵌入性的、缩小化的。智慧教育会成为以后教育发展的突破口与冲击点,将会直接引起教育方面的改革,包括教育理念的改革、教学模式的改革、学习改革、教学管理和教学评价的变革[1]。

本文通过大数据、数据挖掘对教学数据进行建模,通过模型建立和数据分析来挖掘教学数据中表现出来的规律,来更好地进行智慧教学管理改革,这是根本的研究目的。

1    数据预处理

通过尔雅课堂学习数据,提取对本研究有用的数据,即提取的特征属性,包括任务完成率、视频任务点完成率、章节测验完成率、视频任务点学生观看时长(单位:min)、章节测验平均分、考试完成率、考试平均分、学习访问量等信息,得到如图1所示的数据。

将数据进行如下保留信息的转换:

(1)将任务点完成率、视频任务点完成率、章节测验完成率、考试完成率转化为2位小数。

(2)删除空数据与噪音数据。

经过上述准换,得到最终可用的数据如图2所示。

将学生记录按照学生成绩进行分类,98~100分为优秀,90~98分为良好,45~90分为合格,0~40分为不合格,对应的标签为0,1,2,3,按照此得到如图3所示的数据。

2    特征值提取

随机森林是一种有监督学习算法。首先,对数据进行归一化来统一量纲;其次,研究学习记录信息对学生成绩评级(优秀、良好、合格、不合格)的特征贡献度,即对学生成绩评级的分类结果,哪些特征对于决定学生成绩评级的贡献度较高。

本研究需要将随机森林拟合得到的特征的重要性排序和统计图,规定>0.2为可以决定学生成绩的分割线重要性值,以“创新创业”课程为例,随机森林得到重要程度数据如表1所示。

首先,“创新创业”课程视频任务点学生观看时长的重要性最高,为0.529 267 97,高出其他的特征,说明视频任务点学生观看时长是学生成绩评定的最重要特征。其次,是学习访问量,为0.383 433 07。通过以上统计不难发现,在尔雅课堂中对于学生成绩评级起决定性的就是视频任务点学生观看时长与学习访问量。

3    学习数据分类

通过研究特征任务点完成率、视频任务点完成率、章节测验完成率、视频任务点学生观看时长(单位:min)、考试完成率以及学习访问量能否有较高的教师评学成成绩评定价的分类准确率。

需要对数据进行分类预测,预测的算法可以支持向量机(Support Vector Machine,SVM)算法、逻辑回归(Logistic Regression,LR)算法、朴素贝叶斯算法、决策树算法、邻近算法(K-NearestNeighbor,KNN)算法,要通过分类算法参数的不断调整来规避过拟合和欠拟合的现象。

调整好分类器的参数后,需要对不同分类器进行统计,统计的标准为模型分类准确率,将常用分类器对应的模型准确率针对不同课程分别进行统计。其中,“创新创业”课程分类结果如表2所示。

如表2所示,基本分类算法的效果都极差,其中,LR的分类效果相对于其他的分类器效果更好一些,为52.38%,原因是数据基本为离散数据,且更符合更偏向于直接线性关系,所以逻辑回归有较高的分类准确率。

从上述分类的过程可以得到针对其他课程学生视频观看时长对学生成绩评级的影响可以说起导向性的作用,通过对上述整个分类过程的研究发现,对于第一门课程完整数据做分类预测,分类准确率并没有预测的效果好。

4    结语

在以后的教育管理中应该积极关注本研究结果中最重要因素:学生观看视频的时长与学习访问次数,观看视频时间长的且具有较高学习访问量的学生成绩的等级会更高。

分类结果给以后的系统发展优化带来了更加明确的方向,通过输入这些重要指标的数值,可以直接、快速地反映出学生的成绩评定,教师快速了解每个学生在学习过程中的进度与知识掌握情况,使智慧教学的管理系统更加智能化,为今后的教学管理工作提供更科学的决策依据。

[参考文献]

[1]曹培杰,尚俊杰.未来大学的新图景“互联网+高等教育”的变革路径探析[J].现代远距离教育,2016(5):9-14.

Abstract:In view of the influence of various classroom record data on students performance in different courses, this paper analyzes the common laws in different courses, so as to find out which factors have a greater influence on students performance, so as to make the wisdom classroom better guide and manage the teaching process.

Key words:random forest; importance; classification of students grade; intelligent teaching management

猜你喜欢

随机森林重要性
“0”的重要性
论七分饱之重要性
论七分饱之重要性
拱坝变形监测预报的随机森林模型及应用
读《边疆的重要性》有感
基于随机森林算法的B2B客户分级系统的设计
基于多视角特征融合与随机森林的蛋白质结晶预测