MOOC环境中面向学习者的语言反馈研究
2018-01-30作者周利玲武汉纺织大学数学与计算机学院
作者/周利玲,武汉纺织大学数学与计算机学院
1.MOOC中学生参与的语言反馈的研究
从在线网络课程的数据,不难发现学习者参与在线论坛可以促进学习者的学习效率,但更丰富的数据跟踪仍有待挖掘,尤其是针对学习者论坛中互动内容的相关性详细分析。互动内容相关性的分析提供了潜在的检测和监控学生接触的证据,以及它如何与其他方面的行为相关联。有数据表明,学习者在明确自己学习目标和兴趣时能更好的坚持完成学习任务。在本文中,我们研究利用计算机语言模型来衡量学习者的动机和认知参与论坛帖子的文本。
很多变量,需要评估这些变量的预测效度,我们使用生存模型来验证我们的技术,评估这些变量的预测效度与随着时间推移而变化的磨损。我们结合不同类型的MOOC课程来完成研究。之前的工作表明,参与论坛讨论在所有的学生承诺是一个强有力的指标。我们的方法使我们能够更好的区分这些学生,并确定辍学可能性很大的学生,通过人口和课程的互动提供有效的支持,给予积极的管理和支持,理论与实践相结合。
2.数据集
我们的数据集来源MOOC平台中的课程,包括三门课程:一门社会科学课程:1026个活跃用户,2107个论坛帖子;文学课程:711个活跃用户,3520个论坛帖子;编程课程:7739个活跃用户,10708个论坛帖子。所有三个课程课时都是七周,分别有七周的特定的子论坛和更多的独立的总的讲话课程讨论。我们的分析仅限于讨论中的行为论坛。
3.相关工作
3.1学习者动机
在MOOCS环境下对英语学习动机的研究,大多数是基于调查和比较小的样本的手工编码的用户确定的目标或脱失原因。在MOOC研究中,动机被确定为参与的重要决定因素。不同的课程设计不同的入学率鼓励问卷项目,是得难以推广的结论成为必然。另一个缺点就是学习者的动机是不稳定的,特别是没有明显进步的,学习者就可能失去兴趣。重要的是检测学习者的动机以及它在多个星期中的变化。我们建议根据论坛帖子的语言提示自动测量学习者的动机。
3.2 学习者认知参与
在结合学生面对面课程和计算机中介通信的环境课程的研究中,发现涉及高阶思维的认知过程能更好的获取知识,达到更好的学习效果。在本文中,我们尝试根据帖子中包含的个人解释来衡量MOOC用户的认知参与度。
4.方法
4.1 预测学习者动机
学生的动机水平极大的影响了学生在课堂中的参与强度。以前的研究表明,有可能基于学生对计划学习动作的描述对学习者的动机进行分类,确定的动机分类与学习行为和学习成果有着很大的关系。由于较高的师生比,导师很难亲自鉴定和考察缺乏学习动机的学生。为了克服这些挑战,我们构建机器学习模型,根据课程论坛的帖子自动识别学习者动机水平。我们以一般的方式验证我们的措施,不仅测试同一课程的数据,还通过一门课程的学习,然后测试另一个课程,一发现课程独立的动机线索。学习者动机的语言学特征帮助我们理解和预测学习者动机。
创建人机编码数据集:MTurk
我们使用的Mechanical Turk(MTurk)来实现建立可靠的注释语料库用于开发自动测量学生动机。MTurk是一个在线市场的众包,它允许请求者发布工作和工作人员选择他们想要完成的工作衡量语言抽象的程度,具体的话是我们可以直接看到的事情和属性。抽象词是指思想观念原理即时感知,我们自动计算一个数字评级从0(高度具体)到1(高度抽象),基于一个单词的抽象关于从已经找到该单词的上下文生成的特征向量,通过添加抽象来计算每个帖子的平均级别。
关于讨论帖子中课程材料的推理,认知参与程度在解释、分析和诠释方面引起了人们的关注和注意。
5.验证试验
我们使用生存分析,以验证参与者的测量水平较高的参与将保持活跃在论坛更长,控制其他论坛的行为,如有多少帖子用户贡献。我们应用我们的语言措施,在第4节量化学生的参与度。我们使用的域学习动机分类与语言和单字的功能为责任的对话课和科学幻想小说类。我们使用的分类培训的负责谈话数据集分配动机在学习课程的岗位无心标签。
5.1 生存模型
生存模型可以被看作是一种回归模型,捕捉的影响与时间相关的结果,例如是否发生事件。在我们的案件中,我们正在调查我们的参与措施对课程参与者退出课程论坛的影响。更具体地说,我们的目标是了解我们是否自动测量学生参与可以预测她参加课程论坛的时间。
对于我们的三门课程,我们包括所有积极的学生,即谁贡献了一个或更多的职位课程论坛。我们定义的时间间隔为学生参与周。我们考虑到每个学生的第一个帖子的时间戳作为该学生的起始日期参与课程讨论论坛和最后一次会议的日期作为参与的结束除非是最后一周课程。
因变量:
在我们的模型中,依赖措施是辍学,这是1上一个学生的最后一周活跃参与,除非它是最后一个课程周(即第七课程周),和其他0周。
控制变量:
cohort1:这是一个二元指标描述用户是否曾经在上课程周(1)或否(第0)。参加早期课程的成员比其他人继续参与讨论论坛。
PostCountByUser:这是消息的帖子在论坛的成员一周数,这是学生参与的一项基本努力。
commentcount:这是接受在论坛的评论用户的帖子数在一周。因为这个变量是与PostCountByUser高度相关(r>0.70的所有三门课程)。在为了避免多重共线性问题,我们只包括在最终的模型postcountbyuser。
独立变量:
avgmotivation是一个人的职位的百分比在这周预测为“动机”使用我们的模型与一元语法和语言特点。
avgcogengagement:这个变量措施后平均每一周性评分。
我们注意到,avgmotivation和avgcogengagement不与postcountByUser(所有三门课程中R<0.2)。因此,他们是正交的简单措施的学生,avgmotivation与avgabstractness不是(三个课程中R<0.10)。因此,可以将这些变量包括在同一模型中。
5.2 生存模型的结果
效果报告的辍学率(HR)是一个解释的效果变量的风险或概率的参与者退出了课程论坛。因为所有的解释变量除了cohort1已经标准化,这里的危险率是预测从一个单位增加的课程论坛辍学概率的变化预测变量,即当所有其他变量处于平均水平时cohort1从0到1或连续变量的增加变化的标准偏差。
表1 报告的生存模型的控制和独立变量的预测进入生存回归
6.结论
我们根据论坛帖子的语言分析,介绍如何衡量MOOC学生参与度的研究。我们确定了两项新措施,量化参与并验证了三种不同内容的Coursera课程的措施。我们会自动识别课程论坛中哪些职位表达学习者动机和认知参与的程度。生存分析结果验证了学习者表达的动机越多,辍学的风险就越低。同样,参与者在其职位上显示的个人解释越多,课程论坛辍学率就越低。
从这项研究中,我们看到我们可以根据他们的论坛讨论帖数量来衡量学生的参与度,改善参与度的一个重要方法就是让学生组织学习者之间更深层次的界限,下一步可以更深入地定量探索MOOC虚拟团队参与者的协作行为。
* [1]David Adamson, Gregory Dyke, Hyeju Jang, and Carolyn Penstein Ros′e. Towards anagile approach to adapting dynamic collaboration support to student needs. International Journal of Artificial Intelligence in Education, 24(1)∶92—124, 2014. 4.5.3
* [2]Camiel J Beukeboom, Martin Tanis, and Ivar EVermeulen.The language of extraversion extraverted people talk more abs tractly, introverts are more concrete. Journal of Language and Social Psychology, 32(2)∶191—201, 2013. 4.4.2, 4.4.2
* [3]Stata Corp. Stata Statistical Software∶ Statistics; Data Manag ement; Graphics. Stata Press, 1997. 4.5.1
* [4]Lyn Corno and Ellen B Mandinach. The role of cognitive eng agement in classroom learning and motivation. Educational psychologist, 18(2)∶88—108, 1983. 4.3.2, 4.5.3
* [5]Diyi Yang, Tanmay Sinha, David Adamson, and Carolyn Pens tein Rose. Turn on, tune in, drop out∶ Anticipating student dro pouts in massive open online courses. In Workshop on Data Driven Education, Advances in Neural Information Processing Systems 2013, 2013. 2.1.1, 4.5.1