APP下载

高校网络课程访问影响因素的关联规则

2020-02-05叶根梅杜丹

电子技术与软件工程 2020年7期
关键词:访问量关联规则

叶根梅 杜丹

(马鞍山师范高等专科学校软件工程系 安徽省马鞍山市 243041)

近年来,网络课程在高校越来越普及。各高校纷纷引入或建设属于自己的网络课程平台,教师基于网络平台建立在线课程,以此更好地辅助课堂教学,或实施翻转课堂或实现在线教学。网络课程的质量决定了网络课程的绩效水平[1],而网络课程的访问量则一定程度反应其建设质量和实施效果。但是,目前对网络课程访问的研究相对较少,且主要集中在运用学习分析技术对学生学习行为的分析方面。文献[2]通过对学生访问网络课程日志数据的分析,获得学生对不同模块和资源的访问频次,以发现学生访问网络课程的特征并提出网络课程建设的建议;文献[3]构建层次模型,基于模型对某一门网络课程的学习行为数据进行分析;文献[4]通过构建六层次模型,以发现网络课程学习存在的问题。基于学习分析技术往往局限于对某一门课程的数据分析,且结论并不足以体现与网络课程访问量的直接联系。因此,本文提出运用关联规则算法Apriori 算法,对某高校课程平台批量已运行的在线网络课程的实施数据,进行关联规则挖掘,并结合在线网络课程现状调查、教师研讨、学生访谈等方面进行规则分析,以发现网络课程访问量的可能影响因素,为提高网络课程的访问量,进而提高网络课程实效提供依据和参考。

1 关联规则算法

关联规则算法主要用于发现数据集中数据项之间的相互依赖性,以及存在的有意义的联系。这些联系可以用关联规则或频繁项集表示。

Apriori 算法是挖掘关联规则的最有影响力的有效算法,该算法主要通过逐层搜索迭代的方法,利用k 项集搜索k+1 项集,通过不断迭代,直至找不出频繁项集[5]。为了有减少大量候选集的产生,采用的基本方法是设置合适的支持度和置信度。支持度Support 表示事务集中同时包含X 和Y 的事务数与所有事务数的比例,反映了X 和Y 同时出现的概率。而置信度Confidence 则表示同时包含X 和Y 的事务数与包含X 的事务数的比例,表示关联规则的强度。一般来说,只有支持度和置信度较高的关联规则才是用户感兴趣的。文献[6]-[7]研究了关联规则算法;文献[8]-[9]则将Apriori 算法应用于网络课程的关联分析,从而实现教学平台中的网络课程推荐。

2 数据收集和预处理

收集的数据来自某高校在线教学平台所有已实施在线课程,原始统计数据由课程平台管理后台导出并提供。对原始课程数据进行清洗,如原始数据中共有84 个统计数据项,根据问题要求,对数据项进行归纳和合并,删除与目标问题完全无关的数据项,最终选择保留8 个列数据项;删除诸如测试建课及曾未实施类课程,以及学生数过少、使用频率过低的课程,最终选取有效课程267 个行数据项。

由于关联规则算法Apriori 算法适用于完全的标称型数据,因此首先需要对课程统计数据进行离散化处理,以形成有序标量。离散化数值型属性的一般方法是将值域分割成多个间隔区间,通常采用等宽离散法和等频离散法。等宽离散法将属性值从最小值到最大值平均分成若干份,并映射为若干个离散值,其弊端在于容易导致记录分布不均匀;等频离散化按照属性数值大小顺序,将所有属性值划分成若干数目相等的区间,其弊端在于有可能使得某些属性进入到不合适的区间。综合上述两种离散方法,根据课程统计数据项的特点及网络课程实施情况,本文采用“区间宽度动态调整法”。将每个数据项按数值从大到小的顺序均划分为N 个区间,每个区间将映射为一个离散值。而对于每个区间宽度,先运用等宽离散法进行大致划分,然后对每个区间及相邻区间属性值进行分析,结合在线课程中该数据项值的判断,按照值相近原则,对边界区间值进行动态调整,从而确定每个区间宽度和边界。

据上所述,对于选取出的章节资源数数据列resource,任务点数数据列task,现有作业数数据列work,章节测验数数据列test,考试数数据列exam,总讨论数数据列discussion,人均活动总参与人次数据列activity,人均课程浏览量数据列pv;以字母a~g 分别表示上述对应数据列的值。将每个属性列根据其区间划分映射为5个离散值,并按照值的大小顺序,分别以编号4 表示离散值对应数值高,3 表示较高,2 表示一般,1 表示低,0 表示无。最终形成课程统计数据如表1 所示。

3 关联规则挖掘和规则分析

开发工具采用Eclipse,数据库MySQL,对事务数据进行关联规则挖掘。通过不断调整,最终设置最小支持度0.2,最小置信度0.6,产生36 条关联规则,部分挖掘结果如表2 所示。

3.1 资源数、任务点数与访问量的规则分析

资源数resource 用于统计已上传至课程网站的资源数量。其中,资源类型包括视频、音频、文档(包含PPT 文档、Word 文档、PDF 文档、Excel 文档及其它类型文档)。教师在上传各类资源时,可选择是否设置任务点,以检测学生是否浏览资源,并可借助平台技术查看任务的总体完成统计。因此,任务点数与资源数有直接的关系。上述规则1,2 分别表示,在资源数较高、任务点数低和资源数一般、任务点数一般的情况下,访问量却均较低。

教师在建设在线课程时,一种较为常见的认识是课程资源要丰富,才能获得学生的关注和使用。因此教师将课件、教案,以及视频等资源分章节上传至课程平台,以吸引学生关注并浏览。众多的资源可以使知识呈现更加完整,也让学生有更多的选择。但上述规则呈现的结论却是资源数较高时访问量仍然较低。联系在线课程实施现状,建立课程资源是前提,没有资源的课程网站相当于无源之水。但资源是否被充分利用,一方面取决于学生是否有足够的学习自主性,如自主借助课程资源进行课前预习、课后复习及完成作业;一方面在于教师是否积极引导,如布置任务,并对资源设置任务点,教师定期向学生提供任务参与度的反馈,或将学生完成的任务点纳入学习绩效等。因此,对于资源的运用,而非单纯资源的数量,才是影响访问量的更为直接因素。

表1:课程事务数据表

表2:部分挖掘结果

规则3,4 显示资源数与任务点数之间的关系,即有了资源才能够有任务点,但任务点数与资源数并没有呈现正比的关系,这跟课程平台功能相关。对于教师上传的资源,平台默认设置其包含任务点,但平台也提供了教师可以取消任务点的操作。借助平台的统计技术,教师对资源设置任务点数,无疑能够更好地评定学习者任务的完成程度;将任务点纳入学生成绩评定,也可以引导学生浏览课程资源。

3.2 人均活动参与总人次与访问量的规则分析

活动参与总人次用于统计学生直接参与在线课程的各项活动,具体包括课堂签到人次、评分参与人次、抢答参与人次、投票参与人次、问卷参与人次、作业参与人次、测验参与人次、考试参与人次等,每项活动的完成必须通过浏览相应的课程页面实现。

上述规则5,6,7 表示,人均活动参与总人次activity 与网站访问量pv 关系密切。规则5,6 分别表示,在任务点数、讨论数、章节测验数和考试数均为0 的情况下,人均活动参与总人次与访问量几乎成正比;规则7 表示,在作业数一般的情况下,人均活动参与总人次较高,则可以带来高浏览量。在其他参照规则中,该结论仍然表现明显。

在线课程能否真正发挥作用,主要在于学生的参与和运用。活动参与人次真正体现了学生对于网络课程的参与和投入。从活动参与人次所包含的活动来看,其类型主要体现在两类,一类是诸如课堂签到、问题抢答、选人和评分等,是学生在课堂必须配合教师完成的教学活动,具有典型的教师主导行为特征;另一类是诸如作业、考试和测验等,用以巩固或检测学生的学习效果,直接与学生的平时成绩或期末成绩挂钩,学生无论出于教师强制要求还是自身成绩考虑,都会主动参与和完成。因此,这两类活动的频次直接影响课程浏览量。事实上,教师在运用在线课程为教学服务时,课程平台提供的技术支持和功能,确实能够一定程度地提高教学效率,激发学生学习积极性。如课堂签到,相对传统逐个点名,可以节约时间;抢答、选人和投票通过设置积分或奖励调动学生学习积极性;学生互评在减少教师工作量的同时让学生体验“小老师”的感觉;测验和考试的自动评分功能以及统计分析功能,极大减少了教师批阅试卷的工作量,且能够准确快速地形成学习数据分析。从上述规则来看,活动参与在教学中的有效运用,直观上能够提高网络课程访问量,但对于教学的实际意义,不仅仅是提高教学效率,而是真正促进学生的参与和投入。

4 结语

建设优质在线网络课程,并让学生积极运用网络课程资源,是每个实施在线课程的教师都要关注的问题。本文基于某高校课程平台在线课程的统计数据,运用Apriori 算法挖掘影响网络课程访问量的可能影响因素。从发现的规则来看,课程资源数量本身并不能直接影响学生对课程网站的访问,学生对教学活动或任务的参与则能明显提高访问量。网络课程的建设是前提,设计合理、内容丰富的一定数量和质量的教学资源是网络课程的基础,而鼓励并引导学生充分参与和投入、合理应用网络课程、提高课程使用率更是关键。对于高校而言,如何科学地建设并合理使用在线网络课程,将教学与信息技术有效结合,尚需要不断总结、实践和完善。

猜你喜欢

访问量关联规则
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
数独的规则和演变
“一带一路”递进,关联民生更紧
奇趣搭配
让规则不规则
高职院校图书馆电子资源中数据库的使用情况分析
智趣
TPP反腐败规则对我国的启示
如何做好搜索引擎优化(SEO)提高新闻网站访问量
如何做好搜索引擎优化(SEO)提高新闻网站访问量