APP下载

基于决策树技术的个性化学习系统的分析设计

2018-01-26明巧英

微型电脑应用 2018年1期
关键词:决策树数据挖掘个性化

明巧英

(西安翻译学院,西安 710105)

0 引言

计算机与通信技术的迅猛发展,足以支撑了建设终身学习型社会的需求,网上在线学习因其信息量大、覆盖范围广等特点,逐步走进人们的身边,目前已成为一种普遍的学习方式。它有力地推动着我国教育大众化的进程。但是,随着时间的推进,学习者要求的不仅仅是时间的自由、学习资源的共享等,更多的是根据自身情况的个性化学习。因学生在兴趣、学习风格、认知等方面存在差异,这些差异在一定程度上影响其学习效果。所以,个性化教育理论认为,学生的学习过程应该是“以学生为中心”,针对学生的个性特点、发展潜能来采取恰当的手段、起点、内容、进程等,把最适合学生自己的学习资源及教学设计提供给他,促使学生在各方面得到自由、充分、和谐的发展。这样才能真正做到因材施教,提升学习效率。目前的网络学习系统虽然很多,而且功能较强大,但都没从根本上解决学生个性化学习的需求。其原因主要是:没有充分考虑学习者的需求、习惯等,要求学习者去适应系统而不是系统适应学习者;其次是缺乏实时的帮助和有效的监管;再者是教学资源没有被充分、有效的利用。这些导致了学生偏离学习目标、失去兴趣等。针对上述问题本文具体采用决策树方法分析学习者的学习风格,挖掘出其个性特征,为个性化学习系统提供决策依据,使个性化学习系统具有学习风格的独特性、学习资源的多维性、学习过程的终身性等。

1 个性化在线学习的理论与技术

1.1 个性化学习的概念

个性化学习长期以来倍受关注,它的思想与实践可追溯到中国的孔子和古希腊的苏格拉底,人本主义、建构主义、多元智能、学习风格等学习理论都体现出个性化学习的理念。

从教学的角度,个性化学习被定义为在小班化、特别的环境中针对性的学习;从学生的角度,它被定义为学生自主选择进行的学习模式。整体上,个性化学习是一种因材施教的学习方式,它强调对学习者个体差异的认识及其对整个教学的影响,具体的说,其概念包含以下核心特征:

1)个性化学习有明确的教学、学习目标体系。该体系由学生的个体特征及发展潜能驱动,进而衍生出相应的教学内容、教学策略、教学环节(环境)设计、教学评价体系等,其最终目标是学生的认知能力、实践能力得到和谐、全面发展[1]。

2)个性化学习的教学模式必须符合学生认知心理现状与发展规律。深入挖掘其个性特征,并提供其创造发展空间,使学生在学习的过程中实现自我追求与价值。

总之,我们不能忽视学习者之间的各种差异,而是努力确保学习者所接受的教育能使其优势最大限度地发挥[2]。在线学习系统要实现个性化的学习功能,就必须根据学习对象组织能够促进其充分发展的学习资源。

1.2 个性化的学生模型的构建

挖掘发现学生个性特征差异是个性化学习的前提,因此,开展个性化学习的首要任务是建构个性化的学生模型。完备的个性化学生模型能帮助教师掌握学生学情、给学生制定符合自身的学习方案、推荐相符的学习内容等。

IEEE1484.2PAPI模型是目前比较成熟的学生模型。该模型涵盖了与学生学习相关的个人基本信息、安全信息、绩效信息等。较好地反映出学生的认知能力,但未能更好地兼容学生学习过程的信息。它描述的学生个体模型及对学生个体特征的分析不够深入,不能很好地反映学习过程中的非智力因素的影响。

学生的学习动机、学习风格、学习偏向及线上登录时间、页面停留时长、学习路径等都是影响在线学习质量的重要参数,也可作为个人信息的扩展。通过对相关数据的适当扩展,不断完善学生模型,为个性化学习提供决策依据。

针对上述问题,对IEEE1484.2PAPI模型进行了改进,如图1所示,加粗部分是修改的。

图1 面向个性化的学生模型

改进后的学生模型不但细化了学生的学习过程、学习特点,更细化了学生本身的个性特点。将图1学生模型信息用五元组进行再次的归类描述[3],如图2所示。

学生的基本信息主要从其初次登录系统时注册的信息中获取;认知水平是学生模型中的动态信息,它反应了学生的认知能力,包括课程、知识簇、知识点等;学习风格反映的是一个人的学习行为、素材类型喜好、参与活动情况、解决问题的能力等;学习状态信息也是学生模型中的动态信息,它是随着学生的不断学习而变化的,主要包括学习用时、学习进度等;学习倾向包括认知、情感、目的等。

图2 学生模型设计

总之,个性化学习模型的原则是依据学生的个性特征对学生进行分类,然后建立相应的学生模型并有针对性的向学生推荐与其学习风格和倾向相符的学习内容。

1.3 决策树技术

数据挖掘就是从巨大的、不完整的、有噪声的、随机的、模糊的数据中,提取隐藏在其中的有价值的信息的过程[5]。它是在没有明确假设的前提下去挖掘、发现知识的。数据挖掘方法可分两大类,即类统计型和机器学习型,统计型常用的技术有相关性、概率分析、判别分析和聚类分析等;机器学习型是通过训练、学习大量的样本集得出需要的参数或模式。从机器学习中引出的决策树方法根据给定的训练样本集来构建分类模型,模型用树的形式来表达。决策树算法常被分为两个阶段:决策树的构建和修剪。决策树按照根节点到叶节点的顺序对实例进行分类,形成分类规则。其中的每个节点代表一个属性,每个分枝代表它所连接的上节点在其属性上的可能取值。决策树在叶结点得到结论,所以从根到叶节点的一条路径就对应着一条规则[6],整个决策树就对应着一组析取表达式规则。决策树停止分割的条件有进行分割的数据没有再能用的属性;同样类别的数据都在该节点上。图3简单描述了决策树的生成过程。

图3 决策树生成过程

2 决策树技术在个性化学习中的应用

2.1 决策树在个性化学习中的应用分析

本文从以下几个方面分析怎样把决策树方法应用到在线学习系统中。

1)学生特征挖掘与学习评价

根据学生的注册信息、在线学习记录、认知结构等,挖掘学生学习特征,使教师有根据的帮助学生达到既定行为目标;对数据库中学生的行为记录、学习成绩、奖励处罚等进行量化分析,不但可以即时得到学生学习情况的评价结果,而且可以减轻教师工作量,并克服教师主观评价不客观、不公正的弱点。

2)个性化学习

依据学生注册时的信息以及需求纪录,显示给学生可能引起学习兴趣的相关知识;在“以学生为中心”的学习理念的指导下,了解学生、分析学生,按照学生层次对学生分类,为学生“量身定做”学习资源和学习策略,引导学生根据各自的兴趣特长进行学习;识别不同学生的喜好并建立相关信息档案,并能根据学生的学习进度进行调整,使每个学生对系统的访问都与其他学生不同。

3)改进网站设计

采用决策树数据挖掘后,网站设计者可找出学生访问频繁的路径,再根据频繁路径来修改网站的结构,即依据网站访问者的相关信息来设计和修改网站结构及外观。从而节约学生的访问时间、提升网站的访问率、减少网站开支。

4)分析需求趋势

挖掘分析学生浏览学习资料的历史数据,对学生的学习需求进行趋势预测,评估学生需求倾向的改变,及时调整网站的专业设置与课程设置,在最大程度上满足学生的个体需求,有助于提升网站的竞争力。

总之,决策树技术在在线学习系统中的应用,可及时发现学生的个体特性,分析学生的需求变化,对网站进行针对性的改变等,从而实现学生的个性化学习,提高其学习效率。

2.2 决策树在个性化学习中的应用流程

本文把决策树在个性化学习中的应用流程细分为六个步骤:数据采集、数据预处理、数据量化、决策树构建、决策树剪枝、规则和结论的生成。

1)数据采集

本文的研究数据主要来源于学习系统的底层数据库及学生的非智力因素两大方面。底层数据库的数据主要包括:学生的网页浏览行为记录、学生的电子笔记、实时交流等,这些数据主要用于分析学生在线学习行为对学习效果的影响。

研究非智力因素对学生学习效果影响的方法主要是对其调查问卷的统计分析,调查问卷回收所得数据的结构化是不能保证的,因此要对所得数据进行规约简化处理,使最终得到良构的数据集。

2)数据预处理

数据预处理不但要将第一步得到的数据进行筛选并剔除无效的或置信度低的信息,而且要分析得到多组数据的相关系数和协方差,然后得出元素属性。如果数据与所要分析对象的相关性低,则删除掉。经过这一步压缩和简化处理,所得数据基本上就可用了。

3)数据量化

本研究需要对以下几类数据分别进行不同的量化处理:

(1)将收集来的调查问卷中选项的形式转化为简约的文字描述形式,即将ABCD数据还原成所对应的文字。

(2)量化处理学习效果。本研究采用加权相关系数分析的结果,但该结果没有直观性,,所以取四分点划分学习效果,从而得出学习效果的评定等级。

(3)分布类数据的处理。本研究按区间将分布数据(成绩分布、时间分布等)进行划分,分别用文字或布尔值表示。

(4)拆分处理并列类别的选项。本研究问卷的多选题的选项属于并列类,对这类题首先应从宏观角度考虑本题所有选项因素对学生学习效果的影响,然后再将选项拆分,进一步考虑各因素对学生学习效果的影响。

4)决策树的构建

将经过上述处理的数据以训练样本集的角色输入到开源平台中,进行配置后生成决策树。

5)决策树的剪枝和评测

决策树在生成时,限制了树的深度和每一个节点至少要包含的要素数,对测试结果进行随机序列分布分析和交叉验证,并根据验证结果来筛选规则,再分析筛选出规则的置信度及变量支持属性,最终把较优的决策树选取为预测模型。

6)生成规则和结论

当完成上述5个步骤后,就得到了一棵修剪好的、表述直观的决策树模型,经决策树模型的根节点到叶子节点顺序判定的方法提取出析取规则。

以下为在一周内,根据学生对学习资源的使用情况来分析学生的学习风格[7]。如图4所示。停留时间长指停留时间≥15分钟,点击率高指一周内点击次数≥9次,且同类型不一样的资源学习次数≥3次,参与次数多指一周内参与答疑讨论≥3次。

根据图4的决策树,每完成一次从根节点出发到叶子节点的过程就可形成一条规则,规则描述如下:

图4 学习风格分类决策树

(1)if(学习资源=媒体 and音/视频=停留时间长、点击率高)then (学生学习风格=视听型);

(2)if(学习资源=媒体 and音/视频=停留时间短、点击率底 and教案/讲义=停留时间长、点击率高) then (学生学习风格=读写型);

(3)if(学习资源=媒体and音/视频=停留时间短、点击率底and教案/讲义=停留时间短、点击率底) then (学生学习风格=协调型)。

后面相似的,不再罗列。老师可依据学习风格分类规则给学生推荐适合的学习资源。

3 个性化学习系统的设计

本系统设计的总体原则是:关注分析学生的问卷结果、注册信息,并利用数据挖掘技术,挖掘系统数据库,分类预测出学生的个性特征,然后根据学生自身的特点和规则库中的规则,给学生制定或推荐适合的学习内容、学习路径等。

3.1 系统的整体架构设计

系统的总体架构图,它由数据采集层、数据存储处理层、数据挖掘层、应用层组成,这四个层次是相对独立的,如图5所示。

图5 在线学习系统的总体架构

1)数据采集层

该层的数据来源主要包括:教师上传的各种学习资料、利用工具从网络上采集的各种相关学习资料,还有从学生本身获得的资料(学生想要在线学习,必须注册自己的基本信息;开始学习某一门课前,需填写自我认知能力预估表;自愿参加自我学习风格测试的测试结果;在线交流信息及网络日志等)。

2)数据存储处理层

该层主要对各种数据进行存储、分析、计算、调度等。

3)数据挖掘层

该层主要对相关数据进行数据预处理、数据量化、利用支持工具构建决策树、对决策树进行剪枝,生成个性化推荐的相关规则和结论。

4)应用层

应用层主要是通过操作界面让学生达到学习目的获得满意的。学生不但能应用普通的在线学习功能,而且可以由系统依据学生的个体特征给学生推荐适合的学习资源,从而完成学习者个性化服务、接收用户需求以及反馈需求结果。

3.2 个性化学习模型设计

“个性化授导”的在线学习本质上是以学生需求为中心的个性化服务的过程。其既能根据学生特征提供学习资源即“授”,也能提供学习过程的支持服务指导学习即“导”。

学习系统的个性化学习模型结构如图6所示,以学习者模型为核心实现个性化服务,老师的主要作用是教学设计、提供教学资源、对教学和学生行为作出诊断,同时实施一定的管理。个性化学习模型结构的主要模块功能详述,如图6所示。

图6 个性化学习模型结构

1)数据库

系统中的数据库包括:资源库、用户信息库、规则库。资源库中存储着大量的表现形式各异的学习资料,如讲稿、PPT课件、电子书、知识点常见问题解答、单元分块等;还有便于学生了解课程结构的说明,即课程地图、目录表等。用户库中保存的主要信息有:学生注册时的基本信息、学习风格预测信息、学习日志、学生各项考核信息等[8]。这:些信息一方面反映出学生的知识水平和学习风格,另一方面给后期的数据挖掘提供了数据分析基础,使系统的个性化有据可依。规则库在学习系统中起着至关重要的因素。它包括的规则有:一开始就加载在库中的教育界公认的规则、利用数据挖掘挖掘出来的规则、还有组织学习资料的依据,如给视觉型学生提供图表、视频一类的学习资料。规则库中的规则既要不断更新,也要经过专家的认可。

2)管理模块

管理模块主要是体现管理员对系统的管理维护,管理员可修改学习资源、用户信息等,权限较高。再者教师也具有一定的管理权限,学习系统中教师的参与能弥补智能计算机的不足,给学生提供真正的个性化服务。

3)用户模块

用户模块主要体现系统的学习用户。学习用户在系统中可选择自己要学习的内容,或使用系统给自己推荐的学习资源等。

4)学习者模型模块

学习者模型是对学生在系统中的注册信息、测试结果、学习过程、学习方式等进行的一定的分析、归类及表示,如图2。

5)数据挖掘模块

数据挖掘模块主要是从系统中存储的大量的数据中,提取隐藏在其中的对学生个性化学习有价值的信息的过程。

6)个性化学习模块

个性化学习模块在结合学生模型和数据挖掘的基础上,根据规则库的数据动态,形成学习内容等,然后以不同的表现方式提供给不同的学生(如同样意思的知识内容,有陈述简单和详细之分;同样的知识有体现新知识传授的,有体现知识掌握程度测试的;在知识内容相同的情况下,系统对不同的用户显示的页面也不同)。学习系统这种有的放矢的个性化服务是依据学生的个体特征实现的。

3.3 基于决策树的数据挖掘模块设计

该模块从服务器上获取学生的档案信息、学习动态信息等,进而对学生访问日志的路径补充后,对数据库中的数据进行抽取、预处理、清除与挖掘无关的信息项等,最后得到学生信息的原始数据立方体数据库,如图7所示。

图7 数据挖掘模块

应用数据挖掘算法中的决策树方法等来处理立方体数据库,得到的挖掘结果,对学生个性模型进行不断的补充和完善,最后依据规则等把学习内容以学生容易明白和接受的方式呈现,还可以通过服务器给学生反馈合适的学习策略及学习建议。

3.4 个性化推荐模块设计

学习系统的个性化推荐模块层次结构分为数据存储层、数据挖掘层、推荐引擎层和应用层,如图8所示。

图8 个性化推荐模块层次结构

数据存储层主要存储与学生有关的各种信息,由于存储量巨大,所以是基于HDFS的分布式数据存储。数据挖掘层对存储的大量数据进行挖掘分析,找出潜在的有价值的信息。推荐引擎层在进行推荐时,以学生的个性特征、规则等为依据,给学生推荐偏爱的资源或信息类型,并发掘资源或信息自身的相关性,然后再根据对象间的关联性进行推荐[9];对于有相同或相近特性、喜好的学生,可进行好友推荐,形成兴趣小组;对于点击率高的资源,可进行热点推荐;新上传的资源可进行最新推荐;还有最优路径推荐等。

4 总结

数据挖掘技术在学习系统中的应用,不但提高了学习系统的个性化服务水平,而且也为教学的决策分析提供了辅助手段。基于决策树技术的个性化学习系统的分析设计充分考虑了学生的性格特点、认知水平等,构建出了个性化的学生模型,并完成了系统的分析设计。这些工作在一定程度上为在线学习系统的个性化应用提供了研究、推广的参考价值。但该研究还有待于进一步深入的、全面的进行,直到把数据挖掘技术与个性化学习系统深度融合,最终成熟地应用在在线学习的各个 环节,增强学生的内部动机,以提高其学习的积极主动性,及其学习效率,使教学真正做到因材施教。

[1] 葛庆敏.基于WEB的个性化学习指导系统设计与开发[D].济南:山东师范大学,2016.

[2] 朱兴宇,时庆涛,李德泓.基于数据挖掘技术的个性化学习系统的设计[J].吉林广播电视大学学报,2015(9):49-50,102.

[3] 王晓波.基于测试的个性化学习引导系统的研究与实现[J].计算机教育,2015(14):56-60,65.

[4] 陈超.基于数据挖掘的个性化学习模式研究[J].电子设计工程,2013,21(12):18-20,23.

[5] 陈芳.基于决策树的个性化网络教学系统的设计与实现[D].南京:东南大学,2015.

[6] 赵学孔,岑磊.面向用户需求的自适应学习系统个性化学习路径推荐研究[J].中国教育信息化,2016(21):28-31.

[7] 于洋.基于决策树的网络教学系统的学生模型研究[J].鲁东大学学报(自然科学版),2013,29(1):32-34,37.

[8] 陈亦欣.基于人工智能的在线学习系统的研究与设计[J].江苏科技信息,2017,(20):55-56.

[9] 王琳琳.基于协同过滤的在线学习个性化推荐技术研究[J].微型电脑应用,2017,33(05):49-51.

[10] 吴洪艳.智慧学习视角下个性化在线学习系统设计与应用[J].中国电化教,2015(6):127-131.

猜你喜欢

决策树数据挖掘个性化
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
坚持个性化的写作
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
新闻的个性化写作
上汽大通:C2B个性化定制未来
基于决策树的出租车乘客出行目的识别
一种基于Hadoop的大数据挖掘云服务及应用
基于肺癌CT的决策树模型在肺癌诊断中的应用