APP下载

数据挖掘技术在教务管理实践中的应用研究

2014-01-16刘静

电子设计工程 2014年24期
关键词:数据仓库教务数据模型

刘静

(南京航空航天大学 国际教育学院,江苏 南京 210016)

随着信息时代的快速发展,大量的数据被人类搜集和存储,通过数据库我们可以方便的存储这些海量数据,但是由于之前的数据库功能缺乏,无数据分析和研究功能,数据并不能得到有效利用。而数据挖掘技术则可以方便有效的对复杂的数据进行分析和处理,在商业、金融等领域已得到了广泛使用。数据挖掘技术在许多行业已经有了比较成熟的技术和相应的挖掘工具软件[1-3]。

目前,许多高等院校都开放了各自的教务管理系统,也初步具备了日常管理功能,具有一定的信息处理分析功能[4-6]。但国内的教务管理系统,仍停留在日常事务处理的操作层面上,仅仅是从手工管理过渡到计算机上而已,没有涉及到面向主题和历史数据的分析决策层面上,也缺乏成熟的分析系统。总体上来说,教务管理的信息化仍处于初级阶段,离真正的信息化和决策化水平尚有较大的差距。因此,借助于数据挖掘技术对成绩进行分析、并找出隐藏在课程和成绩之间的关系规律,找出不同院系不同专业学生的就业率,使得决策者准确把握专业动向,合理进行决策安排,具有显著的现实意义。

1 数据挖掘技术

1.1 数据挖掘的概念

一般意义上的数据挖掘是一个进行探究海量数据的分析过程,该过程以大规模的数据为研究对象。通过数据分析找出数据之间的某种联系,并将这些规律应用到新的数据库中。而数据分析的主要目的是进行预测,预测也是数据挖掘技术最主要的应用之一。

数据挖掘(Data mining),它是数据库知识发现中的一个步骤。数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。

1.2 数据挖掘的步骤

数据挖掘可以分为3个步骤:即数据准备、规律查找和规律展示。数据准备指的是从已有的数据源中选取有用的数据并将归类为数据挖掘的数据集;规律查找是采用特定的数学方法将数据集所包含的内在规律找出来;规律展示是指采用比较易于理解的模式(如可视化)将已经找出的规律表示出来。典型的数据挖掘结构如图1所示。

图1 典型数据挖掘系统结构图Fig.1 Typical data mining system structure

2 数据挖掘的主要分析方法

2.1 聚类分析

聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。该技术来源于生物学、统计学和机器学习等。因此在目前的聚类分析中,往往由聚类产生组,组集合为簇,不同簇的之间的对象和对象相互具有很高的相异性。聚类分析具有不同方法:如基于密度的分析方法、层次的分析方法、划分的分析方法、基于模型的分析方法、基于网格的分析方法等。

2.2 决策树

数据挖掘方法中另外一个主要方面是分类和预测。分类和预测方法是指在给定条件下能够得到哪些值,其中决策树是数据挖掘中的一个重要方法。决策树可以分为分类树决策和回归树决策。数据库中离散的变量采用分类树模型,其中的连续型变量采用回归树模型。决策树分析的基础是需要知道不同状况下的事件的发生概率,故决策树模型是一种基于数据的预测模型,它表示的是不同对象属性和其对象值之间的一种映射关系。

2.3 人工神经网络

数据挖掘另外一个重要的分析方法是人工神经网络。人工神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型,由大量的节点(或称神经元)之间相互联接构成。人工神经网络能够实现大规模的并行计算,它能够利用海量的计算单元形成的特定网络,该模型可以分为自组织网络、前馈式网络和反馈式网络等。

3 教务管理系统设计

3.1 总体设计

从设计思路上来看,教务管理系统作为一个典型信息管理综合系统,涉及到的信息有很多,主要有学生、教职工、成绩、课程等。这些数据处理表示方法如下。

入学时,管理人员以班级为单位将学生的学籍信息录入学校教务管理系统,与此同时,将各自教学计划录入系统。每次考试结束后,由工作人员将学生考试成绩录入。当学生需要调换专业等操作时,则可由学校专门教师进行修改。在教师评价中,将学生及各部门对教师评价所打分数录入管理系统中,为将来数据挖掘做充分准备。该系统由两部分组成:即日常教务管理系统、以及数据挖掘子分析系统。

从功能上来看,本次设计的教务管理系统可以包括以下几个子模块:成绩管理子模块、学生管理子模块、课程管理子模块、教师管理子模块、系统设置子模块、数据挖掘分析子模块等。

3.2 数据库设计

教务管理信息系统主要工作之一为数据库的设计,对于该类系统来讲,合适的数据库是数据仓库数据的重要来源。因此,设计数据库时,需要进行合理的数据搜集,使之不容易出现冗余,从而能够加快访问速度和效率。

本次设计中,系统的主要对象为学生、教师、课程和成绩。不同的对象对应不同的属性,如学生的属性有学号、姓名、性别、籍贯、民族、联系方式以及班级等。教师的属性主要有工号、教师姓名、性别、学历、专业、取得学位、职称、联系方式等。应该根据实体关系所确定的模型,通过合理设计数据库表,将所涉及到的属性信息输入进去。

3.3 数据仓库设计

数据仓库的设计不同于数据库,数据库主要目的是存储数据,而建立数据仓库是为了满足复杂的数据统计分析需要。教务管理系统中的数据通过处理,转移到数据仓库中,从而可以让管理者通过数据仓库进行数据挖掘,最终实现对学生学习培养、教师素质提高提供决策支持。本次设计的数据仓库包括几个部分:1)数据源;2)数据提取;3)数据预处理;4)数据集市;5)分析工具。

3.4 数据模型

由于本文研究的主要对象是教务管理系统,因此重点关注内容应该是学生和教师的信息。这就需要在模型设计时,要研究学生数据模型以及教师数据模型。

1)学生数据模型

学生数据中主要考虑学生的基本信息,如性别、学分、成绩、籍贯、班级等。针对不同学生,建立学生数据模型:

①根据性别建立数据模型;②根据性别建立数据模型;③根据民族建立数据模型;④根据成绩建立数据模型;⑤根据学分建立数据模型。

2)教师数据模型

①根据性别建立数据模型;②根据学历建立数据模型;③根据年龄建立数据模型;④根据职称建立数据模型;⑤根据教师评价建立数据模型。

4 实际应用

数据挖掘模型建立以后,必须通过编程语言和其他一些工具进行数据挖掘。本系统在设计功能上,实现了教务管理系统的许多基本功能,比如学生管理、成绩管理、教师管理等。

4.1 日常事务管理实现

日常事务管理主要分为系统登陆模块和学生管理模块两类。系统登陆模块主要功能是用户启动系统,出现登录界面,选择身份。如图2所示。

图2 系统登陆模块Fig.2 Login module

学生管理模块的功能主要实现学生信息的独自录入、修改、删除等功能。

4.2 教师信息数据挖掘分析

可以使用聚类分析法对任课教师评价数据进行合理的数据挖掘。教师评价指标主要有:教学内容、教学方式、教学态度和知识能力。在进行教学评价时,往往以班级为单位,组织学生自己,运用教务管理系统为教师打分。

之后就可以使用数据挖掘模块对打分结果进行聚类分析,那么从聚类分析结果来看,结合实际评分的结果,通过人工分析得出,聚类分析更能正确的进行教学评价分析。

以副教授为例,其所占全部教师比例为5%,若评价均值为80。因该类教师年龄较大,且主要经历在科学研究方面,平时授课时间相对较少,且每次讲课方式和方法比较固定,导致上课时和学生沟通较少。故该类教师的教学评价较低。

以上对于聚类分析结果进行了分析,得出学历较高职称较高的教师得到的评价较高,这是由于这类教师经验丰富、知识面广。学院管理者可以通过聚类分析的结果对每类教师进行相应的培养,以便可以提高教师的教学水平。

4.3 成绩信息数据挖掘

由于课程之间的相互影响是客观存在的,在实际应用过程中,通过对学生考试成绩进行充分的数据挖掘和分析研究,从而找出安排课程合理规律,为学院制定人才培养计划,安排教学内容提供合理的参考。我们可以使用教务管理系统设计的课程关联性使用分析功能模块,实现对数据仓库中有用的相关数据进行关联情况规则分析,比如使用Aprior算法,可以产生数据挖掘结果。

通过分析可以看出,不同课程之间不是杂乱无章的,而是内在存有很强的联系,这往往在考试成绩差与平时成绩好的学生能够明显的体现出来,因此在制定相关的人才培养计划时,必须考虑到课程之间的相关性,并考虑到课程的开设顺序,影响学生学习效果的方面,实践中不能将课程提前开设或者向后开设、同时开设。本次研究的成果,所得到的数据挖掘结果应用,可以作为管理者参考的依据,同时也可以成为学生选课的依据。

4.4 本系统的创新和不足

本次研究,设计了一个基于数据挖掘的高校教务管理系统,从功能上来看,对数据仓库和数据表进行详细的设计,实现了教务管理系统中往往难以实现的功能,给出了重要模块的实现过程。模型将聚类分析方法应用到教师和学生评价中,并且将关联分析植入到学生成绩评定中,最后 对系统进行了功能和性能方面的测试,从而验证了系统运行的正确性。

由于作者能力有限,本次设计的系统中挖掘的内容相对单一和数量较少,除了文中所涉及的挖掘内容外,尚有诸多内容,仍待继续改进。

5 结论

在教务管理过程中,往往涉及到大量的数据,采用传统的方法无法适应日益增长的数据规模需要,因此随着社会进步及计算机和网络技术的应用,数据挖掘技术为我们提供了合适的工具,本文基于此,研究分析了数据挖掘技术在高校教务管理系统的应用和实现。论证了数据挖掘的概念、分析方法,提出了教务管理系统的数据挖掘模型,分别对学生模块和教师模块应建立的模型进行了分析,通过实例分析可知,本系统模型能够极大提高管理者的效率,本研究为类似项目研究提供了一个借鉴。

[1]姚志鸿.数据挖掘技术在教学管理中的应用与实现 [J].电子测试,2014(6):108-109.YAO Zhi-hong.The realization and application of data mining technology in teaching management[J].Electronic Test,2014(6):108-109.

[2]吴天真,李文静.数据挖掘技术在高校教务管理中的应用综述[J].科协论坛,2013(7):75-76.WU Tian-zhen,LI Wen-jing.Overview of application of data mining technology in the colleges and universities teaching management[J].Science and Technology Association Forum,2013(7):75-76.

[3]李素朵.数据挖掘技术在高职院校教务管理系统中的应用研究[D].石家庄:河北科技大学,2013.

[4]林丽.数据挖掘技术在高校教务管理系统中的应用[J].轻工科技,2012(4):89-90.LIN Li.Application of data mining technology in the university educational administration management system[J].Light Industrial Science and Technology,2012(4):89-90.

[5]魏韫怡.数据挖掘技术在电大教务管理中的应用[J].科技视界,2012,8(22):98-100.WEI Yun-yi.Application of data mining technology in the teaching management in TV University[J].Science and Technology View,2012,8(22):98-100.

[6]欧振用.数据挖掘技术在教务管理系统中应用研究[D].北京:北方工业大学,2011.

猜你喜欢

数据仓库教务数据模型
教务排课对高等院校教学运行的作用分析
基于数据仓库的数据倾斜解决方案研究
基于数据仓库的住房城乡建设信息系统整合研究
浅析高校教务管理存在的问题及对策
面板数据模型截面相关检验方法综述
探析电力系统调度中数据仓库技术的应用
浅谈新形势下高校教务管理人员的素质与培养
财政支出效率与产业结构:要素积累与流动——基于DEA 和省级面板数据模型的实证研究
基于数据仓库的数据分析探索与实践
写在最后