APP下载

数据科学在高校学风治理工作中的应用探索

2016-10-19孙雪凌

无线互联科技 2016年17期
关键词:离群教务学风

孙雪凌

(无锡太湖学院,江苏 无锡 214000)

数据科学在高校学风治理工作中的应用探索

孙雪凌

(无锡太湖学院,江苏无锡214000)

大数据时代下,高校教育信息化的建设水平日趋完善,数据驱动决策的管理思路也逐渐被引入到教务管理领域。文章主要聚焦于探索该领域中的学风治理业务方向,其主要研究内容是针对传统学风治理手段中的不足,创新地将数据科学引入其中,尝试解决高校学风治理工作中的种种问题,帮助切实提高新时代下教务管理工作的治理能效。文中探讨了利用数据科学方法,基于Python在该领域的应用实现,精准定位学风表现典型班级群体,辨析学风整体表现的影响因素,为教务管理的个性化治理方案制定提供依据,以此帮助学校实现学习风气的整体提升。

数据挖掘;数据可视化;学风治理

1 概述

自2012年出台《教育信息化十年发展规划(2011—2020年)》起,教育信息化领域的政策集中发布。时至今日,10年规划已经过半,常规教学运行业务已实现了与信息技术的高度融合。在教务信息系统的帮助下,高校获得了比以往任何时期都更为强大的业务处理效能,同时,关于教师、学生等的业务数据无论是在数据量还是指标维度的数量上均获得了爆发性增长,信息化战略的实施为高校实现数据化治理积累了海量的数据储备。然而,数据价值都具有时效性,如果无法及时培育出与业务数据生产速度相适应的数据转化与利用能力,在有效时间内从数据海洋里挖掘出蕴藏其中的价值信息,将使得这部分数据的价值逐步贬值,从而催化教学监控工作“有监无控”状态的产生。近年来,伴随工业界对数据科学应用需求的不断增长,Python,R等开源工具在数据化治理领域受到了高度关注和长足发展,尤其是Python一系列针对数据分析、数据挖掘与数据可视化开源扩展库的推出,更是使得管理人员利用Python数据科学应用,辅助开展业务管理工作变得便利可靠。而相对于高校管理业务而言,外部技术环境的逐渐成熟则更加使得传统教务管理业务借力现代数据科学应用技术,大幅改善学风管理治理能效成为可能。

2 高校学风治理工作现状

现如今,学风治理工作已成为高校教学质量监控体系非常重要的环节之一,其治理能效极大程度地影响甚至决定了一所高校的整体学风水平。然而细究传统学风治理工作会发现,其评价手段往往比较单一,通常做法就是根据任课教师对各教学班的评价打分数据,计算出加权平均分,然后根据分值以班级为单位进行简单排序,以班级的排名次序作为学风考核的唯一依据。这样的考核方式虽然具备一定的有效性,但同时也存在非常明显的缺点,其主要体现在不能精准区分学风明显优秀、表现一般和显著落后的班级,因此也就无法针对各个群体的个性特征来制定和实施针对性治理方案,这在一定程度上影响了学风治理的工作能效,在帮助改进学校学风方面的价值也非常有限,对于学校学风建设工作的参考价值并不高。然而在当今的大数据时代下,数据驱动决策的理念逐渐成为主流,从高校教务管理的实际需求出发,基于对数据科学相关技术的应用与功能实现,努力探索制定一套能够切实提高学风治理能效的决策支持方案,成为当务之急。

3 基于Python数据分析技术的应对策略

3.1关键技术介绍

3.1.1Python程序开发语言

Python是一种流行的程序设计语言,其具备语法简洁、快速开发、功能完善等特征,并且Python拥有丰富且功能强大的各种扩展库,可以执行很多种类的任务,数据科学应用便是其中的一个开发方向。对于本文的研究内容而言,其最大的优点是能够实现软件的快速开发,帮助教务人员从繁琐的软件开发工作中解脱出来,将更多的精力专注于业务内容本身,在方案实现上具备较好的推广复用基础。

3.1.2Python数据处理技术

近年来,Python在数据科学领域已经形成了一个由研究员、从业者和新手组成的氛围活跃的大社区,在良好外部环境的培育下得到了长足发展,并不断涌现出如Numpy,Pandas,scikit-learn等一批功能完善、且完全开源的数据科学工具库。为Python使用者实施数据清洗、数据转换、数据分析、数据挖掘等工作提供了优良的技术储备。

3.1.3 Python数据可视化技术

可视化的作用一般分为两种,即探索式数据可视化或解释性数据可视化,本文中的应用需求对于以上两者均有所涉及。首先,在数据挖掘阶段,为提高结果的准确度,需要从人的视觉决断维度入手来评估和调整离群挖掘算法中的阀值参数,探索式数据可视化则在这一过程中起到了关键性的辅助作用,能够帮助分析员利用视觉决断力快速、准确地完成对异常值群体的辨析任务。而后,在描述分析原理及分析结论阶段,又需要借助解释性数据可视化的手段去呈现数据表征,帮助业务管理人员理解复杂的数据结构和分析过程。对于上述需求,Python的matplotlib扩展库能够为这一过程提供良好的技术支撑,其拥有非常丰富的功能函数群,能够胜任各类数据可视化任务,是数据工作者最常用到的数据可视化工具之一。

3.2实现过程及应用成效

Python为本文的分析任务提供了良好的开发环境,以及包括数据分析、数据挖掘和数据可视化等在内的全套技术支撑,在利用上述工具完成开发环境搭建后,即可开始班风数据异常值的挖掘与成因辨析等工作。本文的示例数据来自某高校一整学期的教师评价数据,其评价体系如表1所示。

表1 某高校班级学风评价体系

学风治理的数据分析工作主要可划分为班级表现分类、异常值识别、结论可视化呈献、影响因素辨析4个步骤,其具体的实现方法及应用成效如下。

(1)根据学风表现对班级群体分类。本文中的实例数据由教师评学体系的10项细分指标及其具体分值构成。第一步动作是将学校内428个班级的学风评价得分数据准确划分为两个簇,即学风趋好群体与学风趋差群体。班风表现的分簇主要是基于Python对K-Means聚类挖掘算法的实现来完成,在完成分簇动作后,其分簇结果可matplotlib以红、蓝两色进行可视化呈献,效果如图1所示。

图1 某高校班级学风聚类效果

(2)利用离群挖掘算法识别典型群体。在成功实现班级分簇后,第二步便是在分簇基础上区分出各簇内的异常值群体,即学风表现明显优秀与显著落后的两类班级群体。其识别动作主要是基于Python对离群挖掘算法的实现完成,首先需通过将各班级学风评价得分的10项细分指标值聚合转换成一个单项值,即本班级学风各项评价得分离簇中心的距离,然后根据离心距离与阀值的比较,判断其是否属于离群点。过程中最关键的就是借助探索性数据可视化手段来设定合适的离群阀值参数,以此准确区分和定位两簇内的离群点班级,并用红色圆点进行标注,其解释性可视化效果如图2所示。

图2 离群挖掘过程解释性可视化

(3)对数据挖掘结论进行可视化呈献。在确定前两个步骤得到有效实施后,即可根据班级名称关联整合学风聚类挖掘和离群挖掘的结果数据,最终达到对学风表现特别优秀和显著落后的两类班级进行定位与识别的目的,并对外输出详细的预警与榜样班级名单。同时,为直观呈献分析结论,还可利用解释性可视化手段对其数据表征进行呈献,通过matplotlib的绘图功能,将学风表现明显优秀的班级用红色三角形标注,而将显著落后的班级用蓝色三角形进行标注,效果如图3所示。

图3 学风表现典型班级群体识别效果可视化

(4)辨析影响学风表现的决定性指标。在完成上述一系列典型班级的识别动作后,还需要进一步完成对典型学风表现成因的辨析,找出显著影响学风评价得分的细分指标项,即利用相关性算法来判断哪些细分指标对最终班级学风评价的加权均分产生了高度的影响,以此来为学风治理方案的制定提供决策依据。对于这一步的动作实现,则主要是依赖Python对相关性算法的实现来完成,经过相关性算法的计算,最终发现5项与实例数据中评价总分产生强相关关系的细分指标,如表2所示。

表2 学风表现典型班级群体识别效果可视化

由此,教务管理人员可参照上述数据挖掘的结论,针对学风表现优秀和落后的群体,分别提出有效地巩固与提升治理方案,以数据驱动决策的方式,开展更加高效、精准的学风治理工作。

4 结语

Python数据科学应用技术能够很好地解决传统学风治理工作所面临的定位不精确和治理能效低下等问题。通过“准确聚焦—对症下药”的创新思路,基于Python语言对各种数据挖掘算法和可视化绘图功能的实现,本文在实践中探索出一套建立在数据驱动决策基础上的学风治理整体解决方案。其理念更加贴合当今大数据时代下业务信息化、管理数据化的治理思路,相较于传统的学风治理方案,其效果更加显著,是较理想的替代方案。

今后,通过对该方案在高校环境下的长期探索实践,不断总结改进,教务管理者甚至能够将其中的经验平行迁移,应用至其他相近业务中,令高校的业务信息化工作真正有效支撑治理方案的制定,建立聚焦度更高、长期有效的教务治理体系。长此以往,将使得高校教学运行与教学建设之间形成良性循环,更好地适应大数据时代下飞速发展的教育信息化建设工作要求,成为推动学校现代化建设发展的重要动力。

[1]ROBERT L.Learning Data Mining with Python[M].北京:中国工信出版集团,2016.

[2]M KINNY W.Python for Data Analysis[M].California: O'Reilly Media, Inc, 2013.

[3]IGOR M.Python Data Visualization Cookbook[M]. Birmingham: Packt Publishing, 2013.

[4]张刚要,李艺.信息技术教育应用之外的第二条道路—“信息技术与教育深度融合”路径之反思[J].中国电化教育,2016(5):13-17.

Research on the application of data science in the study atmosphere management of universities and colleges

Sun Xueling
(Wuxi Taihu College, Wuxi 214000, China)

In the era of big data, the construction of information technology in higher education is becoming more and more perfect, and the management of data driven decision-making has gradually been introduced into the feld of educational administration management. This paper mainly focused to explore in the feld of studying atmosphere management business direction, and the main content of the research is aiming at the shortage of traditional studying atmosphere treatment means, and innovatedly applied data science into it,and tried to solve the problems in the governance of studying atmosphere in colleges and universities, to help enhance educational administration management effciency of high-tech era. This paper discussed using scientifc data method, basing on the application and implementation of Python in the feld, and precisely position the class group of typical style performed, and analyzed the infuence factors of the overall performance of studying atmosphere, providing the basis for individualized treatment plan of educational administration, in order to help schools to achieve the whole ascent of studying atmosphere.

data mining; data visualization;management of studying atmosphere

孙雪凌(1988— ),男,江苏无锡,助理研究员;研究方向:数据科学,计算机教学。

猜你喜欢

离群教务学风
教务排课对高等院校教学运行的作用分析
辅导员视角下的“抓学风”
浅析高校教务管理存在的问题及对策
浅谈新形势下高校教务管理人员的素质与培养
离群数据挖掘在发现房产销售潜在客户中的应用
以培养方案为核心的教务管理系统开发的探索与实践
离群的小鸡
陈嘉庚精神与“诚毅”学风的形成
应用相似度测量的图离群点检测方法
一种基于核空间局部离群因子的离群点挖掘方法