APP下载

基于Hadoop大数据分析学生行为的校务管理平台

2021-06-16符龙生

电子技术与软件工程 2021年5期
关键词:画像信息系统标签

符龙生

(海南经贸职业技术学院 海南省海口市 571100)

为提升我国高等职业教育发展水平,有关职能部门相继出台多项部门规章与发展规划,从制度、政策维度为相关建设工作提供科学指导。若想实现高职学校的创新发展与科学转型提升其专业化水平,首先需要确保学校管理制度的科学性与先进性。本文探讨基于现代大数据技术的新型学校事务管理系统,在全面提升管理效率的基础上为“双高”建设目标的实现提供有力支持。在发挥本系统学生行为分析功能的基础上,能够明确管理工作的目标和重点,再提升工作效率的同时提高学校综合管理水平。

1 校务大数据平台的建设

1.1 背景及存在的问题

信息时代实现了现代信息技术的高速发展与广泛应用。高等职业院校作为我国高等教育的重要组成,同样需要持续开展信息化建设工作,明确职能目标,以提升工作效率为目的积极推动信息系统建设管理工作,打造一套由人事管理系统、财务管理系统、教务系统,一卡通系统,教学资源平台等为核心的信息化管理系统。各类信息化系统的使用虽然能够极大提升管理效率,但是也会形成大规模的数据信息,导致了巨大的数据管理工作量。以学生为例,其基本信息涵盖了姓名、学号、院系、年级、籍贯等信息,同时也包含了学校消费、后勤消费等生活信息;同时还涉及考试成绩、选课考评、图书借阅等方面的信息。高职院校在自身信息化发展方面虽然取得一些成果,但尚有许多问题需要解决。

(1)不同职能部门使用信息系统时会形成大量数据,在缺乏数据交互机制的情况下,某一环节的数据变动不能及时反馈给其他环节,导致了十分严重的滞后性问题,也产生了大量冗余数据。

(2)现有的各类业务信息系统缺乏集成化,无法实现数据集中共享和管理,只能局限于数据管理、维护等基本操作层面,产生了十分突出的“信息孤岛”问题,未能构建起完整的信息系统,无法实现数据资源的合理共享与高效利用。

(3)各应用系统在设计开发时缺乏统一技术标准,难以保证数据的规范性与标准化,加大了数据分析和处理的难度。

(4)缺少符合高职校发展现状的数据管理系统。这就使得高职校所特有的大数据平台的开发与设计工作成为信息技术领域的热点研究课题。

1.2 数据标准的建立

图1:校务大数据分析与决策平台架构

为了打破“信息孤岛”,实现数据信息的高度共享,首先需要制定统一规范和标准,确保数据传递效率,学院网络中心对全学校已有的信息系统开展了深入细致的调研工作,建立大数据平台,准备实现源头数据汇集到学校大数据平台,形成三大基础信息。包括教学管理信息标准、借阅管理信息标准集、校园一卡通信息标准集等,然后综合考虑高职院校数据信息的具体特征与国家信息化工作的技术标准,制定本校《信息化数据标准》,具体从校外标准、校内标准两个维度出发对数据进行集中管理。其中,校外标准包括国家标准代码子集、教育部标准子集、高教行业标准子集。校内标准则包括学生管理数据、教学管理、教职工管理、科研管理、资产管理、行政管理、财务管理等相应的数据子集。这些数据标准为高职校大数据平台建设奠定了良好基础,充分保证了数据交互、共享的效率水平与质量水平,也为数据标准化管理创造了有利条件。此外,还需要考虑到各信息系统运行过程中所存在的数据变化问题,制定必要的更新优化策略及时进行调整确保数据可靠性。

1.3 数据的治理基本流程

依据高等职业院校的数据标准,制定数据采集计划对学校相关数据信息开展采集工作,确保数据源头与大数据平台的关联性实现同步更新。在具体工作中,需要根据信息系统的具体特征制定差异性的同步更新策略。数据信息的管理流程大致上包含三个阶段:首先是收集各信息系统分散存储的各类数据信息。其次是针对这些数据可使用ODI、Kettle 等软件工具对各信息系统的原始数据进行筛选和提取,将其作为中心数据库的信息来源,然后开展质量分析明确数据库的数据质量,根据质量分析结果对数据预处理工作的必要性进行判断。最后,在完成必要性的数据预处理工作的基础上,于数据中心内形成国家标准集、行业标准集和校内标准子集。在对各信息系统数据信息进行预处理和提取的基础上充实中心数据库,以标准化数据的形式进行集中管理,然后由各信息系统根据需要对中心数据库数据进行调用,实现数据信息的高度共享和高效交互。以上策略能够打破不同信息系统之间的数据隔阂,形成了一条条“数据流”,进而为大数据挖掘、分析工作提供有力支持。

1.4 校务大数据精准服务平台的建立

作为一个开源性的软件工具,Hadoop 具备海量数据分析和处理能力,最核心的设计是 HDFS 和 MapReduce。HDFS 为大规模、复杂数据提供了一个高效、可靠的管理工具,处理非结构化的数据,MapReduce 自动实现分布式并行计算,其功能的科学整合使 Hadoop 充分满足海量数据的高效管理需求。从图1 可以看出,校务信息管理系统的技术基础为大数据平台的标准数据子集,能够对高职校现有的数据资源进行高效整合,构建起以教务、教师、学生等为主体的数据信息库,然后使用ETL 工具,确保数据信息的标准化、集中管理与高效交互,在实现数据安全的同时具备数据资源的高度共享与高效交互优势。此外,Flume 软件还能够对异构数据进行处理,将其转换为标准化数据为数据挖掘和分析提供有力支持,并且能够在分析评估用户网络行为的基础上形成了一个综合大数据分析平台。在结合Hadoop 数据分析处理优势的基础上为系统数据分析提供更加充分、更加可靠的数据信息,从而提高决策水平。

1.5 学生数据标签体系建立

在大数据分析学生行为中,标签体系的建立尤其重要。从其概念来看,标签属于基于特定定义标准的一系列精炼、准确的标识,表现出独特的特征。标签化作为用户定性画像的关键要素,能够降低用户画像解读的难度,又方便计集机分析和程序化处理。标签化之后,首先,计算机可以自动完成分类统计功能。例如从多角度刻画学生画像、为各项管理工作提供信息支持。此外,学生数据信息也可以进行标签化处理,使其成为学生的唯一信息化标识。具体标签内容包括:一是基本数据,即学生的个人信息;二是学业数据,即学生的选课情况、考试成绩、阅览信息、网课进度信息等内容;三是生活数据,即以校园一卡通为工具完成的各类消费支付行为;四是社交数据,即学生电脑连入互联网之后的使用记录。在此基础上可对相关数据进行挖掘和分析,创建相应的标签,为各项数据信息的管理创造便利条件。在事实标签的基本上,可以通过预测标签对学生潜在需求进行分析,明确其需求内容为学校服务提供科学依据。

1.6 学生群体行为画像构建和分析

在完成标签设计开发工作之后,基本上都需对数据进行必要的挖掘与分析处理。借助聚类分析、回归分析等方法工具,可对标签信息进行提取与整合并以群体画像(如院系画像、专业画像)的形式进行结果输出。学生标签的复杂性决定了聚类分析的困难性,往往需要对多个标签进行分析和整合才能获得一种相对可靠的分析结果。在具体分析处理过程中,需要明确不同标签的权重,根据其权重设计聚类分析的规则和方法,而归一化处理则是聚类分析之前的一项重要工作。之后是学生画像聚类分析,主要工作任务是对学生行为的相似度进行界定,并对相似度较高(满足阈值条件)的行为作为同类行为,同类行为之间的差异相对较小,而不同类行为之间的差异则相对显著。聚类分析能够明确不同行为画像所含信息的相似水平,从中提取相似度较高的行为构建起聚类子集,从而明确共性特征为学生管理提供准确依据。代表性的聚类分析方法有K-Means 算法,该工具能够高效、准确的分析和描述学生共性行为特征,并可在分析学生行为画像的基础上开展学习成绩、上课考勤等监督管理工作,实现学生行为的动态监控,能够更好的发现学生问题并采取科学的应对策略,进一步提升学生管理水平确保教学质量。

2 校务大数据平台精准服务管理水平场景

2.1 促进学生个体自我认知与发展的完善

学生在自我认知方面往往表现出显著的主观,感性特征,这就将导致学生自身发展与管理工作的不确定性。大数据技术的应用将实现学生复杂数据信息的分析功能,以学生画像的形式对其行为特征进行描述,从而提高学生对自身的科学认知水平,明确自身发展方向和需求,能够根据具体情况及时调整自身状态实现科学成长。

2.2 为师生提供精准化、个性化服务

基于学生画像结果可开展精准管理,明确学生潜在需求并提供相应服务,以此保证学生管理工作的质量水平和效率水平,提高学生对学校管理与服务的满意度,为学校管理工作的开展奠定良好基础。

基于校务数据的学生标签能够对学生的行为习惯、潜在需求、发展趋势进行分析和预测,从而为学生工作提供更加准确的依据,便于教师、学校对学生开展针对性的管理,实现管理与服务的精准转型,发挥大数据技术的优势作用切实有效的提升高职院校管理水平。

2.3 为学校宏观决策与管理奠定基础

学生标签的绘制能够为信息化管理工作提供可靠依据,从而提升学校管理决策的科学水平。学生画像能够直观、准确的展示学生在生活、学习等领域的规律和特征,能够为学校管理工作提供更加准确的依据,便于学校、教师开展相应的管理与服务工作,满足学生需求并改善其学习、生活环境,从面提高整体学生成绩,对招生数据的分析能够从中挖掘出优质生源,明确学校招生工作的重点提高其管理资源综合利用水平。

基于校务数据的数据分析处理工作,能够实现对学生的精准画像、为学校精准管理和服务提供可靠依据,充分保证学生的科学成长。与传统管理机制相比,基于大数据技术的信息管理系统能够进一步提升学校管理的精准性和效率水平,从而极大提升高职院校综合建设水平,实现高职院校科学发展。

猜你喜欢

画像信息系统标签
威猛的画像
企业信息系统安全防护
“00后”画像
画像
无惧标签 Alfa Romeo Giulia 200HP
基于区块链的通航维护信息系统研究
不害怕撕掉标签的人,都活出了真正的漂亮
信息系统审计中计算机审计的应用
基于SG-I6000的信息系统运检自动化诊断实践
标签化伤害了谁