APP下载

基于大数据的开放教育学生画像构建研究
——以西安开放大学为例

2023-07-14杨彩霖

河北开放大学学报 2023年3期
关键词:画像西安预警

李 凯,杨彩霖

(西安开放大学, 陕西 西安 710048)

伴随信息技术的迅猛发展,以云计算、大数据技术为重要支撑的教学质量监控平台应运而生。如何利用大数据信息,对开放教育学生的学习行为进行综合分析与督导研判,全面实现对成人学生个体在学习过程中的全过程监督与服务,及时在学习进程中实现对成人学生适时的提醒和干预,切实推进学生高效率学习行为的落实,提升开放大学整体办学质量和教育教学水平有着十分重要的现实意义。

一、开放教育学生特征

当前,开放教育学生大部分以在职成人学生为主体,学习需求由原先的学历补偿已然转化为对知识、素质与技能的全面提升,他们具有明确的学习目标和学习动力。他们中的大多数已经具备丰富的实践经验和社会经验,但也面临着许多学习困难[1],直接影响到开放教育的学习质量。

1.工学矛盾严重

开放教育学生存在严重的工学矛盾,他们白天忙于本职工作,不能及时自主学习,有时因工作繁忙不能及时参加面授教学。尽管学校提供了丰富的线上学习资源,然而由于缺乏全过程的学习监督、跟踪、指导,很多学生都是在期末考试前突击完成相应学习任务,这在一定程度上降低了学习体验感和学习质量。

2.学习基础参差不齐

伴随着终身教育的开展,开放教育已经成为求学者提升自身技能与知识水平的重要途径,客观上造成开放教育学生的学习基础差异比较大。以西安开放大学为例,学生中有的是高中起点,有的是博士研究生,还有些学生因当前岗位需要,报学专业与第一学历专业存在极大跨度,一定程度上造成了同一个班级学生之间学习基础参差不齐的现状。

3.学习评价指标难以量化

开放教育学生的主要学习方式为混合式学习,即采用“面授教学”“线上学习”与“自主学习”相结合的方式。学生成绩的考核评价主要是以形成性考核(过程性作业)和终结性考核(期末考试)为主,缺乏全学习环节的过程性监督考核,且没有严密的量化标准,不能有效促进开放教育学生各阶段学习任务的预警与提醒。

二、学生画像的重要意义

学生画像也称为人群画像,是一种基于提取、分析学生用户历史数据,利用数据化、语义化的标签对学生行为特征进行刻画,实现对学生信息进行全面概括的工具。[2]

随着大数据时代的来临,以大数据为代表的信息技术,正在与教育技术深度融合,通过对教育大数据的深度挖掘,能够为学校提供精准可靠的数据支撑,助力学校服务水平精细化、学习过程可视化、教学过程智慧化的深度发展,对提升开放教育教学质量,促进学校内涵式发展,推进学科建设,服务地方经济起到重要作用。

就教师而言,通过对学生日常行为大数据的模型分析,即可精准地掌握学生学习过程与学习效果,及时开展具有针对性和差异性的教学支持服务。对开放教育学生来说,通过可视化的信息界面,直观了解到自己的学习现状和同班学习者的学习状态、平均学习差距,对因未能及时参加面授教学而造成的学习无助感和因缺乏面对面学习交流而求助于网络学习的学习孤独感能够起到很好的弥补作用。

面对海量的教育大数据,如何利用科学的方法挑选出具有“可用信息”的有效数据,进而深度挖掘其背后的丰富内涵,获得具有重要“含义”的“价值”,是构建学生画像的重要意义。

大数据下学生画像的潜在价值与应用,为教育决策、教学设计、过程监督和质量评估带来了前所未有的颠覆。教育大数据、信息技术与教育领域的融合、发展、应用正在重构当下的教育模式,重塑当前的教育生态。

三、学生画像体系构建

利用教育大数据构建学生画像为开放教育个性化的教学支持服务提供了强大的技术支撑,是推动开放教育教学改革创新化和信息化、构建教学管理智能化、教务管理个性化、学生学习精准化的重要举措[3],也是构建学校智慧化教学服务体系,广泛应用优质教育资源,提升教育教学质量的有力保障。

1.学生画像的设计思路

构建学生画像最主要的任务是利用便于理解的语义化标签或便于机器提取有效信息的短文本标签来描述用户的行为和特征,通过机器学习算法和规则挖掘分析算法提取高度精练的关键词[4-5],在此基础上,抽象出一个立体的,以真实用户群体数据为代表的虚拟画像。

通过对西安开放大学开放教育学生学习行为大数据的采集、建模和行为验证刻画出的学生画像,进一步了解该校开放教育学生的学习习惯、学习特点、成绩水平等重要特征,帮助教师及时准确掌握成人学生的学习状态和学习效果,以预警形式对存在“学业危险”的学生发出提醒,及时督导学生顺利完成学业。

设计学生画像,能够贯通西安开放大学大数据管理和应用的各个环节,通过大数据采集,建设教学质量监控平台。采用多层架构方式,将大数据处理、大数据交换与共享、基于关系型和统计型大数据存储、权限管理、大数据分析挖掘等进行有效整合并重复验证,构建出适用于多维异构环境下学校的大数据处理要求、实现海量数据高效管理的可视化平台,其核心在于对学生行为的数据挖掘。

2.学生画像的数据挖掘

数据挖掘,又称为知识发现,是指在大型数据库中对有价值的信息进行获取,实质是指从大量的无规则、有杂质的数据中提取出具有“价值信息”的过程。[6]主要工作是通过对杂乱无章的数据,建模找到数据和行为之间的关系,通过预测将行为数据回归为真实变量。[7]

数据挖掘过程一般由数据整理、数据挖掘和结果解释与评估三个部分组成,它是将数据仓库与机器学习、数理统计、人工智能、模式识别及可视化技术等诸多领域的理论与技术相互渗透的一门交叉性学科。[8]

数据挖掘的先导是将学生行为大数据分类筛选(如图1 所示),通过对学生在日常学习过程中的行为数据采集、传输、存储,分析学生学习行为的基本属性并进行归类总结,找出其隐含的内在规律,精准定位学生的学习行为特征,实现对开放教育学生学习行为的综合评价,并对学生学习进行预测、预警和指导。

图1 数据挖掘模型

3.学生画像的维度选择

对学生画像的描绘,实质就是获得最终数据可视化的直观展现,集中反映在对学习行为大数据的筛选。以西安开放大学为例,开放教育线上学习的主要平台为国家开放大学学习网,学生的行为数据主要表现为登录次数、学习时长、学习参与情况等。经过长期的教学实践,在综合分析学生行为后,按照学校开放教育学生特点,选取线上学习活跃度、线上学习参与度、线上学习持久度、学习效果和学习预警五个维度对学生学习行为进行画像构建[9],具体如图2 所示。

图2 学生行为画像个体指标

(1)线上学习活跃度:30 分。线上学习活跃度主要关注学生线上学习的有关活动,包括学生登录国家开放大学学习网的相关行为记录数据,如登录日期、登录次数、行为次数等,进行实时动态呈现与分析。

(2)线上学习参与度:30 分。线上学习参与度主要关注学生在国家开放大学学习网上的各类活动情况,参与课程教学讨论的发帖数、回帖数,参与各种线上直播课程的登录情况。

(3)线上学习持久度:15 分。线上学习持久度主要是考核学生在国家开放大学学习网上进行学习的时长,查看各项课程教学辅导资源,观看各章节教学视频、参与课程形成性考核作业的累计时间。

(4)学习效果:15 分。学习效果主要是学生每个学期进行注册学习的各门课程的考核情况,包括每一门课程的形成性考核作业和终结性考核的完成率、及格率等。

(5)学习预警:10 分。学习预警主要针对以上四项指标,设定阈值标准对未达到相应学习目标的学生给出分类预警,及时提醒学生按要求完成学习任务,包括行为预警、形考作业预警、终考作业预警等。

4.学生画像的数据处理

一般来说,学生行为数据散乱无序,首先需要将噪声数据进行清除,即对原始数据进行预处理,提高数据质量。目前西安开放大学现代教育技术处专门建立了相关数据统计分析系统,通过对学生线上学习行为的跟踪采集和特征选取构建专业系统数据库。

四、学生画像过程

1.学生行为数据构建分析过程

学生行为画像主要是通过学生学习行为大数据的分类、汇总建立相应特征标签,构建多维度模型,直观展示学生学习行为的主要特征。

学生画像行为数据构建分析过程是按照教育大数据各种不同层次和维度聚类划分后所表现的标签集合,是描述开放教育学生学习行为的量化指标。有别于对学生学习行为数量的单一化的累积统计,也不是对全体学生学习行为的平均化计算。学生画像代表的是单个学生在学习过程中所发生行为的特征描述。基于对学生画像的行为分析,有助于对开放教育学生学习行为的引导和规范,促进学生全过程学习的参与感和荣誉感。

2.行为画像过程

对开放教育学生的画像过程(如图3 所示)就是挖掘个体学生在学习中的行为特征,并将其标签化,通过构建语义化的标签集合,描述个体学生的学习特征,在大数据行为的基础上,发掘出行为数据与学习行为的潜在规律,对发现有异常行为的学生及时进行预警提示,确保学习质量的过程性监控,继而实现对开放教育学生学习全过程的规范化监督和指导,帮助成人学生提高学习质量,增进学习体验感。

图3 学生画像的过程

五、学生画像的应用分析

学生画像是通过各种直观的可视化图形对学生学习特征进行直观呈现的方式,学生画像对直观了解学生个人特点、学习特征以及潜在学习问题具有十分重要的意义。根据学生的日常学习行为,基于统计分析方法采用行为画像模式,构建学生画像。

学生画像不仅能够帮助学生个人及时了解自身学习情况,还可以通过学习效果展示区了解本学期所学课程的完成情况。同时,直观展示出自己的学习轨迹及在校期间参与的活动和获奖情况。通过西安开放大学智慧学习质量监控与支持服务大数据平台对学生画像的可视化展示,既能够增强学生及观察者对个体学习行为的显著性视觉感知,同时也可以为整个开放教育学生群体进行分类解析,为进一步提高学生管理工作的科学性与准确性提供客观依据。

1.应用效果

(1)学习行为预警。学生学习行为的预警主要表现为成绩预警,目的是对偏离正常学习轨道的学生及时进行提示,帮助学生更好地完成专业学习。在形成性考核和终结性考核完成前,智慧学习质量监控与支持服务大数据平台会自动根据学生的学习登录次数和完成质量情况,及时生成相应的学习报告。对潜在存在考核不合格的课程及时进行分类预警提示,通过设置一定的阈值范围,按照颜色级别,分级警示学生异常学习情况。及时提醒学生查漏补缺,帮助学生更好地完成专业学习,实现西安开放大学教育管理的精准化和个性化服务。

(2)综合分析报告。通过对开放教育学生学习行为的画像构建,西安开放大学智慧学习质量监控与支持服务大数据平台从多个维度展示了学生自身学习行为和学习特征,有助于教师对学生学习过程的统筹规划和日常管理,也有助于学生直观了解自身学习情况及与优秀学生之间的差距。分析学生个体画像,还能够综合剖析学生成绩上升、下降的原因、个体学生学习行为喜好、上网时长及流量使用趋势。借助维度筛选还能够了解特殊学生的行为特征,及时加强对该生的跟踪指导,帮助学生顺利完成学业。随着西安开放大学智慧学习质量监控与支持服务大数据平台的不断使用,学生画像学习信度也在模型的日益完善中不断提升,尽管取得了一定成绩,但也存在一些不足。

2.存在不足

西安开放大学紧密围绕学生行为大数据开展了智慧学习质量监控与支持服务大数据平台构建,通过平台建设,针对学生学习行为进行个体画像,实践应用中发现了一些不足,主要表现为:一是行为数据的共享融通存在障碍。由于开放大学平台特征,学生学习行为数据主要来自于国家开放大学学习网和西安开放大学选修课云平台,因两学习平台暂不兼容,数据融通存在障碍容易形成数据孤岛。二是数据标准存在差异。不同学校在数据标准选择时,会根据各自学校特点进行权重倾斜,因此同一平台难以做到所有数据的标准统一。三是数据挖掘深度不够。大数据的海量特征,使数据的深度挖掘成为难题,在西安开放大学智慧学习质量监控与支持服务大数据平台建设中,受技术影响还未能完全做到对学生行为大数据的深度挖掘和分析。四是数据安全存在风险。网络信息安全涉及每一位公民的隐私,如何保护教育大数据的数据安全,目前还没有专门的法律法规,保护不当可能会引发一系列教育伦理问题。

3.解决措施

针对以上不足,西安开放大学积极努力不断探索,从以下四个方面进行响应:一是融通学习平台,针对学生行为大数据的有效融通,学校积极做出调整,将国家开放大学学习网作为唯一教学平台数据来源,同时加强与国家开放大学数字资源中心对接,便于数据采集。二是完善数据指标,不断加强数据指标体系建设,打造规范化标准,实现教育大数据的共享、统一。三是提升数据处理水平,引进专业技术人员,构建多层级、多维度分析团队,实现对潜在价值数据的深度挖掘和分析,提升教学服务管理水平。四是规范安全制度,在西安开放大学范围内建立相关制度标准,定期对专业人员进行培训,提高思想认识,保障学习数据安全。

六、结语

西安开放大学智慧学习质量监控与支持服务大数据平台的建立,目的在于帮助学生获得更好的学习体验感和参与感。将开放教育学生的自主学习转化为对学生个性化的支持服务,针对不同学习者的个性化画像特征,及时推送具有针对性、差异性的教学服务,在深度挖掘开放教育学生个性化需求的基础上,提供精准匹配的过程指导,及时干预异常学生的学习行为,实现开放教育全过程的实时化、动态化监督管理,充分利用教育大数据资源,提升学校整体管理水平。同时,为学校管理者提供相关决策依据和决策支撑,提升成人学生的学习自觉感和紧迫感,全面实现西安开放大学的高质量转型发展。

猜你喜欢

画像西安预警
威猛的画像
西安2021
Oh 西安
“00后”画像
画像
法国发布高温预警 严阵以待备战“史上最热周”
《西安人的歌》突如其来?
园林有害生物预警与可持续控制
追根溯源 回到西安
机载预警雷达对IFF 的干扰分析