APP下载

教育大数据标准体系研究

2020-03-31饶景阳

开放教育研究 2020年2期
关键词:框架规范标准

吴 砥 饶景阳 吴 晨

[1. 华中师范大学 教育部教育信息化战略研究基地(华中),武汉 430079;2. 华中师范大学 湖北教育信息化发展研究中心,武汉 430079;3. 华中师范大学 国家数字化学习工程技术研究中心,武汉 430079]

教育大数据作为大数据技术在教育领域深度融合应用的产物,具有体量大(Volume)、类型多(Variety)(Beyer,2011)、处理快(Velocity)的传统 “3V”特性,以及得益于成熟教育管理体制和教育领域高准入门槛所独具的数据高真实性(Veracity)(Goes, 2014)和高价值性(Value)的新型“2V”特性。作为教育创新的重要推手,教育大数据有助于实现教学过程分析支撑下的差异化教学、个性化学习、精准化管理、精细化科研和过程化评价,对于实现真正意义的因材施教,提高教育研究和决策水平具有重要作用。然而,教育大数据支撑下的新型教学模式的多元化发展,使得教育主客体关系、教育过程和教育数据结构更复杂,教育系统数据互通低效、协同困难和拓展受限等诸多问题亟待解决。教育大数据的标准化对于解决上述问题具有基础性和引领性作用,对于规范教育信息化产业发展也具有现实意义。《教育信息化2.0行动计划》明确要求“发布系列技术和功能标准规范,探索资源共享新机制,提升数字教育资源服务供给能力”“完善教育数据标准规范,促进政务数据分级分层有效共享”。因此,教育大数据标准体系的研制将进一步丰富各类教学模式中可采集教育数据的维度和种类,规范教育数据模型构建,打破教育平台数据交换壁垒,加速数据共建共享,为推进我国教育大数据的标准化提供框架参考和内容规范。

一、 教育大数据相关政策

(一) 国外教育大数据相关政策

世界各国都非常重视大数据技术在教育领域的应用,积极引导大数据技术与教育领域的深度融合,出台了一批具有影响力的教育大数据政策和规划。美国的教育大数据技术研究、标准建设、系统开发和实践应用等处于领先地位。2012年10月,美国政府发布《通过教育数据挖掘和学习分析促进教与学》①报告,明确教育大数据的价值在于实现个性化教学和提升教育研究与决策水平,并基于教育数据挖掘与学习分析的典型案例提出实施建议,指导教育大数据驱动下的教学系统变革。2016年5月,美国政府发布《联邦大数据研发战略计划》,提出构建数据驱动的战略体系,为教育大数据的发展提供顶层规划。欧洲和亚太地区的发达国家也积极建设教育大数据研究机构,发布了一系列相关政策。例如,2012年4月,英国成立全球首个开放式数据研究所(The Open Data Institute, 简称ODI);同年10月,英国发布《把握数据带来的机遇:英国数据能力战略》②,对英国数据能力进行系统研究,提出通过教育大数据优化课程和专业研究,助力高技术人才队伍建设。2014年,德国在柏林和德累斯顿成立两大数据研究中心,为教育大数据挖掘和信息安全提供技术支持。2015年8月,新加坡发布《2025年资讯通信媒体发展蓝图》③,提出基于大数据及学习分析技术推进教育教学改革的发展目标。

(二) 我国教育大数据相关政策

我国政府高度重视教育大数据发展。2015年8月,国务院印发《促进大数据发展行动纲要》,明确指出“完善教育管理公共服务平台,推动教育基础数据的伴随式收集和全国互通共享”。2016年6月,教育部发布的《教育信息化“十三五”规划》强调,要积极发挥教育大数据在教育管理平台建设和学习空间等方面的重要作用,促进大数据与教育的深度融合。2017年1月,国家发展和改革委员会批复组建教育大数据应用技术国家工程实验室。2018年2月,教育部颁发的《2018年教育信息化和网络安全工作要点》明确提出,推动大数据技术在教育教学中的深入应用,提高教育大数据的收集、分析、研判能力。2018年4月,教育部发布的《教育信息化2.0行动计划》明确提出,“利用大数据技术采集、汇聚互联网上丰富的教学、科研、文化资源,为各级各类学校和全体学习者提供海量、适切的学习资源服务”“全面提高利用大数据支撑保障教育管理、决策和公共服务的能力,实现教育政务信息系统全面整合和政务信息资源开放共享”。在政策引导下,我国教育大数据产业迅速发展。2018年9月,工业和信息化部信息化和软件服务业司公示“2018年大数据产业发展试点示范项目名单”,涵盖面向智慧教育的大数据分析平台建设与应用、江西省高考“选志愿”平台等多项教育大数据相关的试点项目。2018年底,我国建成国家政府数据统一开放平台,推动包括教育基础数据的科学共享与开放。我国互联网企业也争相布局教育大数据产业,为教育场景打造了丰富的产品线,包括百度教育大脑3.0、K12云端一体教育大数据解决方案等,助力教育大数据生态建设。

二、 教育大数据相关标准研制进展

(一) 国外教育大数据相关标准研制进展

1. ISO / IEC JTC 1 SC32 WG9标准

教育大数据相关技术规范和标准研究引起了广泛的国际关注,成为国际标准化组织及研究机构的研究热点。国际标准化组织和国际电工委员会第一联合技术委员会(ISO/IEC JTC 1)下属多个小组委员会(Sub-Committee,简称SC)参与了大数据相关工作,并围绕各自重点开展了不同角度的研究项目,例如SC24重点关注大数据可视化新方法,SC27研究解决大数据安全和隐私问题等④。

2014年11月,JTC 1下属数据管理与交换标准化小组委员会(SC32-Data Management and Interchange)成立第九工作组(WG9),致力于大数据基础性国际标准研究(光亮等,2017)。截至2019年10月,JTC 1汇聚了16个参与国以及25个观察国⑤,制定了包括定义大数据基本概念和重要术语的大数据概述和术语标准(ISO/IEC 20546),以及包括用户视图和功能视图的大数据参考架构标准(ISO/IEC 20547-3),其大数据分析框架如图 1所示⑥,为教育大数据的标准化工作提供了重要参考。

图1 ISO/IEC JTC1/SC32/WG9工作组大数据分析框架

2. 国际电信联盟ITU-T Y.3600标准

国际电信联盟(International Telecommunication Union, 简称ITU)⑦2013年11月发布的关于大数据的技术报告⑧,重点关注高吞吐量、低延迟、安全、灵活和可扩展的网络基础设施、聚合数据集与匿名化、网络数据分析、纵向平台互操作、多媒体分析和开放数据等。在ITU范围内,大数据标准主要由ITU电信标准化部门(ITU-T)发起和推进,有10个相关研究组。其中,最活跃的是第13学习研究组(Study Group 13),其研究主题聚焦包含移动和下一代网络(NGN)在内的未来网络。2015年11月,ITU-T发布《大数据——基于云计算的需求与能力标准》(ITU-T Y.3600),详细规定了以云计算为基础的大数据要求、能力和使用案例,并设计了大数据情境模式(见图2)⑨。

图2 ITU-T Y.3600标准的大数据情境模式

2018年5月,ITU-T学习研究组SG13发布《大数据——数据交换的框架和要求》标准(ITU-T Y.3601)⑩,基于交换数据源与数据目的之间多种不同类型和格式的数据,描述大数据生态系统的数据交换框架。此外,SG13还在研制《大数据——数据集成的概述和功能需求》和《大数据——元数据框架与概念模型》等大数据相关标准。除了SG13,关注多媒体编码、系统和应用的ITU-T SG16 发布了《公共数据传输业务的服务和操作原则》(ITU-T F.600),并在2018年7月召开的全会上立项了《数据资产管理框架》(ITU-T F.FDAM)和《大数据基础设施评测框架》(ITU-T F.AFBDI)。该标准主要定义了数据资产的基本概念,提出了数据资产管理和大数据基础设施评测框架。同时,关注通信安全的ITU-T SG17发布了包括《移动互联网服务中的大数据分析安全要求和框架》在内的多个大数据安全国际标准。

3. NBD-PWG 大数据互操作性框架标准

美国国家标准及技术研究所(National Institute of Standards and Technology, 简称NIST)为响应美国白宫提出的大数据研究国家战略,同时为满足市场需求,于2013年6月成立大数据工作组(NIST Big Data Public Working Group, 简称NBD-PWG)。NBD-PWG的重点是联合工业界、学术界和政府,形成大数据的定义、术语、安全参考体系结构和技术路线图,NIST大数据参考框架如图3所示。

图3 NIST大数据参考框架

NBD-PWG具体分为5个子工作组,包括用户案例和需求组、定义和索引组、参考框架组、数据安全和隐私组以及技术路线组。NBD-PWG的主要成果是形成了基于共识的可扩展大数据互操作性框架(NIST Big Data Interoperability Framework, 简称NBDIF),该框架分三个层次:一是大数据参考架构关键组件层,内容包括大数据定义、大数据分类法、大数据安全和隐私要求、大数据架构白皮书调查、大数据参考架构、大数据安全和隐私参考架构等;二是大数据参考框架组件之间的通用接口层;三是利用通用接口,构建验证大数据参考框架的应用层。

(二) 我国教育大数据相关标准研制进展

在通用大数据标准研制方面,我国一方面积极参与国际标准组织关于ISO/IEC 20546《大数据——概述和术语》和ISO/IEC 20547-3《大数据参考架构——第三部分:参考架构》两项大数据标准的研制工作。另一方面,我国于2014年成立全国信息技术标准化技术委员会大数据标准工作组,开展包括《信息技术大数据技术参考模型》《信息技术大数据术语》等在内的十多项国家大数据相关技术标准的研制。

在教育大数据标准研制方面,全国信息技术标准化技术委员会教育技术分技术委员会(China E-Learning Technology Standardization Committee, 简称CELTSC)于2017年成立教育大数据标准工作组,推进教育大数据标准的研制,目前已有包括《教育大数据标准框架》《教育大数据接口服务规范》《教育行为数据框架、模型与元数据》《教育大数据存储服务规范》《课堂教学行为编码规范》《学习者画像》《教师画像》《学校画像》等在内的13项教育大数据标准在研项目。

总体而言,国内外教育大数据相关标准的研制各有侧重、相对独立,均围绕特定研究对象和研究目标展开,标准技术属性强而教育属性偏弱。随着信息技术与教育的深度融合,教育大数据应用场景不断丰富,教育物联网环境下教育数据采集手段不断增强,亟待重构对教育大数据标准体系的宏观认识和顶层设计。

三、 教育大数据标准体系设计

(一) 教育大数据标准体系建设需求分析

1. 国家教育信息化发展战略需要

我国政府近年出台了一系列教育大数据标准化相关政策文件,引领教育数据共建共享。2018年4月,教育部发布的《教育信息化2.0行动计划》明确要求,规范教育资源数据和教育管理数据的数据采集和挖掘流程。2018年11月,教育部印发的《关于完善教育标准化工作的指导意见》明确提出,研制教育信息化数据标准,支撑我国教育现代化事业高质量发展。因此,教育大数据标准体系建设具有明确的国家教育信息化发展战略需求和政策导向,契合了我国教育现代化发展的总体战略目标。

2. 教育大数据平台建设技术需要

信息化教学模式的多元化发展,使得教育过程中主客体关系复杂、数据结构多样,为教育大数据平台信息的规范管理带来了诸多不便。教育大数据平台信息管理涉及教育过程数据采集、清洗、存储、处理、建模、分析等众多关键技术环节,各技术环节间相互支持、相互影响并有机结合。然而,教育数据来源的异构性、数据交互的复杂性以及数据展示的多态性等,都对教育数据的过程管理形成挑战。因此,统筹教育数据全生命周期管理的各项数据标准,统一不同技术环节间的数据交互规范和流程,形成教育大数据标准体系,是实现教育大数据平台从采集到分析应用各环节无缝联动的技术需要。

3. 教育主体智能化发展应用需要

教育主体智能化发展为教育大数据标准体系建设提出了多元化的应用需要。《中国教育现代化2035》提出“建设智能化校园,统筹建设一体化智能化教学、管理与服务平台”。基于教育大数据标准体系,教师教学、学生学习、教育管理和教育服务等过程产生的海量数据将被汇聚到智能教育平台,实现教育过程数据的伴随式收集与标准化处理,进而支持面向教师的差异化教学,面向学生的个性化学习,面向教研员和教师的协作化教研,面向教育管理者的精细化管理和面向师生、家长及社会公众的智能化服务,并有效助推教学、教研、管理和服务的过程化、精准化评价。

(二) 教育大数据标准体系框架设计

教育大数据标准体系框架定义了教育大数据标准体系的层次结构(见图4),并明确各模块及内容间的相互关系,使各项标准与规范有机结合。

图4 教育大数据标准体系框架

1. 基础类

教育大数据基础类规范定义教育大数据标准的基础性、通用性规范,以支持教育大数据标准体系其他标准的复用。其中,术语规范主要明确教育大数据标准体系涉及的术语定义、符号说明和术语解释;架构规范旨在通过对标准体系整体结构及相互引用关系的描述,提供结构化、易于管理、便于实施且可扩展的标准框架;基础接口规范旨在为教学、管理和服务平台之间业务复用提供基础接口调用与交互规则;绑定规范规定各类教育信息模型XML语言描述语法;实践指南是指导如何构建和利用教育大数据标准的指导性文件,规定了教育大数据标准体系各项标准的应用领域、使用场景和使用方法。

2. 管理类

教育大数据管理类规范包括数据管理规范、平台管理规范和过程管理规范。其中,数据管理规范规定了教育数据开放和共享的基本策略,定义开放共享数据的知识领域、敏感程度和开放权限,为数据开放程度定级和元数据结构设计提供参考;平台管理规范规定了教育大数据平台有形和无形的运营支撑环境,提高教育大数据平台运行的兼容性;过程管理规范规定了对教学活动中各重要过程节点的管理,包括定义和管理不同时空尺度的教学过程信息及教学过程间的关联关系。

3. 数据类

数据类标准是教育大数据标准体系的核心,主要包括教育教学活动的三类主要数据:资源数据、对象数据和行为数据的相关标准:

资源数据类规范定义了各类教育资源的组织方式,包括资源编列规范、资源元数据规范和资源封装规范。其中,资源编列规范规定了各类教育资源的编码规则,确保开放共享教育资源标识的唯一性,便于教育数据的大范围分发和应用;资源元数据规范规定了各类教育资源的描述方法,包括资源数据的描述规则,提高不同教育平台之间教育资源数据的语义互操作性;资源封装规范定义了各类教育资源互操作所需要的数据结构以及教育资源统一的包装规则,支持教育资源在教育平台之间的传输、复制、买卖和分发。

对象数据类规范包括教师画像、学生画像和学校画像。其中,教师画像规定了教师对象的信息模型和要素,包括教师的基本信息、教学活动组织信息、教学资源创建信息、教学效果评价信息等;学生画像规定了学生对象的信息模型和要素,包括学生的身份标识、学力定义、学习风格、学习能力、知识掌握程度、学习偏好等;学校画像规定了学校对象的信息模型和要素,包括学校的基本信息、办学条件信息、师资力量信息、学生结构信息、办学水平信息等。

行为数据类规范包括教学行为、学习行为、管理行为和教研行为等数据规范。其中,教学行为数据规范规定有效教学行为的界定方法和特征,并定义各类教学行为的信息模型和数据结构;学习行为数据规范规定学习行为要素、分类和数据模型,定义了学习行为数据记录框架;管理行为数据规范规定教育管理过程的维度和特征,并定义管理行为数据模型和数据结构;教研行为数据规范规定教研行为的行为要素和分类方法,定义教研行为的数据模型和数据结构。

4. 支撑技术类

教育大数据支撑技术类规范包括数据采集规范、数据建模规范、数据处理规范、数据存储规范、数据分析规范、数据互操作规范、数据接口规范和数据可视化规范。其中,数据采集规范规定了教育数据的采集类别、采集指标、采集频率和采集要求等信息;数据建模规范规定了各类教育数据的抽象组织结构,确定数据库中数据的组织形式等;数据处理规范规定了教育数据录入、审核、修改、提交和汇总的操作规范;数据存储规范规定了教育大数据在存储介质中的存储与交换方法,对教育大数据存储的需求及其定义方法、数据格式要求和存储实现技术等进行了标准化定义;数据分析规范规定了对复杂教育过程逐渐拆分处理的判断标准和分析范式,以实现对复杂教育过程的深入理解;数据互操作规范规定了不同教育平台之间以及不同教育环节之间数据交互操作的语法与语义;数据接口规范规定了教育平台之间业务数据传输格式,方便系统平台之间业务数据的共享与交换;数据可视化规范规定了教育数据可视化的基础图形元素和表现形式等,以及定义教育数据可视化设计语言的语法与语义。

5. 应用类

教育大数据应用类规范涵盖差异化教学、个性化学习、协作化教研、精细化管理、智能化服务和过程化评价六大类应用主题。其中,差异化教学主题类规范规定了教师将时间、精力和教学素材等资源差异化地分配给不同背景、基础、技能水平和兴趣的学生,以期促进学生成长的教学模式标准;个性化学习主题类规范规定了学生依据个体特征(如学习风格与偏好、能力水平和兴趣等)、个体需求和个体差异,开展自主学习活动的学习行为标准;协作化教研主题类规范规定了校际间协作参与教学经验总结、教学问题发现和教学方法研究的教研模式标准;精细化管理主题类规范规定了学校对教育教学各环节制定的制度、规程和评价指标的管理模式标准;智能化服务主题类规范规定了教育系统通过捕捉教育用户的访问信息,结合先验知识,构建需求模型,主动推送优质教育资源的教育服务模式标准;过程化评价主题类规范规定了教学和管理效果的过程化评价模式标准,支撑教育过程的实证分析。

6. 安全类

教育大数据安全类规范包括隐私保护规范、权利保护规范和访问控制规范。其中,隐私保护规范规定了对教育用户隐私信息和教育领域敏感数据的保护措施;权利保护规范规定了教育主体拥有获得与自身相关的全部教育信息和数据的合法权利,保护教育数据的分层分级合理利用;访问控制规范规定了教育大数据的访问控制机制,规范了教育主体对教育数据的访问控制规则。

(三) 标准引用组谱集合

标准引用组谱作为教育大数据标准体系的研制基础和重要参考,有助于细化教育大数据标准类别,促进教育大数据标准的全覆盖。教育大数据是大数据技术在教育领域的赋能应用,因此教育大数据标准体系参考和引用了大数据技术和教育信息化领域的标准和规范,其中教育信息化领域相关标准主要来自ISO/IEC JTC1 SC36、IEEE/LTSC、ADL以及我国CELTSC等标准组织的标准内容,大数据技术相关标准主要包括《大数据互操作框架》《基于云计算的大数据需求与能力标准》《信息分类编码标准的编写规定》等标准文档及白皮书。表一给出了教育大数据标准体系各类标准对应的参考和引用标准。

表一 教育大数据标准体系参考和引用标准

四、 总结和展望

教育大数据标准体系为教育大数据开发利用提供了重要支撑,为促进教育平台互联互通和实现教育数据全生命周期管理提供了基础保障。我们也应注意到,教育大数据的易获取性滋生了一系列新的信息安全和伦理问题,加强教育大数据的隐私保护迫在眉睫,加快教育大数据安全类标准的制定将是教育大数据持续发展的重要保障。同时,教育大数据相关标准的研制离不开企业、教育机构和科研机构等多方的支持和参与,基于专业化分工的标准协作编制将成为未来标准研制的主流模式。目前,教育大数据标准工作组已经在CELTSC框架内成立,其对外衔接国际标准组织,对内适应国家标准建设需求的工作模式已经形成,将为我国教育大数据标准的深入研究和广泛应用提供重要支撑。

[注释]

① Office of educational technology. Enhancing teaching and learning through educational data mining and learning analytics. [EB/OL] (2014-03) [2018-08-28]. https://tech.ed.gov/learning-analytics/.

② Seizing the data opportunity: as trategy for UK data capability. [2020-1-18].https://www.gov.uk/government/uploads/system/uploads/attachment_data/file/254136/bis-13-1250-strategy-for-uk-data-capability-v4.pdf.

③ Infocomn media 2025[EB/OL].[2020-1-18].https://www.mci.gov.sg/portfolios/infocomm-media/infocomm-media-2025.

④ ISO/IEC JTC1 inforamiton technology. Big data preliminary report 2014 https://www.iso.org/files/live/sites/isoorg/files/developing_standards/docs/en/big_data_report-jtc1.pdf.

⑤ ISO/IEC JTC 1/SC 32 PARTICIPATION [EB/OL]. [2020-2-10] https://www.iso.org/committee/45342.html?view=participation.

⑥ Standard big data architecture and infrastructure.http://www.picasso-project.eu/wp-content/uploads/2016/05/BDEG_Wo-Chang.pdf.

⑦ About international telecommunication union (ITU) .https://www.itu.int/en/about/Pages/default.aspx.

⑧ Big Data: Big today, normal tomorrow. ITU-T Technology Watch Report https://www.itu.int/dms_pub/itu-t/oth/23/01/T23010000220001PDFE.pdf.

⑨ ITU-T Recommendations. Big data-Cloud computing based requirements and capabilities. https://www.itu.int/ITU-T/recommendations/rec.aspx?rec=12584&lang=en.

⑩ Committed to connecting the world .ITU-T Recommendations .https://www.itu.int/itu-t/recommendations/rec.aspxrec=13469&lang=zh.

猜你喜欢

框架规范标准
2022 年3 月实施的工程建设标准
来稿规范
来稿规范
有机框架材料的后合成交换
框架
PDCA法在除颤仪规范操作中的应用
来稿规范
忠诚的标准
美还是丑?
一家之言:新标准将解决快递业“成长中的烦恼”