APP下载

高校数据共享中心设计与研究

2020-04-10刘萍张蕊赵文广

现代信息科技 2020年1期
关键词:数据共享智慧校园信息化

刘萍 张蕊 赵文广

摘  要:随着信息技术的发展,高校信息资源和应用系统建设不断丰富和完善,但也累积了众多数据孤岛,打破数据间的使用壁垒,建设一条信息高速公路势在必行。文章对高校信息化数据资源管理现状进行了分析,对数据共享中心构建的整体思路和解决方案、相关核心关键技术进行了研究,提出了数据共享中心在高校的应用模式,从而对数据孤岛在智慧校园中的应用提出积极建议。

关键词:数据共享;智慧校园;信息化

中图分类号:TP311.1      文獻标识码:A 文章编号:2096-4706(2020)01-0104-03

Abstract:With the development of information technology,the construction of information resources and application systems in colleges and universities is constantly enriched and improved. However,a large number of data islands have been accumulated,breaking the barriers between the use of data,and it is imperative to build an information superhighway. This paper analyzes the current situation of information-based data resource management in colleges and universities,studies the overall idea and solution of data sharing center construction,and relevant key technologies,and puts forward the application mode of data sharing center in colleges and universities,so as to put forward positive suggestions for the application of data island in smart campus.

Keywords:data sharing;smart campus;informatization

0  引  言

中国人民大学从2004年开始建设数字校园,在过去十数年的建设过程中,学校的信息化建设和管理水平得到显著提升,基于校园网的信息资源和应用系统建设不断丰富和完善,初步探索出了一条具有人大特色的教育信息化发展之路。

随着信息技术的演进和师生需求的不断变化,学校信息化工作的定位也逐步从数字校园升级为智慧校园,为了体现信息化建设理念与文化的更新,在2012年,我校启动“数字人大”三期建设工作,正式将“数字人大”更名为新一代的“微人大”智慧校园平台,对信息系统的格局进行了横向的重新界定,通过对各个业务系统的重新梳理,抽象和提取通用功能,将“数字人大”的应用群和其他第三方应用群融入其中,形成立体化的智慧校园平台。同时,尝试使用统一的框架体系和服务标准,力图通过数据共享中心建设,解决系统间的功能互访和业务集成等问题,推进新老系统的协同演进。

1  高校信息化数据资源管理现状

如何利用信息技术有效推动教学和科研模式的变革,已经成为学校信息化建设工作亟待研究的课题,对学校数据资源管理而言,存在管理数据分散、教育资源分散的现状。

1.1  管理数据分散

目前学校的各个管理机构掌握着各自业务领域的数据,虽然有些学校信息技术部门面向全校各业务系统建设了全局数据库,但这并不是实质意义上的数据中心。因为这些全局数据库是建立在同一个Oracle数据库实例下的不同表空间,数据共享完全依靠视图来解决。

随着学校教育体制改革的快速推进,以及教职工和学生对于管理公共服务要求的持续提高,跨部门之间的协同办公对管理信息共享提出了迫切要求。新的需求要求各业务部门不断地更新自己原有的业务系统,但传统全局数据库模式由于安全性、开放性等问题,已不能满足学校建设数据中心及大数据分析系统的需求。

1.2  教育资源分散

自2012年MOOC等网上学习平台在国内兴起以来,高校普遍认识到,信息技术已经成为实现教学模式改革、提升学生学习自主性的重要手段,因此竞相探索搭建适合本校特点的网上教学和科研平台的方式,并把教学信息化和科研信息化建设提升到了战略重要地位。但是,正如数据是管理信息化建设的根本,资源是教学信息化和科研信息化建设的根本,没有资源的共建共享,就无法显现网上学习平台对教学模式改革、提升教学质量的重要支撑作用。

学校各管理机构不同程度地产生和积累了大量教育资源,例如党校培训课程、党校考试考卷、干部培训课程、教职工资格考试试题、教职工业务培训课程、消防安全教育课程、教职工和学生活动照片和音频视频,以及学校的宣传片和宣传手册等。这些资源均分散在各自负责的部门或单位中,已经在全校范围内形成了大小不等的几十个“资源孤岛”,这在一定程度上制约了学校应用信息技术实现教学模式改革的发展步伐,也不利于学校整体提升所有教学单位的教学水平和教学质量,以及教职工的业务和技术水平。

2  高校数据共享中心设计

2.1  重新梳理学校现有的数据标准

遵循教育部2012年最新颁布的《教育管理信息高等学校管理信息》建设数据标准,对于没有国家标准和行业标准的字段,参照省/市代码标准规范。对于既没有国家、又没有省级行业标准的数据字段,建设学校信息标准。

2.2  构建学校共享数据库

建立学校管理服务全局数据库,实现对人事、资产、学生、教学科研等信息数据以及感知数据的集中保存、开放共享。全局数据库数据的存储分为:数据缓冲区、基础数据库和数据仓库。这样的架构设计更能保证数据的安全和分布式存放需求。

2.3  共享数据库视图建设

视图在数据库管理中举足轻重。用视图可以表示来自不同源的数据,可以用一种不同于数据存储在基表中的形式来表示数据,也可以通过隐藏基表的实际结构来简化数据的表示方式,只显示基表的一个限制子集给用户。用视图管理共享数据库,方便、简单、安全,逻辑数据具有独立性,访问的数据仅可查询,不能修改,不会影响正式表的数据。

2.4  建设数据接口管理系统

数据接口管理主要是利用数据集成交换工具对各类数据源中的数据进行定时的数据抽取,基于信息标准进行相应的数据格式转换,根据业务规则和约束借助数据质量检测工具进行数据清洗,最终完成数据从数据源向共享数据库装载的全过程的管理,并利用数据接口管理,完成学校现有业务系统的应用集成,实现数据集成过程的高效管理。

2.5  建设数据校验系统

数据校验包括质量检测规则设定、规则执行引擎、数据质量报告、报告推送功能。规则设定是数据校验的核心,建设较为全面的数据检测规则库,并提供图形化的规则设定和管理功能;规则执行引擎可以定时批量执行检测规则,及时发现数据质量问题,系统可以自动形成数据质量报告,推送给业务系统管理人员,有助于及时纠正问题数据。

3  数据共享中心总体架构

结合高校的实际情况,高校数据共享中心分为四个层次,从下往上分别是数据源层、数据交换层、数据治理层和数据服务层,如图1所示。

数据源层是各个业务系统的数据库,这个层次主要使用各类DBMS进行管理。

数据交换层是将业务系统数据集中到数据共享缓冲区、数据标准区和数据仓库区的中间层次,这个层次主要根据业务系统和数据需求的状况采用实时视图交换和定时ETL交换数据。

数据治理层含有一个数据共享缓冲区对外提供共享数据视图服务和授权管理;一个数据标准区用于管理数据标准,进行数据治理,形成高质量的标准数据;一个数据仓库区用于保存随时间变化的、集成的、面向主题的数据,并提供各种分析工具,进行决策支持。

数据服务层是对外提供数据服务的层次,这个层次采用数据视图方式和数据接口方式对外提供数据服务。主要包含数据服务申请的流程审批管理,数据视图的管理发布以及数据接口的管理发布等。

3.1  数据源层

数据源层的数据主要来自学校各业务部门建设的业务系统。因此,在进行共享数据中心建设的过程中,需要数据中心建设方、学校信息技术部门以及业务部门,按照教育部的数据标准,确定各个信息子集数据表的数据来源,以及每项数据的负责部门和负责人。在后面的数据服务申请流程中,数据的负责部门和负责人将对使用数据的请求申请进行审批。

确定数据中心每个数据表的数据来源后,建设方将根据业务系统的数据状况,开发并绑定数据抓取SQL,然后在数据标准区生成相应的数据标准视图。

3.2  数据交换层

数据交换层主要由实时视图交换和定时ETL交换两部分组成。

3.2.1  实时视图交换

如果业务系统的数据库在统一的全局数据库中,就采用视图方式进行数据交换。在同一个实例中以视图的形式进行数据交换,不仅能灵活地进行数据定制,而且可以保证数据的实时性。但由于历史原因,造成视图管理困难、数据交换呈现网状结构、耦合度过高等问题。通过重新规划建设实时视图数据交换层,可以达到对共享视图的灵活管理,变网状结构为星状结构,实现数据解耦的目的。

3.2.2  定时ETL交换

如果业务系统的数据库不在统一的全局数据库中,或存在一些非结构化的数据,就采用定时ETL的方式进行数据交换。

3.3  数据治理层

数据治理层是数据中心进行共享数据管理、数据标准控制、数据质量管理的层次,主要分成三个部分:数据共享缓冲区、数据标准区和数据仓库区。

3.3.1  数据共享缓冲区

数据共享缓冲区是数据库的一个共享区域,所有的共享视图都建设在这个区域,这个区域的共享视图管理主要通过数据服务层的共享视图发布管理工具进行操作。

尽量保证共享视图的数据源来自于数据标准区的视图,如果数据标准区没有相关数据,则可以考虑扩展数据标准区的标准定义,如果无法扩展标准,则由视图生成工具在数据共享缓冲区生成直接访问业务系统数据源的共享视图。

数据共享缓冲区是对外提供视图访问服务的唯一区域,在这个区域对由数据服务请求的目标用户进行授权。

3.3.2  数据标准区

数据标准区由一组按照教育部2012《教育管理信息高等学校管理信息》标准定义的视图组成,这组视图根据所属子集的不同,分别分散到不同的数据库用户下面。数据标准在项目建设中,需要完成标准梳理,确定数据源,进行数据集成的工作。

3.3.3  数据仓库区

数据仓库区是一个面向主题的、集成的、随时间变化的、相对稳定的数据集合,用于支持管理决策。通过数据仓库的建立,职能部门可对现有系统的数据进行有效的集成并加以重组,建立面向联机分析处理的系统,以满足学校对数据准确掌握、统计分析上报的需求,并为数据挖掘和决策支持提供基础数据。

数据仓库区需要建设方参考教育部2012《教育管理信息高等學校管理信息》标准的子集进行构建,在系统部署时进行相关数据模型创建、主题生成和相关数据集成,同时需要提供相关的管理工具。

3.4  数据服务层

任何业务系统如果需要从数据中心获取共享数据,都需要通过数据中心的数据服务层。数据服务层主要由两个部分组成:数据视图服务和数据接口服务。

3.4.1  数据视图服务

数据视图服务是通过使用视图发布管理工具,针对通过流程审批的数据需求,进行数据选取、加工处理、视图生成、视图授权,进而得到数据需求方可以访问的数据视图。

3.4.2  数据接口服务

数据接口服务是通过接口发布管理工具,针对通过流程审批的数据需求,进行数据选取、加工处理、接口生成、接口发布,进而得到数据需求方可以访问的数据接口。

4  结  论

通过数据共享中心的建设,可以对学校多年信息化发展形成的数据进行整合,重新梳理学校现有的数据标准、构建学校共享数据库,保证数据的安全和分布式存放需求。而在数据共享中心的建设过程中,如何制定数据校验规则,让系统及时发现数据质量问题并推送给业务系统管理人员,从而及时纠正问题数据还需要进一步探索和研究。

参考文献:

[1] 唐连章,卫建安,杨玉宝.ESB在数字化校园共享数据中心建设中的应用 [J].广州大学学报(自然科学版),2011,10(1):70-75.

[2] 俞春,袁芳,刘乃嘉,等.高校数据共享与交换技术的应用研究 [J].实验技术与管理,2012,29(11):109-112.

[3] 罗雅过,赵宁社.高校数字化校园数据中心平台的研究与设计 [J].计算机技术与发展,2014,24(9):217-221.

作者简介:刘萍(1975-),女,汉族,福建莆田人,副高级工程师,硕士研究生,研究方向:数据挖掘、智慧校园、教育信息化。

猜你喜欢

数据共享智慧校园信息化
月“睹”教育信息化
月“睹”教育信息化
月“睹”教育信息化
“一核三轴”:信息化时代教学管理模式的探索
科学大数据的发展态势及建议
数字化迎新系统宿舍分配模块的设计与实现
基于B/S结构的学生公寓管理信息系统的设计与实现
“智慧校园”浪潮下大学课堂教学改革与设计
智慧校园关键技术分析与研究
贵州大数据产业发展战略理解和实施建议