APP下载

高校师生数据的主题分析

2019-11-16吴希忠

电子技术与软件工程 2019年20期
关键词:一卡通代码师生

文/吴希忠

1 现状分析

当前高校的信息化已经进入了一个全新的建设周期。“十三五”期间,全国大部分高校主要围绕IT基础设施、各类业务应用系统以及以服务为核心的校内各服务平台进行建设。随着大数据时代的来临,各高校将围绕相关维度的数据采集及其应用来开展信息化建设,需要运用综合数据分析技术、辅助决策技术等构建围绕数据分析与服务的解决方案。

华东政法大学数字化校园、统一身份认证、一站式项目已经相当完善,各部门的系统包括人事系统、教务系统、学工系统、研究生系统、科研系统、财务系统、资产系统、迎新系统、就业系统、图书系统、一卡通等已经运行多年,积累了大量的原始数据,但各部门的系统是各自独立的,系统之间没有统一的标准,相互没有联系,整个学校的数据散落在各系统中,形成了一个个“信息孤岛”。如何打破信息孤岛,使各系统的信息形成一个整体是迫在眉睫也是十分有价值的事情。

本项目将在数字化校园的基础上,制定数据标准,建立共享数据库,实现各部门之间的信息互动、共享和有效协同,并在统一的标准和共享库的基础上,根据学校需求,进行师生数据的主题分析和统计,并以更直观的图形化的方式进行展现,进一步满足学校对数据分析决策的需求。

2 总体建设目标

项目计划分一年半进行建设,首先制定出华东政法大学信息标准,建成共享库,其次维护并完善各部门数据,提高共享库数据的规范性、正确性和完整性,最后运用决策分析工具,以直观图表的方式把师生各维度的统计分析结果展现出来。

3 数据集成和共享数据库的建设

在进行数据分析之前,为了保证数据质量,需要制订学校的信息标准;为了数据查询统计提供数据源,需要将未集成的业务系统集成到公共数据平台;之后按照制定的数据标准,对数据进行清洗,并同步到共享库中,为后续的数据分析夯实基础。

3.1 制订并完善信息标准

信息标准以国标、部标、行标、校标为基础,结合校内实际业务情况,充分考虑后期信息化改造需要,制订完善的信息标准,使之符合最新的技术规范和业务需求,形成信息标准文档。

3.2 数据集成和共享库建设

本项目将对人事、教务、学工、研究生、科研、财务、资产、迎新、就业、图书、一卡通等的数据进行抽取、清洗、转换和加载,将各部分业务数据同步集成到共享库中,完成数据的集成和共享交换。

3.3 数据来源说明

共享库的数据来源,均来自学校的各业务系统,对于暂无业务系统支撑的信息和业务部门认为不适合共享的信息目前暂不集成和处理;数据平台建成后,为保证数据的唯一性和正确性,各业务部门应明确数据来源的管理维护责任人,以及时同步和更新到共享库平台。

3.4 数据的规范、正确和完整

以公共数据平台为核心,结合制订的信息标准,对业务数据进行分析和检查,找出数据质量隐患和存在问题,对质量不高的数据和无效数据进行清洗和优化,保证现有业务数据的高质量,为后期进行数据展现及分析应用奠定基础。针对学校现有数据的梳理,按照以下步骤来进行:

(1)结合学校现有业务系统,梳理分析学校有哪些数据,借助元数据管理工具,实现学校业务系统数据的语义清晰可查;

(2)在业务系统范围明确的情况下,梳理分析这些数据的具体流向,从哪儿来、到哪儿去,谁是数据的生产者、谁是数据的消费者;梳理的过程需要借助数据流向规划工具和IPO(输入-处理-输出)调研工具;

(3)在数据范围、数据流向明确的前提下,需要考虑代码标准如何规范统一;借助代码标准管理工具,满足代码标准的日常维护管理,并及时监测各相关业务系统的代码标准使用情况,推动标准化管理;对于国标、部标,通常集中在代码标准管理工具中进行管理;对于校标,有两种可能的管理方式。①同样集中在代码标准管理工具中进行管理、各业务系统进行使用;②分散在各自的业务系统中独立管理、集成到学校主数据代码库之后再分发到各业务系统使用。

(4)有了统一的代码标准,下一步则需要开始数据抽取、清洗、转换的工作。对于国标、部标的部分,将业务系统中存储的代码抽取到共享库中,进行语义的转换,并与代码标准进行比对,对不一致的数据进行清洗,转换,并存储;对于校标的部分,分为两类:公共部分,也就是多个业务部门都使用的数据,根据数据流向规划制定的源头,作为代码标准,并对其他与之不一致的数据进行清洗;对单个业务系统使用的数据,直接抽取到共享库中。

(5)最后一步,也是数据梳理过程中最为关键的一个环节,进行运维监控,加强数据质量监督、避免只采不监督,继而推进业务系统提高源头数据质量。

4 师生数据平台

4.1 师生个人数据平台

师生个人数据平台包括数据整合和数据展现:

4.1.1 数据整合

将校内与学生、教师相关的数据进行整合。数据平台目前拟整合的数据包括:师生基本信息、学生类其他信息(招生信息、培训信息、专业信息、培养计划/培养方案、课程信息、学籍异动信息、成绩信息、等级考试信息、奖惩助贷信息、保险理赔信息、贷款还款信息、宿舍信息、就业信息、一卡通消费信息、财务信息)、教师类其他信息(国内外学习进修信息、奖惩信息、变迁离校信息、离退休信息、返聘信息、科研项目经费信息、教务教学信息、财务工资信息、一卡通信息)、图书借阅信息、资产信息、师生健康状况信息、校友基本信息、校友捐赠及活动信息。

4.1.2 数据展现

当用户登录系统后,系统自动根据用户权限,将用户的相关个人数据以表格的形式展现出来。

(1)学生个人数据平台。学生个人数据平台,可以查看学生个人的基本信息、学籍信息、成绩信息、奖惩助贷信息、异动信息、一卡通消费信息、财务信息等。

(2)教师个人数据平台。教师个人数据平台,可以查看教师个人的基本信息、学习进修信息、奖惩信息、科研信息、教务教学信息、财务信息、资产信息、一卡通信息等。

4.2 师生数据平台查询

本功能提供给部门领导、学院领导或校领导查询使用,可以看到权限范围内(本部门或本校)所有师生的个人信息。

4.2.1 学生信息查询

查询条件为:年级、院系、专业、学生类别(研究生、本科生)、学号、姓名、性别、民族、政治面貌、生源地、是否在校、是否在籍等。

4.2.2 教师信息查询

查询条件为:学院、部门、工号、性别、职称、入职年份、民族、学历、编制情况、政治面貌、在职状态等。

5 主题统计分析

主题统计分析实现不同业务维度和方向的主题分析展现和辅助决策。主题分析需要有业务系统和业务数据支撑,且有明确的数据来源。

确定分析主题:

本项目主要包含学生、教师、一卡通消费、财务几大类等分析主题。所有的数据来源均来自于共享数据库,以图、表两种形式展示,并可下钻到数据明细。具体的描述如下:

5.1 学生统计分析

学生主题主要有总体、迎新、就业、学习成绩、学籍异动等情况,维度包含年度、学生类别、院系、年级、生源地、性别、政治面貌等。

5.2 教师统计分析

教师主题主要有教师分布、科研、教学等情况,维度包含职称、学历、院系、年龄段、性别、政治面貌等。

5.3 一卡通消费统计分析

一卡通主题主要有学生个人消费、上网时间、借书等情况,维度包含人均消费、消费类型、上网时间、借书总数等。

5.4 财务统计分析

财务主题主要有薪酬分析、项目经费分析等,维度包含、院系、工龄、岗位、项目类别等。

图1

6 应用部署

6.1 硬件规划

数据库服务器:IBM3650服务器两台,交换机两台,部署Oracle Rac架构应用服务器:虚拟机两台,一台部署数据分析应用服务器,一台部署ODI数据交换应用平台系统拓扑图如图1。

6.2 软件规划

数据库操作系统采用Oracle Linux Release6.7x64,数据库Oracle11.2.0.4,应用服务器操作系统安装Windows server2008,中间件安装tomcat-7.0.72、JDK1.8。

7 结束语

华东政法大学大数据主题分析项目的建设,提高了校园各业务系统数据的规范性、正确性和及时性,打通了各业务系统之间的壁垒,为全校师生查询相关信息提供了简捷的方式,主题分析展现的统计分析结果为学校领导决策提供了科学的依据。

猜你喜欢

一卡通代码师生
创世代码
创世代码
创世代码
创世代码
基于“一卡通”开发的员工信息识别系统
麻辣师生
一卡通为新农合基金加密
重视“五老”作用 关爱青年师生
成功的师生沟通须做到“三要”