APP下载

基于数据中台的高校档案管理系统模型设计与实现

2022-10-21林宇帆卜心田浙江开放大学

浙江档案 2022年9期
关键词:中台流程模块

林宇帆 卜心田/浙江开放大学

1 高校档案治理存在的数据问题及相关模型要素研究

档案治理着重于攻克数字化时代档案信息化等关键难题,通过信息化检索工具,融入现代化、信息化数据管理模式,更加精准、有效、客观地向社会大众开放档案[1]。而在高校档案治理中,有以下数据问题:一是档案数据资产归属不明。具体表现在高校档案数据杂乱繁多且存放于各级学院与部门,源头数据发布时间、质量、准确度、归口部门、责任老师等信息不明确。二是档案数据标准规范缺失。不存在统一代码标准、程序规范、数据治理等管理制度。三是档案数据质量参差不齐。缺乏数据质量准入和考核标准,对于矫正与提升档案数据质量的支持不充足,档案数据难达到最低使用要求。四是档案数据共享机制落后。受传统档案管理模式惯性影响, 档案信息资源建设与服务的传统思维弊端依旧存在,档案数据的流通性极低且都是以被动共享的形式被其他部门所了解,缺乏时效性与准确性。

针对上述问题,基于数据中台的高校档案管理系统的解决模型要素可被归纳为以下几类:人才队伍建设、资源整合投入、高新技术支持、系统数据梳理、扶持机制完善。高校首先应做好档案信息化人才队伍建设,开展档案信息化、数据中台等其他实用新型工具的相关使用培训。档案数据资产归属不明主要体现在对接OLTP(事务处理)和OLAP(报表分析)的基础过程中,相关使用培训可在源头环节减少归属不清的OLTP。为改善档案数据标准规范缺失及档案数据质量不佳的弊端,高校可依托高新科技企业,建设数据共享平台,这是平台建设投入的可取方式,平台应包含数据可视化、用户画像BI分析等决策支持模块。推动档案数据质量整体进步的关键是匹配支持数据中台的高新数据处理平台工具,如Hadoop及阿里的odps[2]。高校数据在进入数据中台前,可根据隐私等级实施对称或不对称加密,并通过标签设置进行初步分类。进入中台后,在海量共享数据的收集基础上,通过一系列数据清洗、定向分类,丰富数据字典和数据仓库,进一步扩充中台数据维度和广度。系统数据梳理方面,在数据模型管理的辅助下,高校可进一步规划管理元数据与主数据,做好表管理与数据集管理。高校档案数据要确保能转化为数据资产,在经过计算逻辑封装后通过API接口等形式对外开放服务并支持业务系统的便捷使用,数据可转化为服务能力,最大程度释放数据价值,反向激活整个数据中台。还可配备相应的扶持机制并主动完善已有的数据保护机制。其中,动态反馈和效果评估机制是对档案质量的矫正保障,在ETL数据处理的过程节点中就做到必要的矫正干预,从而节约处理成本。另外,数据安全处理与应急机制为服务网络编研建立起网络安全屏障。

2 基于数据中台的高校档案系统模型场景建构

数据中台通过数据服务化的流程,进一步减少数据的重复加工,提高数据的共享以及复用能力,从而盘活数据平台及管理体系。在搭建研发全过程视图过程中,增加涉及数据清洗和筛选的数据治理流程,以及对服务化升级的数据处理步骤。中台通过有效聚合与治理,将海量数据抽象封装成数据服务,并提供给高校业务系统使用。在统一数据中心中间件的衔接下,通过垂直数据中心、公共数据仓库以及内部数据中心的相互配合,中台对高校核心业务主体结构进行统一数据模型管理。中台在高校档案模型建构中,从数据标准、数据分析、数据交互、用户画像、BI分析中心、关联预警、模型管理等方面发挥作用。随着数据模型和流程学习更为丰富饱满,中台成为提供标准化数据资源的有效手段,同时也是后期海量数据共享共用的工具基础。在数据中台的运行保障和平台的正向循环运维下,高校档案管理系统在技术、机制、人力、资源的协调配备下,可逐步适用于以下5个高校场景模块:数字党建、数字图书馆、数字校务、数字科研及数字资源。

图1:高校档案管理系统模型技术架构图

2.1 数字党建:高校党建档案数字管理模块

以现有的钉钉云上党建为例,高校党建模块主要分为门户管理、活动管理、会议管理、党务工作、学习管理,呈现给用户最多的是门户管理。数字党建主要完成党委空间、总支空间、支部空间、个人空间、驾驶舱大屏、数据归档以及相应的后台支撑功能。因此建立和完善一套高校党建中台数据标准迫在眉睫,可涵盖定义、操作、应用多层次数据,分为基础性标准和应用性标准。在中台数据标准基础上,坚持“一数一源”原则,确立党建数据确权规则,深化党建主题数据仓的数据归集,实现党建数据的统一运维和共享,建立有效聚合、共用共享、追踪溯源的高校党建数据共享服务机制。在中台数据统计方面,根据个人党员学习情况、支部活动和学习教育参与情况、志愿者服务情况等生成个人党员积分数据,根据党员积分数据、党员发展数据、党建活动数据、党建考核数据和党建舆情数据等,生成集体党建指数。在中台数据分析方面,实现关联分析、预警分析、趋势分析,根据高校需求自主拖拽统计数据实现相关数据分析,智能预测关键指标近期发展趋势,预警提醒采取干预行动,实现对高校党建数据精准督导。通过事先设定弹性数据指标,中台通过云计算实现各类党建工作数据自动预警、主动提醒和及时反馈。基于关键指标的历史数据,数字党建进一步搭建基层党组织和党员画像档案库,强化数据挖掘深度与维度,实现自动用数据对基层党组织和普通党员精准画像,绘制各类性格标签。该档案库可有效掌握学校党员的思想认知、工作作风、能力水平、党性修养等信息,服务高校精细化人才管理模式,并可针对不同性格标签的党员开展个性化党员教育和相关职务调配。数字党建还涉及针对中层及以上领导干部的干部档案管理库的建设与运维,信息类型除包含与党员情况类似的基本情况外,校外工作经历、职务任免等隐私性强的考核信息也被涵盖。

2.2 数字图书馆:高校图书档案数字管理模块

随着图书馆每日吞吐的数据量急剧飙升,涉及数据的品类和形式也日趋丰富,传统运行机制显然难以满足。因此,人们提出了数字图书馆的创想,它是用数字化高新工具处理并筛选各类图文文献材料的多媒体相关的分布式数据处理平台[3]。在数字图书馆的搭建基础上,从中台数据共享角度,高校图书档案数字管理模块重新梳理可提供的综合功能,包括用户访问、数据管理、资料编目、利用查询、安全运维等。用户访问可沿用高校之前的统一门户跳转单点登陆的方式,内网用户实现一键式快捷登录;外网用户通过vpn设备实现安全校验。中台管理主要涉及对图书档案的过程数据资源二次处理、存放、引用等。一是将原有纸质档案转化为易维护的电子版本,二是对电子档案做好存储、编目、借阅管理。按照国家和高校有关规定,过程中还涉及对业务系统及数据库的维护、开发和数据备份工作;数据库资源、网络资源的建设及日常维护工作;图书馆Web网页及移动端的建设和日常更新、运维工作等。其中,随着数据处理插件的日渐进步,有关数字图书档案版权的侵权行为变得随处可见。因此在前期数据录入中台前做好版本管理和版权人明确变得尤为重要。应在获得电子授权的基础上进行数据编辑工作,并明确版权人及录入负责人。资料编目、利用查询功能可参考原先的高校图书馆编目规则,并在编目中增设查询关键词搜索子功能。利用查询上可对电子图书档案划定精确的关键词管理,用户可通过检索相应明显关键词获得与之密切相关的文献资料。模块同时提供在线咨询服务和光盘检索服务,服务用户检索查询到所需的数据文献。

2.3 数字校务:高校校务流程档案管理模块

高校的业务缺乏细致数据梳理以及后期的流程档案管理,导致出现电子签章流程混乱及与线下流程互相矛盾的情况。为响应高校“最多跑一次”的数字改革,齐全校务功能建设,提升网上办事效率,高校校务流程档案管理模块势在必行。该模块需借助数据中台完善与各类业务系统的数据认证对接,包括公文、数据申报、数据分析等系统。该模块在界面设计上需最大程度与业务系统对接,界面上初步设定排列以下板块:上线办事流程、流程审批事项、处理流程总耗时、校内公告、一周安排、公文处理。以“日常报销审批”为例,需填写预约单号等报销事由,经过是否会签、实物购置的判别,到达经费部门负责人审核、财务审核,最后闭环回到申请人阅知。此类高校业务部门涉及的流程繁多,需在前期调研过程中充分了解相关需求,做好数据流程梳理工作,使电子流程真正替代原有线下流程并循环使用起来,在后期以教职工工号为存储标签归入数据中台管理。在数据中台的管理存储中,对类似流程可采用数据归纳收集,统一测算流程报表,在后台中导出子节点流程具体数量,以及对处理流程总耗小时数的精确掌握,做到流程量化、工作量可预估。在中台数据分析上,进一步为业务部门流程工作量的精确把控提供数据支持,辅助高校管理层了解业务部门的涉外流程实际数量及现阶段的工作重点,可有针对性地进行业务侧重及资源投入调整。同时,于高校校务而言,满足教职工移动办公需求的移动端建设也需中台的数据服务支撑,要求与PC端的校务流程保持实时数据交互。

2.4 数字科研:高校科研档案预警监督模块

按《高校科研经费监督系统数据规范1.0(试行)》要求,数字科研进一步延伸系统数据的梳理工作。在原系统基础上,嵌入科研档案预警监督模块,并通过与财务、采购及人事管理系统等对接,构建数字科研数据资源池,实现数据互通共享。在模块上增设数据监督平台,在中台原有模型基础上设计对应预警模型,开展与中台的数据分析、历史比对;完善问题处置流程机制,将异常状况按照分管部门、程度情况分级分类地推送至高校各部门开展核实处理,从而形成覆盖数字科研全周期的科研档案监管平台。系统数据梳理的归集数据步骤,遵照全员、全量、全流程、全要素的原则,同步推进监察、人事信息共享。中台资源池应包含以下基础数据元素:科研机构、项目人员、具体项目信息等。中台服务于模块建设,梳理监督需求,建立预警规则,不断充实问题需求清单,打造高质量的预警模型集群。预警模型的初期建设需找出高校科研与违纪问题之间的因果关联,建立分色块预警模型。预警模型清单需根据学校自身情况进行定制,数据元素包括预警模型名称、预警规则、数据基础逻辑关系、对应处置单位等要素。

为规范模块使用,高校还应建立科研人员档案中台信息库,对存在违规行为的科研人员向归口部门发出预警,为责任单位的审批提供依据。科研档案数据共享和加密机制的完善也是必要的机制支持,按照上层部门的数据要求,通过高校DSC大数据链路系统向总仓传输科研档案数据,并提供较完善的数据加密机制,确保科研数据存储和传输的安全性。该模块在管理模式上采用中台分级分权的规则,对不同级别用户默认限制不同操作权限和数据访问范围,并可根据学校实际情况灵活调整。模块的架构设计兼容各类系统升级,并根据中台用户画像提供匹配的操作界面。

2.5 数字资源:高校课程资源档案共享模块

课程资源档案共享模块的逻辑设计可参考杭州国家版本馆。在保障数据安全方面,该馆承担中央总馆的异地容灾备份,并作为江南地区的版本档案汇聚中心[4]。该模块的中台应用为资源档案中心,为高校学习者提供多元化资源、多终端课程、多媒体教学、个性化学习的数字资源档案支持,涉及人才培养方案、课程注册、学生照片管理、学籍数据统计、毕业结果统计等。在课程注册及学生注册的基础上完善学籍管理,可存储并自动查询档案中心的学生学籍信息,并批量导入学生入学和毕业照片,做好照片的档案分类管理。学籍数据统计和毕业结果统计则使用中台的BI分析中心,从不同数据维度统计具体招生及毕业情况。在模块的框架搭建上,统一学习门户与标准体系,为各类数字资源平台的功能对接提供统一API,聚合数据中台,实现档案、资源和数据的共享。在相关高新工具的运用上,模块重点研究基于中台规则的个性化推荐和基于协作过滤的数据分析。前者利用数据挖掘来记录学习者的个人资料、浏览规律,以及关键词的资源搜索,不断扩充设置的规则,从而根据学习者的专注状态、浏览兴趣等相关行为数据推荐匹配的学习资源并归入数据中台的运维。在中台的学习规则完善后,可自动为其他相似学习者推送个性化的学习资源。后者通过资源档案中心主动记录学习者的学习状态,包括登录时长、有效学习时间、论坛交流情况、师生在线沟通情况、积分累计情况等。将不同空间与时间的数据纳入档案数据中台,研究基于协作过滤的数据分析,更深层次地对学习者的相关数据进行挖掘处理,为学习者提供改进在线学习建议,并为数字资源的形式升级提供决策依据。在扶持机制上,高校注重课程资源的实时开放共享,转化精品资源为数据资产并投入市场,最大化地发挥数据资产价值。

3 结语

数据中台的本质是整合建设一套可让数据真正有价值的机制,匹配可协调资源,做到从根本上提高数据质量,从源头上节约数据运维成本,从机制上协同业务系统[5]。随着模型和流程学习更为丰富饱满,上述基于数据中台建构的高校档案系统模型场景也为未来高校档案治理提供了新的思路与路径参考,以数据引领高校档案信息化,紧跟国家信息化战略。

猜你喜欢

中台流程模块
工星人平台注册流程
“选修3—3”模块的复习备考
Module 4 Music Born in America
关于零售企业“中台”建设的研究
浅析订单中心系统的支撑实现
汽车制造企业质量中台研究
以技术开发中心为中台,数字化转型之见解
与元英&宫胁咲良零距离 from IZ*ONE
违反流程 致命误判
四川省高考志愿填报流程简图