APP下载

研究生教育大数据信息资源建设的众筹模式初探

2020-10-14张晓会

关键词:调剂众筹研究生

李 娟, 张晓会

(北京工业大学 文法学部, 北京 100124)

信息技术的发展特别是大数据的广泛应用,为教育改革赋予了新的动能。中国教育部《教育信息化2.0行动计划》[1]指出:教育信息化是教育系统性变革的内生变量,依靠教育大数据大幅提高教育科学决策和综合治理能力已成为教育界共识。然而,在数据已成为国家基础性战略资源的前提下,政府数据开放共享不足已成为当前制约大数据发展的重要瓶颈。研究生教育领域也同样面临着研究生教育相关大数据资源整合困难、数据流通共享困难等问题[2]。因此,文章以研究生招生调剂环节和研究生课程教学管理为案例,分析影响研究生教育大数据信息资源共建共享的问题根源,试图探索一条可行的解决方案。

一、现状及存在的问题

在研究生教育大数据资源共享过程中,主要包含高校与外部以及高校内部之间的数据交换共享两种类型。在高校与外部数据交换过程中,又分高校与上级主管部门的纵向交换模式和高校与兄弟高校之间的横向交换模式。而研究生招生调剂环节恰恰涉及研究生招生单位与教育主管部门纵向及不同研究生招生单位之间横向的信息交流。因此,笔者以此为案例进行深入研究和分析。

(一)高校与外部信息资源交换共享模式

研究生招生中的调剂工作是国家教育部门充分考虑考生的利益,最大限度满足考生深造愿望“上线不落榜”的有力举措,同时也是平衡招生单位之间和专业之间生源的有效手段[3]。在研究生调剂的具体操作过程中,考生在第一志愿未被录取的情况下将转向到合格生源不足的院校或专业,因而涉及第一志愿招生单位和调剂招生单位之间部分数据共享,这属于高校与兄弟高校之间的外部横向数据共享交换模式。而教育部为了保证招生工作的公开公平公正,整个招生调剂环节都是在教育部建立的中国研究生招生信息网(以下简称“研招网”)上进行,这就体现出高校与上级主管部门之间的纵向数据交换共享模式。

在调剂过程中涉及到考生、招生单位、招生学科、研招网等不同信息管理主体,并且每一个流程中都会有数据的产生、交换及利用。第一次数据共享是考生、拟接收调剂招生单位与研招网(第三方平台)之间的数据共享过程。由于这个过程中高校与考生并不直接交换共享信息,因此,这个过程实质上是高校与教育主管部门之间的纵向信息(数据)交换模式,如图1所示。

第二次数据共享发生在第一志愿招生单位和拟接收调剂招生单位之间,考生的第一志愿高校、申请调剂的A志愿高校和B志愿高校,就通过研招网构成了一个高校与高校之间的横向信息(数据)交换模式,如图2所示。

目前这个数据共享过程能够基本满足中国研究生招生调剂工作的顺利进行,其突出优点:一是考生信息在研究生招生报名时即一次性采集,上传到研招网之后就成为“公共数据”,可以被不同招生单位共享,但又不属于任何某一个单位。这样有利于各招生单位在有限时间内(36小时甚至更短)尽可能多地了解调剂考生的相关信息,把工作重点放到选拔的正确性和科学性,而不是让考生重复填报数据、招生单位重复审核数据的真实性。这种做法体现出数据的使用比占有更加重要,提示人们应树立未来分享经济时代“连接比拥有更重要”的理念[4],构建数据连接共享平台。二是建立了一个第三方平台、作为数据共享的载体。研招网作为第三方平台,搭建了考生、第一志愿招生单位和被调剂招生单位之间信息共享的桥梁。

但是,如果从接受调剂的招生单位和招生学科希望接收“符合本学科需要的”“高质量”调剂生的目的来看,当前模式也暴露出一些问题和不足:

一是考生上传信息的可信度难以保证。如拟接收调剂招生单位因为专业课考试科目与一志愿高校考试科目不同,经常要求学生提供其本科成绩单以考量其知识体系。但这份成绩单并不是研究生报名时必须提供的信息,因此学生必须再次上传、而招生单位却无法审核其真实性。反映出数据生产(采集)时可能有缺失信息,也缺乏审核环节,这都是影响数据共享和后期重复利用的原因。

二是考生上传信息不完整。如研究生招生复试中最看重考生的科研情况,但是这些信息在调剂系统中非必填项、因而有的考生填了有的没填,也就是数据采集内容不完整,使得招生单位无法判断没填的考生是没有还是漏报。这说明作为第三方平台设计的数据采集的颗粒度不够精细,未能考虑后期利用者的需求。

(二)高校内部信息资源交换共享模式

以上研究生招生调剂案例描述了高校外部信息资源交换的模式。而在高校内部,由于高校是一个独立的办学实体,其大数据信息内容包罗万象。但追溯原始数据的产生,多来源于各个职能部门根据业务的需要、通过管理信息系统进行采集。由于同一个部门的不同业务系统都服务于同一个主体、同一个目标,因此数据能够在本部门内部流动,实现共享。但是,高校内部信息资源的交换主要发生在不同部门之间。笔者以校级人事部门组织的教师年度绩效考核和与研究生导师绩效关联的课程教学数据流动为例,阐明高校内部不同部门之间数据共享的现状及问题。

校级人事部门在组织教师年度绩效考核时,传统做法是让教师填表,但因数据重复采集而备受质疑,且数据缺乏审核、可靠性难以保证。改进做法是向有关部门要数据,如要求本校研究生院提供任课教师的教学数据。但这样做给相关部门带来额外的工作量,大大增加协调成本,结果是要么难以按时完成、要么给的数据不满足使用,影响数据质量。目前先进的做法是以学校信息中心(或类似机构)为结点,建立起高校内部各个职能部门、各个业务管理信息系统的数据连接。这样,校级人事部门直接从学校信息中心的大数据信息资源中调取需要的数据,而不再劳烦其他职能部门、对教师个人也从填报数据转变为核实数据。这个过程中,学校信息中心承担了一个数据生产者和利用者之外的第三方平台作用。

在考核教师工作量时,首先由本校研究生院等职能部门作为数据生产者将业务数据分别上传给信息中心,然后学校人事处根据自己工作需要,作为数据利用者从本校信息中心下载自己需要的数据,如图3所示。

这种模式在正常情况下运行良好。但事实上,在教师本人对人事处工作量核实过程中发现,因一些 特殊情况调课的教学工作量,仍然计在原来的教师名下、而未体现在实际的任课教师身上。究其原因,问题出现在高校研究生院当前的调课审批仍然沿袭的是传统的书面审批流程,尚未升级到利用信息技术进行线上审批的流程。因此,调课审批程序虽然完备,但未及时准确地上传给信息中心的教学数据库中进行更新,实际也存在着登录成绩的教师与实际授课教师信息不符的管理隐患。但在这个数据“上传—管理—利用”过程中,因为数据的“生产者”与“管理者”都是研究生院,而“利用者”未知,故在未有其他部门利用该数据时,该流程的漏洞不影响整个研究生课程教学环节的正常运转,研究生院自己很难发现这个漏洞。反映出研究生院现有工作流程中缺少“数据及时更新维护”的环节,说明传统的工作流程需及时升级、优化甚至再造,才能适应信息化的发展。

以上两个案例说明,当前数据资源建设模式在数据采集的完整性、可靠性及数据颗粒度方面乃至在业务流程上还存在一些问题,这些都制约了数据的共享和重复利用。但值得借鉴的:一是区分数据的“生产者”和“利用者”的不同身份;二是建设一个数据生产者和利用者之间的“中转站”(即第三方平台),以便多个主体在同一个平台上交换数据,而不是数据生产者和利用者直接交换数据。这就启示人们以“众筹”模式构建研究生教育大数据信息资源。

二、以众筹模式建设大数据信息资源的新思路

众筹本是一个经济学的概念,即大众筹资或群众筹资,是伴随互联网的发展而诞生的、一种通过互联网平台向群众募集资金,以支持企业家完成特定目标的新兴融资方式[5]。众筹模式的主要组成部分包括:发起者、平台和支持者,资金(资源)以“分散—集中—分散”的方式在“支持者—平台—发起者”之间进行流转。这个过程中,“发起者”(融资者)必须提出详细的项目设计方案和实施计划,通过互联网平台对外发布,大众投资者从互联网获悉项目信息后审核项目方案及其计划自行决定是否参与投资成为“支持者”,而一旦融资成功则项目必须按既定方案或计划实施。因此,众筹的实质不仅是筹措资金或资源,而是“让(利益相关)各方充分参与整个生产销售链条,用新的基础架构、让生产更有效”[6]。这说明众筹的核心是市场导向的供给侧改革,并且这种市场需求已经通过大众支持者的积极参与显现出良好的市场前景而更加受到大众投资者的青睐。众筹这种门槛低、大众性、多样性和实操性的特点,已被日益广泛地用于支持包括灾害重建、民间集资、创业募资、艺术创作、科学研究以及公共专案等各种活动,也对研究生教育大数据信息资源的建设模式给出一条新的思路。

借鉴众筹模式的思路,大数据信息资源建设的实质是以数据利用为导向的数据生产侧的改革,即以大数据市场机制来建立数据生产者和利用者之间的供求关系,而联系数据生产者和利用者之间的第三方平台既不是原始数据的生产者、也不是数据最终的利用者,而是一个数据连接平台,发挥着数据管理、监督和服务的作用。这就是大数据资源众筹模式,如图4所示。

在研究生教育大数据信息资源建设的“众筹模式”下,各研究生培养单位既是数据的生产者(众筹模式中的“支持者”),同时也是数据的利用者(对应于众筹模式中的“发起者”),连同作为数据连接平台的第三方,三者以“分散—集中—分散”的方式,将数据从“生产者”流向“平台”再到“利用者”。由此可见,研究生教育大数据信息资源建设的众筹模式中最重要的内容就是如何建设一个平台,谁来充当数据交换的“第三方”?

三、不同数据共享场景下的信息资源众筹模式

常言道,一把钥匙开一把锁。上文阐述了大数据信息资源建设的实质是以数据利用为导向的数据生产侧的改革,那么,就必须根据大数据信息资源的用途、数据自身特性及来源不同,采取不同的建设模式。

(一)跨领域专项大数据共享的众筹模式

该模式对应于前述高校与教育主管部门的“外部-纵向信息交换模式”,是以教育主管部门作为发起者,并出资建设第三方数据平台,要求各研究生培养单位向该数据平台提交相关数据,如图5所示。这种模式的典型案例就是“一级学科评估”,各参评学科所在高校将所有与一级学科评估的相关数据(包含该校有关人事处、科技处、教务处、研究生院、学工部等学校各职能部门、各学院以及各学科的基本数据)都上报给教育部学位中心;学位中心负责整合和利用这些数据开展评估。

该模式的优势在于教育主管部门可以通过颁布政令来进行教育大数据的采集,而且可以规范统一的数据接口和数据标准,便于后期的数据共享利用。但缺点也非常显著:一是数据难以即时采集、即时传输,影响平台上数据的维护和更新,后续重复利用势必影响数据质量(如一级学科评估每次评估都要单独采集数据);二是成本高,表现在第三方数据平台的建设成本和维护成本都非常高;三是风险大,数据过于集中、信息安全要求等级非常高。因此,该模式适用于专项大数据信息资源的建设,如学科评估;但不适用于对数据安全要求特别高的应用场景。

(二)同领域大数据共享的众筹模式

考虑到模式一数据平台建设的成本问题,模式二改进为由教育主管部门承担数据连接平台(只提供数据连接),各研究生培养单位分别作为发起者和支持者以某种协议参与(协议目的是保证发起者和支持者的资质),如图6所示。模式二的优势在于:继承了模式一中依靠政令采集数据、统一数据接口和标准的优势,同时因为只是提供数据连接、不直接存储管理数据而大大降低了信息安全风险,还可以由各研究生培养单位自行更新维护数据,进一步降低了平台运行成本。缺点在于必须依靠统一的数据标准与规范,这就限制了这种模式只能在教育主管部门的同一个领域下进行,如研究生招生调剂案例,但对于像一级学科评估那样涉及人事、科技、教学等多个部门的数据,标准和接口则难以统一。

(三)校际之间大数据共享的众筹模式

前两种模式对应的都是高校与上级主管部门之间的信息交换模式,但对于高校与高校之间横向的数据交换共享,则可考虑由校际合作方式建设第三方数据连接平台。即以各个研究生培养单位作为发起者,通过自主协议参与合作的其他研究生培养单位作为支持者,共同出资建设第三方数据平台,如图7 所示,真正体现出“众筹”的含义。

该模式的优势在于:一方面,各研究生培养单位间通过相关合同协议规定数据的使用权和拥有权,可有效促进数据共享同时保障数据的安全和隐私;另一方面,各研究生培养单位分别生产、采集、维护各自的数据,可最大程度上保证数据的真实性和即时性。但缺点在于:作为各研究生培养单位“众筹”建设的第三方数据平台,建设过程中需要逐一与合作单位谈判、协调,沟通成本很高。此外,虽然研究生培养流程大同小异、各个研究生培养单位也都有自己的研究生管理信息系统,但是由于历史原因各单位的管理模式、各系统的数据接口与标准很难一致。这些都制约了该模式的大范围推广,但在某些特殊场景下(如校际联合培养中的学分互认和异地校区管理)时,这种模式具有可行性。

(四)高校内部大数据共享的众筹模式

正如前述研究生课程教学管理案例,在高校内部是通过学校信息中心作为一个统一的、集中的第三方平台,建立起研究生院与其他部门之间的数据交换;并且该平台自己不生产数据,主要发挥数据连接和存储作用;如图8所示。

此模式的最大优点在于:一是可以最大程度实现研究生院与校内其他部门之间的数据共享,有效解决数据重复采集的问题;二是可以保证数据的真实性和即时性。但缺点在于:如何保证数据的安全性?如何确定、谁来确定使用者的权限?另外,各个业务部门的管理信息系统依据的上级标准规范并不统一,使得部分数据不能直接共享,需要信息中心花费大量时间成本逐一进行沟通协调,甚至难以达成共识。

为解决校内各部门数据共享时的数据安全问题,笔者通过调研访谈,参照汽车4S店与汽车零件制造商的生产经营模式,构建出一种高校内部大数据生产、采集与转移流动模式,即“分散—集中—分散”模式。图9描述了数据资源建设时,各业务部门将自己所拥有的数据进行清洗、拆分后上传给学校信息中心的过程。图10描述了数据资源利用时,各业务部门从学校信息中心下载其他部门的数据“零件”,然后组装成自己需要的“部件”进行利用的过程。

综上所述,在这种“分散—集中—再分散”的众筹模式下,四种不同的模式应对高校外部内部几种不同的信息交换、数据共享场景,能够实现不同机构之间的数据共享,同时不同程度地规避了数据安全的风险,也降低了数据平台第三方的建设成本和管理成本。而且这种众筹模式,不仅能够用于大数据信息资源的建设,还可用于后续的大数据资源的管理,体现出智能经济时代的特征。

四、实施众筹模式的政策环境

大数据的应用既是一个技术问题,关乎数据的即时采集、超大存储、数据安全[7]等,但也是一个管理问题,决定了数据的可靠度、颗粒度和重复使用的效率和效益。研究生教育大数据信息资源建设的核心目的就是让数据流动起来,体现在:一是数据能够流动、愿意流动、安全流动;二是解决有没有数据、到哪里找数据、能不能用数据、数据是否安全可靠等问题。在信息技术快速发展和智能经济时代的大背景之下,以众筹模式构建研究生教育大数据资源已经具备了技术上的可行性,但后续实施过程迫切需要良好的政策环境予以保障[8]。

首先,要尽快建立国家统一的数据标准,以保证跨领域的大数据信息资源能够交换;这是解决数据接口的首要问题。

其次,要加快法规制度建设,明确数据生产者、数据审核管理者、数据利用者之间的关系及其各自的责权利;健全完善数据开放和保护制度,以充分调动和激发高校内部各职能部门、高校外部与主管部门以及高校与高校甚至高校与第三方(如用人单位、社会组织)之间对于数据开放共享的内生动力,同时确保在风险可控原则下最大程度开放。这是解决数据流通的动力问题。

再次,数据作为智能经济时代的一个重要资本,众筹模式要求基于市场交易前提的数据交换模式[9],迫切需要建立大数据市场交易规范,以统一标准来培育大数据交易市场、以基本规范来提升大数据市场服务能力和大数据行业管理水平,从而支撑大数据行业发展。这是解决数据流通的安全问题。在此基础上,国家应鼓励社会资本参与大数据信息资源体系建设,同时鼓励高校与高校之间、高校与第三方平台之间的数据交换和交易,试点探索建立健全数据资源交易的机制,引导、规范各市场主体的数据交易行为。

最后,要完善组织实施机制,再造业务流程。国家要率先着手建立大数据发展、应用的统筹协调机制;高校则要从利他角度出发,加强精细化管理、梳理重构业务流程;以推动形成大数据产业链职责明晰、协同推进的工作格局[10]。

综上所述,以众筹模式建设研究生教育大数据信息资源,将有利于解决数据共享利用难题,但同时也将引发以数据利用为导向的数据生产、审核、交易一系列大数据市场管理体系的建立和健全,必将倒逼研究生教育管理流程的优化与再造,推进研究生教育现代化进程。

猜你喜欢

调剂众筹研究生
能“二战”考研尽量不要调剂,不然就是浪费时间
要不要服从调剂?
2019年考研调剂复试开始
众筹
伍小东研究生作品选登
蔡智及其研究生作品选登
沈铭存研究生作品选
中国式众筹升级记
众筹圆梦
提高研究生调剂工作效率的思考和建议