APP下载

大数据时代科研管理系统云平台架构探析

2021-04-09王尧尧战洪飞

科技创业月刊 2021年2期
关键词:科研人员申报学科

王尧尧 战洪飞

(1.宁波大学 科学技术处;2.宁波大学 图书馆与信息中心,浙江 宁波 315211 )

0 引言

科研管理信息系统的建设是高校信息化建设的重要组成部分,在高校的发展过程当中,信息化水平的高低是衡量高校整体素质和综合竞争力的一个重要标准。随着大数据、云计算和人工智能的不断发展,高校普遍意识到用信息化手段进行科研管理的迫切性。当前很多高校都建立起自己的科研管理系统,但是很多系统在职能部门之间存在 “数据孤岛”和不必要的数据冗余。例如教师办理离职退休手续、科研经费到账手续等,往往需要往返于多个部门之间,效率较低[1-4]。科研人员在科研系统,无法直接获取相关学科背景的个人或者团队,导致联合申报、跨学科申报无法实现[2]。电子科技大学基于复旦天翼开发的科研-财务管理系统,打通了财务-科研的壁垒;哈工大自2014年起,构建了从项目预申报、立项、过程管理到结题验收的全生命周期的日常审批及知识产权管理全流程科研管理信息系统;清华大学根据自身校情自主开发了集2个网站和13个子系统的科研信息系统,形成具有自主知识产权的科研管理平台[5]。无论是高校自主研发,还是购买市场上较为成熟的如易普拉格、复旦天翼等公司开发的科研管理信息系统,系统架构都从传统的C/S(客户端/服务器)架构,发展到基于Web的B/S( 浏览器/服务器)架构,系统功能从简单的数据录入、数据查询到数据统计功能,能够保证以科研项目的管理为主体,以经费管理为抓手,宏观层面把控科研全生命周期,微观层面实现对项目、经费、成果等科研活动的全过程、全要素和全生命周期的动态监控,但是还远远不能满足科研管理的组织协调和策划布局功能需要。

科研管理不同于一般的行政管理,是一项集策划、协调和服务于一体的业务管理工作,对科研活动起到引领、支撑和服务的作用[6]。大数据作为一个崭新的技术手段和思维方式,给人类带来了数据挖掘和应用的巨大价值。维克托·迈尔-舍恩伯格在《大数据时代》中指出,大数据时代最大的转变就是,放弃对因果关系的渴求,取而代之关注相关关系[7]。利用以数据为基础的决策来解决诸多领域问题,成为大数据时代的显著特征,数据驱动决策应运而生,将隐含在海量科研数据中的隐形知识显性化,利用决策支持工具帮助相关人员做出决策[8-10]。Williamson指出数据本身对校长和教师将其用于学校改进目标而言,并不是很有用,只有当数据转化成了信息,在学校改革和发展中才具有重要意义[11]。Halverson在2007年从微观角度提出数据驱动教学系统(DDIS)模型,根据数据反映出来的现象指导教学实践及其改进计划,从而充分彰显技术变革教育的力量[12]。Romero等用Moodle学习平台的日志数据进行了数据分析,通过统计、聚类、分类、关联规则挖掘、可视化技术等多种方法进行数据挖掘,提出了一种学习日志挖掘模式[13]。因此,大数据时代背景下,科研管理应该由集权化、程序化的管理模式向科学意义上的设计、规划、决策辅助的治理模式演化,这对于当前的科研管理系统是个挑战,需要基于科学规划与升级数据驱动的科研管理信息系统。

随着区块链技术的去中心化、公私钥数据加密、数据不可篡改等特性的不断发展,公开数据可以透明共享,也能保护数据信息隐私和数据安全[14],给科研管理能力现代化建设带来了机遇和挑战。高校应积极主动引入大数据和云计算等先进科学技术,实现科研数据的云集成,促进科研管理信息系统的建设升级和科学规划,更好地为广大教师的科研工作提供技术服务支撑。本文结合大数据时代,面向业务管理能力科学化、现代化的现实需要,提出数据驱动的云平台加分布式模式的科研管理系统构建模式,通过云端的科研数据与相关业务部门数据的互联互通,创生新的基于多源数据的云平台系统,为科研管理决策提供基于多源大数据技术支撑的决策辅助,实现科研管理的科学组织及动态决策。

1 基于云平台的科研管理系统架构探索

科研管理系统云平台是一个基于云计算、面向服务、大数据、高性能计算等先进信息技术的政府-高校-企业-研究机构的协同支撑环境,它为实现大范围异构分布环境下的政产学研间提供信息集成共享、联合申报、科研协作、科研仪器共享、动态数据监测等功能,服务于科研过程管理的全流程,包括项目的申报、到款、立项、中期检查、结题等全流程管理。同时将科研奖项、论文、专利、著作等成果信息、科研平台信息、人事数据、财务数据、地方服务信息以及系统之外的申报指南信息、企业技术需求信息、历年各高校的立项信息等规模庞大的海量数据虚拟化,形成虚拟资源并聚集在虚拟资源池中分布式存储,提高了系统的可靠性、可用性和拓展性。不同用户可根据使用需求租用云端数据,获得所需的各类服务资源,实现资源的高效共享与协同。健全“企业出题、高校解题、政府助题”的创新协同机制,实现基于云平台的政产学研的有机融合、信息互联互通、协同沟通、资源共享等,体现五位一体的构思与理念,面向国家战略、地方需求、面向科研产业链的管理能力支撑。科研管理系统云平台的服务体系构思如图1。

图1 科研管理系统云构思体系

科研管理系统的云共享平台的分成三层,基础层、平台层和应用层。三层架构之间不一定有依赖关系,可以独立对外提供服务,云平台架构图如图2。

图2 科研管理系统云共享平台体系架构

基础层主要为实施科研管理提供基础的支持,包括计算资源、存储资源、网络资源、交换资源等硬件设施、大数据套件、云平台套件、中间件等软件设施,各类基础的数据库,申报指南信息主题库、企业技术需求,转移转化信息主题库。

平台层包括共享信息平台、科研仪器共享平台、动态数据监测平台、联合申报平台、科研协作平台。

(1)信息资源共享平台。包括高校内部部门之间的数据共享(比如科研-财务数据中的预算信息、经费支出信息、经费结余信息、合作单位信息等共享),科研-人事数据共享(含人员的调离-退休信息,引进人才质量与科研业绩情况之间的互动反馈,人才职称评定与科研成果之间的关联关系等),政产学研之间的信息共享,科研仪器等资源共享。提供需求信息、技术转移转化信息、教师的科研成果信息的发布机制,用户在服务平台上发布信息,提供信息检索、智能申报推送、个性化推荐等服务。

(2)动态数据监测平台。从项目预申报、立项、过程管理、经费使用到结题验收的全生命周期的日常审批及知识产权、科研成果、科研机构管理全流程动态数据监测平台,实时掌握科技发展动态。包括对经费使用情况、阶段性科研成果、结题成果及结余经费情况,进行公开公示;对科研人员的离职退休情况,高水平人才的流失情况进行预警分析,高效运营人才引进,科学谋划人才布局。

(3)联合申报平台。指在高校重大项目、奖项、平台的申报期间,高校、企业、研究机构之间可以快速查询相关领域专家,积极主动组建科研合作团队,实现优势组合。高校之间、研究机构之间充分发挥多部门协同、跨部门联合作战,突出优势资源整合,推动跨领域、跨单位整合创新。

(4)科研协作平台。指提供信息共享、协作研讨和联合技术攻关平台。比如新冠肺炎爆发期间,按照中央应对新冠肺炎疫情工作领导小组的部署,在国务院应对新冠肺炎疫情联防联控机制统一安排下,科技部会同卫健、药监、教育等12个部门组建科研攻关组和14位院士专家组成的专家组,聚焦临床救治和药物、疫苗研发、检测技术和产品、病毒病原学和流行病学、动物模型构建5个主攻方向的重点任务,紧扣湖北武汉等抗疫一线救治的迫切需求,部署47个应急攻关项目,全力开展疫情防控科研攻关[15]。

应用层包括科研人员画像系统、学科评估系统、人才评价系统、专家推荐系统、智能申报推送系统等。

2 云共享科研系统的应用平台建设思路

2.1 基于多源数据融合的学科生态布局系统

美国学者伯顿·R·克拉克认为,由学科和事业单位共同组成的学术组织形成了一种特殊的矩阵结构[16],学科是大学最基本的运行单元和最基层的学术组织单位[17]。学科水平与大学发展水平之间呈高度正相关,学科水平在很大程度上影响大学的国际地位和学术声誉[18]。高校十分重视学科的发展,很多学者提出建设一流学科的评价指标,周光礼提出建设世界一流学科应以“学术队伍、科研成果、学生质量、学术声誉、社会贡献”等维度作为衡量学科发展的关键因素[19]。学科建设应该充分尊重学科生态的共生性和学科发展的不均衡性,学术组织在制订学科规划时应该维持不同学科之间交叉、渗透,促进形成学科网络及学科群落,避免扶植一个学科消弱另一个学科的做法[16]。

在科研管理系统云平台架构中,搭建学科评估系统(见图3)。根据人才的学术专长和研究领域所在的学科,科研成果所属的学科,可以区分不同学科领域标签。学科评估中,利用大数据的分析方法,将科研成果、人才培养、师资队伍、社会服务等多源指标数据通过实体融合、实体对齐、模式匹配等技术进行数据集成[20],从学科条件、学科发展环境、学科产出等综合评估学校目前的各个学科发展现状,通过比较K-平均、K-均值等划分聚类分析方法和基于模型的聚类方法,如神经网络方法,获取最优分类器。将各学科分类为优势学科与弱势学科、优秀学科与潜力学科等。根据学科的分类结果,尊重学科的专业性和综合性,选择学科分化、学科综合或者学科交叉方式,促进学科的发展。在今后的学科布局过程中,重点培育优势学科,进行资源倾斜,以优势学科为点,以点带面,从线到片,带动高校学科群的建设,依此推动高校科研发展。科研管理平台上的学科评估系统,将会推动高校决策人员前瞻性地思考大学的学科系统结构,立足优势学科、挖掘潜力学科、扬长补短,构建多元发展、多级支撑、优势突出、结构合理、创新驱动的新型学科体系结构。

图3 基于云平台学科评估布局系统构建过程

2.2 基于多源数据融合的科研人员评价系统

2020年2月,教育部、科技部印发了《关于规范高等学校SCI论文相关指标使用 树立正确评价导向的若干意见》,通知明确要求破除“唯论文”等不良导向,打造中国高质量科技期刊。国家部委提出“破五唯”之后,人才评价模式需要发生转变,改革人才评价导向机制,教学、研究、服务等方面也将纳入绩效考核。肖小溪、周建中提出质量评价和绩效评价两种科研人员评价模式[21],很多学者应用聚类-因子分析、层次分析方法等,客观定量的科学计量指标,对科研人员进行评价[22-23],刘学等提出在评价主体方面,指令性项目承担者由任务绩效评价,成果转换项目承担者由市场评价,基础研究项目承担者由同行评价[24]。因此,在科研系统中,将服务经济社会发展,推动科技成果转化,同行专家评价等信息纳入数据来源层。

科研人员的评价,应包括师德师风、学术能力和学术专长,科研人员评价系统见图4。在科研系统建设中,首先将各类人员数据信息整合,利用聚类分析技术,可以根据人才的年龄结构和科研学术能力等,设置K值为2,将科研人才分类为青年拔尖人才和骨干顶尖人才;利用孤立点挖掘技术,比如某位引进的年轻老师科研业绩特别突出,系统中赋予学术标签“科研卓越人才”。科研管理系统可以针对教师的发展现状,采用一对一的个性化分析,为每位科研人员提供科研未来的导引参考,提出今后人才发展战略,为科研人员的职业谋划提供优化方向,以期达到精细化智慧管理和精准科研服务。

图4 基于多源数据融合的科研人员评价系统

2.3 智能科技信息推送服务

智能申报推送系统的数据层来源于云端数据资源池,这是实现个性化推荐的关键,包括科研人员的科研行为数据,也包括企业的技术需求信息和申报指南信息,历年立项项目信息,分别构成User、Item、Event三张表。具体的推荐过程如图5所示:首先,进行基础的数据计算,完成科研项目和科研人员的特征工程。其次,进行推荐算法的选择,即数据策略层,完成数据的召回和排序,遴选出要推荐的候选集合。纵向项目申报推送平台的数据召回,根据申报通知中的限项条件、职称要求、年龄条件等;横向科研项目申报推送平台,对接企业的技术需求和合作意向,项目评审专家推荐,根据评审项目的研究内容、学科分类等,进行关键词检索、信息提取、自动摘要等自然语言处理(NLP),通过协同过滤(CF)、奇异值分解(SVD)、混合矩阵分解(HMF)、Item2Vec和最简单的人工规则,以及深度神经网络(DNN)等模型进行数据召回。推荐数据的排序,结合科研人员的特征工程和标签体系,通过快速定位匹配可能潜在的符合申报条件的教师,个性化推荐给相关申报老师、企业研发人员或国家科技部、教育部等专家评审系统。

图5 基于云平台的科研申报个性化推荐系统构建过程

个性化推荐的过程中建立中外合作单位信息库,促进学校教师与企业、国际合作的概率,加强合作交流,更好促进学校科研成果的转移转化,充分发挥管理人员的沟通交互的桥梁作用。科研专家推荐与申报推荐类似,都是利用大数据技术实现个性化的推荐。主要是向企业、政府机构推荐相关的评审专家、相关领域的技术专家系统。例如企业的技术需求“工业视觉检测技术研究,包括摄像头、多视频显示控制界面、应用于机械臂抓物”,企业发布的信息,利用数据分析方法中的监督学习进行分类处理,确定归属的学科,一级学科控制科学与工程,二级学科模式识别与智能系统。科研管理系统中,检索相应学科的研究人员,再根据人员的学术专长、近期的科研成果、绩效业绩、同行评价等数据进行算法排序,将最优的科研人员或者科研团队推荐给企业,推动企业的精准出题。不断深化高校—政府—企业—研究机构之间的高效协同,促进企业产业端与高校技术端的精准对接,促进政产学研数据实现互联互通和科研资源的高效协同。

2.4 数据驱动的科研决策辅助分析

科研项目包括教师申报科研管理中的上级主管行政部门下达的科研项目,教师申报的企业事业单位委托的项目,也包括教师申报的科研奖项、科研平台等。以国家自然科学基金青年基金项目为例,从云平台获取科研人员的多源数据,分析人员的年龄、性别、职称、毕业的院校、在校期间发表SCI/EI论文数、在研的厅市级项目数、在研的省部级项目数、发表SCI/EI论文数、授权发明专利数、培养学生数、授课数等人员属性数据进行数据处理,实现二元化和离散化,如表1所示。对已立项的国家青年基金项目数据进行关联分析,找到数据之间的关联规则,通过计算置信度和支持度来评估关联规则,完成剪枝候选项集,建立频繁项集。其中国家自然科学基金青年基金的的立项作为固定项,其他人员属性数据作为组合项,探究这些项之间的关联规则,通过关联分析,挖掘项目立项和科研人员某些属性同时出现的规律和模式,从而对今后的人才引进提供参考,对科研规划提供辅助性决策意见。

表1 二元化分类和连续属性离散化后的国家自然科学基金青年基金项目数据

科研项目立项数关联分析也可以用于科研申报项目立项率的预测。根据历年科研项目中的立项信息,建立了科研项目立项的关联分析,可以预测科研人员申报的立项率。对科研管理人员,对于重点、重大的科研项目成果的申报,可以根据历年立项的科研成果中科研人员信息进行特征提取和特征选择,从而获取科研人员的特征工程,通过机器学习完成数据建模和分析,预测哪些教师获批立项的概率大,从而重点关注和有效组织科研人员进行申报。

2.5 科研管理云平台用户画像系统

随着互联网技术的快速发展,“用户画像”广泛用于企业的产品设计和产品运营,由此驱动产品智能。科研人员画像系统,如图6,是基于科研系统的基础数据,探究这些信息之间的相互关系,将隐藏在教师承担的科研项目、科研成果、科研平台等背后的信息,转化为显性的知识,同时结合教师的科研学术经历信息、科研社交数据、服务地方信息、同行专家信息,实现知识共享和创新,赋予科研人员不同的标签。同时结合高校信息中心中的科研人员的人才培养情况、学术交流情况、学术兼职情况以及应用支撑平台,进行数据分析与挖掘,建立统一的科研人员信息描述框架,形成科研人员研究领域的查询统计、学术评价和标签体系。

图6 科研人员画像系统构建模式

疫情期间,正值国家社科基金和国家自科基金,两大基金的申报时间。很多教师受疫情影响,申报项目的科研合作受限。学校发展对创新型人才、复合型人才的需求越来越高,学科交叉越来越频繁,通过科研人员画像系统,科研管理人员可以充分把握学术发展的内在规律,质与量并重,构建学校的学术评价体系,解决教师申报过程中找不到相关领域专家的难题。

3 结语

很多高校的科研系统,教师使用访问频率并不高,如何充分利用大数据的数据挖掘优势,综合学校的科研能力、科研潜力、科研方向的分析,使科研人员切实体会到大数据驱动的科研管理的高效率、高质量的精准服务,立足科研人员、科研团队成员和教师的专业特长与学术特点,尊重学术群体的主体地位,努力为他们提供个性化的学术研究服务,将是今后科研管理系统建设的重点。科研管理系统作为高校科技工作战略决策关键的一环,在大数据时代,应逐渐意识到使用大数据的潜力和对常规化的业务流程工作的优化所起的重要作用,因此在系统建设中,更加突出以人为本,强调科研管理的主动性、能动性、精细化管理。一方面充分利用大数据带来的技术革新,将科研日常性工作流程打通,减少常规性工作中工作量的消耗;另一方面,辅助科研管理人员将更多的精力投入到顶层设计谋划中,瞄准世界科技前沿,聚焦国家重大战略需求和地方发展需要,突出基础性、战略性、引领性,为教师提供个性化精准服务,为高校科研工作高质量发展提供有力支撑。

猜你喜欢

科研人员申报学科
“少年工程院活动校”暨“航天未来人才培养校”共同申报
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
【学科新书导览】
科研人员揭示油桃果实表皮不长毛的奥秘
科研人员破译黑猪肉特征风味物质
土木工程学科简介
国际收支间接申报问答
企业科研人员激励问题及对策研究
“超学科”来啦
借问学科哪家强?尽言洄服有良方