APP下载

高校科学数据共享的建设模式分析

2021-04-04

信息记录材料 2021年12期
关键词:机构科学建设

都 宜

(山西财经大学图书馆 山西 太原 030000)

1 引言

高校科学数据的管理、共享与再利用早已成为世界各国、各类机构和组织关注的焦点,同时,大学科研院所、科研资助机构、期刊出版社乃至国际组织等相关机构也都出台了关于科学数据管理与共享的相关政策[1]。例如,经济合作与发展组织(OECD)在《公共资助科学数据开放获取的原则和指南》(2007年)中指出:“公共资助的科学数据应在适当的范围内提供开放获取以实现共享”。早在2010年,美国国家科学基金会(NSF)就要求科研机构在本机构申请基金时,必须提供一份包含数据管理和数据共享的数据计划。而我国则在2018年1月23日审议通过了《科学数据管理办法》,对科学数据的管理与共享进行了原则上的规定。

科学数据的获取主要通过三种途径:一是研究者本人或团队通过实际观测、实验等方式获得实验数据;二是研究者或研究机构通过调查访谈等方式获取社会科学、人文科学类数据;三是通过引用其他研究者生产并进行共享的数据。在实际的科学研究工作中,通过前两种途径获得科学数据往往需要耗费大量的时间、精力、资金,并且还要考据到场地、设备、人员等因素,因此,引用其他科研人员已经生产并共享的数据成为众多科研人员的选择。

2 科学数据的概念及特点

2.1 科学数据的概念

科学数据是科学数据共享活动的客体,是共享平台建设的重要内容,不同的学者及共享平台对科学数据有着不同的理解与定义,而这些不同的理解与定义决定着科学数据共享的范围、方式和途径。

科技部在2006年发布的标准文件《科学数据共享工程数据分类编码方案(SSD/T2122—2004》将科学数据定义为:科学数据是指人类在认识世界、改造世界的科技活动中所产生的原始性、基础性数据,以及按照不同需求系统加工的数据产品和相关信息。2018年3月17日,国务院办公厅颁布的《科学数据管理办法》第二条:“本办法所称科学数据主要包括在自然科学、工程技术科学等领域,通过基础研究、应用研究、试验开发等产生的数据,以及通过观测监测、考察调查、检验检测等方式取得并用于科学研究活动的原始数据及其衍生数据。”

尽管各学者与机构对科学数据的定义不尽相同,但其仍有共同之处,如:科学数据基本属性为原始性、基础性;科学数据的产出领域大多为自然科学或科技活动;科学数据除原始数据外还包含由基础数据加工后的衍生数据。

但随着计算机及信息技术与传统艺术和人文领域(历史、哲学、语言学文学、艺术、考古和音乐等)的结合愈加紧密,产生了大量描述性、事实性数据及其衍生数据,这些数据与自然科学领域的科学数据一样,是数字人文科学研究的基础数据和原始数据,对科研工作有着重大意义,亟待被广大科研工作者获得并利用。

2.2 高校科学数据的分类

高校科学数据按照取得方式可以划分为:实验数据、观测数据、计算数据、调查数据。

高校科学数据按经费来源可划分为:纵向课题数据、横向课题数据、校内科研项目经费课题数据、自筹经费课题数据[2]。

高校科学数据按照数据的公开性可划分为:保密数据、部分保密数据、公开数据。

高校科学数按数据规模来看可以分为:综合类大规模科学数据、专项类小科学数据[3]。综合类大规模科学数据往往来自于较为宏大的科学研究项目,研究人员涉及多个国家、组织和多个学科,并有着大量的资金投入,因此这些项目基本都制定了完善的数据政策,有专人维护并发布相关数据。相比较而言,专项类小科学数据研究目标相对专一,项目资金有限,研究者通常由某个或几个高校的研究人员组成,因此,其数据资料常常缺乏完善的保存与管理,数据共享只能在有限的范围内展开。

2.3 高校科学数据的特点

2.3.1 高校科学数据具有多学科性

高校,特别是综合类高校,通常包含十几甚至几十乃至更多专业,各个专业所产生的数据类型繁多,形式各异,同单一科研所产生的数据相比,具有多学科的特点。

所指的科学数据既包含主流的自然科学领域的科学数据,也包含近年来兴起的人文科学领域的科学数据。尤其是对国际、国内纷纷建立的各种“数字人文”研究机构而言,人文科学数据使其研究获得了新的研究途径,迎来了新的研究范式。

采用GB/T 13609-2017《天然气取样导则》规定的方法进行取样[4],现场取样示意图见图1。取样钢瓶在实验室经过特殊处理,在取样过程中,由于压力的突降,取样管线和接头等部位可能造成节流,节流处会急剧降温,若不采取一定的措施则会造成重烃的析出、损失,导致取样不准确,使取到的样品没有代表性。因此,取样时应对取样探头、取样管线和取样阀等部位采取加热保温措施。

2.3.2 高校科学数据大多是专项类小科学数据

高校科学数据主要是来自于高校基于科研活动所产生的,通常由相关科研人员或课题组成员保管的科学数据,属于专项类小科学数据的范畴。这类科学数据单独看数据量不大,但是由于研究人员众多、研究项目广泛,因此数据积累起来总量非常惊人。但是,这些数据通常分散保存在项目组成员那里,没有专人维护。而通过科学数据共享平台,可以对这类科学数据进行有效监护,避免数据丢失,节约维护成本,实现科学数据的有效共享,从而进一步挖掘科学数据的科研含量。

2.3.3 高校科学数据形式具有多样性

高校科学数据共享平台的共享数据可以包括教师和学生的研究数据、未公开发表的学生学位论文、教师科研人员的课题成果、校内教师著作(专著和合著)、数据集、灰色文件等,文件格式包括但不限于数据、文本、音频、视频和图像等多种形式。

2.3.4 高校科学数据连续性较差

高校的科学数据大多依附于课题产生,课题结束,科研数据的产生也就随之终止,由于各类课题持续时间有限,科学数据的产生通常随着课题的结束而结束,因此高校科研数据的连续性较差。

科学数据生命周期的理论众多,尽管细节处略有区别,但总的来说,科学数据的生命周期从数据计划开始,经历数据的分析、运用,最后到数据的发布、共享3个阶段,高校乃至我国学术界对科学数据的利用都是不完整的,尤其缺乏前期对科数据的管理计划和后期的数据发布共享阶段,科学数据流没有形成完整的回路,导致了科学数据的生命周期不完整,使众多的科学数据被封存在计算机内,无法被利用。高校科学数据共享平台建设的目的就是通过提供一个数据共享的生态环境,帮助高校科研人员管理数据、运用数据和共享数据,完善并延长科学数据的生命周期,发挥数据的价值。

3 高校科学数据共享的重要意义

3.1 科学数据共享能够促进学术界的交流和传播

科学数据通过在特定平台上开放共享,高校研究人员可以通过网络方便获取资源,科学数据发布平台的内容资源是及时更新的,具有动态性。数据提交者将自己研究产出的科学数据上传到发布平台,并可以根据研究进度对数据进行动态的补充和修改。而其他研究者可以通过平台与数据共享者进行交流,从而产生了一种新的学术交流形式,增加了研究人员之间的信息交流,缓解了信息获取失衡的问题,实现了数据资源的共享和利用,促进了学术的交流和传播。

3.2 科学数据共享有助于提高高校科研机构的学术地位和影响力

高校研究机构通过收集、保存、传播和共享本校师生的科研成果,并将其作为一个整体,系统、完整地进行展示,其他科研人员通过对高校科学数据平台所发布的数据资源进行研究、引用和再利用,可以在利用数据的同时了解到该高校的科研水平和科研进展,进而对其科研成果产生一定的评价,间接地提升了高校学术地位和影响力。

3.3 高校科学数据共享有助于提高研究人员的学术声望和影响力

高校对科学数据及其描述文档以标准化的形式长期保存,一方面为研究人员提供了一个便捷的科学数据交流和共享的平台,另一方面加强了对科研数据的传播和再利用,通过对科学数据进行共享,有助于提高研究人员的学术声望和影响力。

4 高校科学数据共享的建设机制设计

高校科学数据共享的建设模式通常包含高校自建共享平台、高校与其他机构合作建设共享平台、委托第三方建设共享平台等方式。

4.1 高校自建共享平台

高校自建共享平台是指由高校自行开发、研究、建设、管理以及维护科学数据共享平台。能够自建共享平台的高校通常都是综合类大学,具有较强的计算机、信息技术类专业水平以及较为广泛的学科分布,用于共享的科学数据能够达到一定数量,参与共享的人员达到一定规模。自建平台能够基于本校的科研需求专门设计,较好地满足本校科研人员的特殊需求。如美国密西根大学的ICPSR社会科学数据共享平台是根据具体需求而专门定制开发,应用至今已有二十多年的历史[4]。

4.2 高校与其他机构合作建设共享平台

与其他机构合作是高校建设共享平台中较多采用的方式。其他机构可以是其他高校、科研机构、社会机构、数据库公司等。高校通过与其他机构合作,共享平台可以获得更多的技术支持、资源支持、资金支持以及政策支持,使共享平台从共享主体、共享客体乃至建设效果上产生的倍加效应远远大于高校自建的效果。如哈佛大学和麻省理工学院联合创建的哈佛—麻省理工数据中心[5];复旦大学社会科学数据研究中心则是与哈佛大学的Dataverse Network系统开展了全面的合作。

4.3 委托第三方建设共享平台

在这一建设模式下,高校不参与平台的具体建设,而是根据自身的需要选择不同的平台,或向平台建设机构提出自己的建设要求。在这一模式下,高校只需在选择阶段进行细致的调研,而无需进行本地开发与服务器的维护,可以节省大量时间成本、人力成本和费用等,能较快地的将自身数据接入共享平台。同时,共享平台为所有合作的机构提供统一的检索界面,方便高校师生检索利用数据。如英国的Figshare平台,该平台可以为用户提供简便友好的用户界面,展示机构的所有研究成果,衡量机构研究成果的学术影响力,并集成到已构建成功的共享平台中。目前,世界多所著名大学和出版机构正在接受Figshare服务。

以上3种建设模式各有优缺点,不同的学校可以按照自身实际情况选择适宜的共享机制。就我国已经开展科学数据共享的高校而言,与其他机构合作建设共享平台或委托第三方建设共享平台。

目前,我国高校科学数据共享平台建设正处于起步阶段,可以结合科学数据的特点和数据使用者的需求,充分借鉴国外高校已经发展较为成熟的平台建设经验,从顶层设计开始,分级规划、统一标准,加快推动我国高校界的科学数据共享平台建设。

猜你喜欢

机构科学建设
自贸区建设再出发
点击科学
科学大爆炸
基于IUV的4G承载网的模拟建设
《人大建设》伴我成长
保障房建设更快了
一周机构净增(减)仓股前20名
一周机构净增(减)仓股前20名
一周机构净增仓股前20名
一周机构净减仓股前20名