APP下载

科学数据出版内容与案例分析

2018-02-20孔丽华邵明玥

数据与计算发展前沿 2018年6期
关键词:论文期刊学科

孔丽华,邵明玥

1.中国科学院文献情报中心,北京 100190

2.中国科学院计算机网络信息中心,北京 100190

3.中国科学院大学,北京 100049

4.北京师范大学,北京 100875

引言

我国国务院 2015年发布的《促进大数据发展的行动纲要》[1]中明确提出“积极推动由国家公共财政支持的公益性科研活动获取和产生的科学数据逐步开放共享”。2018年3月17日,国务院办公厅正式通过并实施《科学数据管理办法》[2]。其中明确提出“主管部门和法人单位应积极推动科学数据出版和传播工作,支持科研人员整理发表产权清晰、准确完整、共享价值高的科学数据。”“科学数据使用者应遵守知识产权相关规定,在论文发表、专利申请、专著出版等工作中注明所使用和参考引用的科学数据。” 2018年12月举办的第14届柏林开放获取会议上,国家自然科学基金委、国家科技图书文献中心、中科院文献情报中心在会议上发布立场声明,明确表示中国支持 OA2020和开放获取S计划[3]。实际上,数据出版作为数据共享的一种重要模式,在国际上已经得到各国政府部门,项目资助机构以及出版界的广泛重视,涌现出来一批出版数据论文的期刊,本文重点针对这类期刊的出版内容进行调研,并对典型数据期刊进行案例分析,以期对数据期刊的出版情况进行了解,希望对我国在数据出版及数据共享方面的相关工作起到一定参考作用。

1 数据期刊发展现状

1.1 科学数据出版

科学数据的出版模式大致可分为以下三类:独立的数据出版,即在数据中心或数据知识库存储发布(不依赖出版物的数据发布)、作为论文辅助资料的数据发布(附属于出版物的数据发布)、以数据论文形式发布(作为出版物本身的数据出版)[4]。本文重点讨论的是第三种情况,即以数据论文形式发布的科学数据出版,是指科研人员与数据工作者按照规范的质量管理和控制流程,以数据论文的方式,通过互联网公开发布其通过观察、实验、计算分析等科研过程所产生的原始数据,或通过对已有的数据进行系统化地收集、整理和再加工后形成的数据产品,使得其他使用者能便捷地发现、获取、理解和再分析利用,且可在科研论文及相关科研成果中引用[5]。

1.2 科学数据论文

科学数据论文是对具有科学价值的某类或某个数据集进行规范化描述所形成的科学研究论文。是正式的学术论文,遵从学术发表规范,接受严格的同行评议[6],能够使数据更具发现性、引用性、解释性和重用性。数据论文应当提供数据集的描述细节,包括数据收集和加工处理方法、数据质量评估和验证的方法、便于理解和使用数据的相关信息等,但不包含新的科学假设,这也是与传统论文的最大不同。完整的数据论文出版应包括数据论文和对应数据集两部分,二者通过唯一标识符(DOI)实现一致性关联,经同行专家评议保障数据的高质量与可读性[7](图1)。

1.3 数据期刊发展现状

随着数字时代的发展,科学数据共享以及数据出版逐渐成为数据发布的新形式,数据出版期刊的数量也逐渐增加。目前科学数据出版的期刊主要分为两大类:一类是以出版数据论文为主的数据期刊(表1中Data Paper only 列 pure所示),这类期刊出版内容主要为数据论文(data paper)及其对应的数据集。另一类是同时出版学术研究论文和科学数据的混合型期刊(表1中 Data Paper only 列 mixed所示),该类期刊主要依托于传统的论文期刊,在论文出版的同时,接收该论文所使用的论文集合,或单纯收录数据论文与数据集。

图1 数据论文出版概念图Fig.1 Concept schema illustrating data paper publishing

基于国外的科学数据出版平台的相关信息统计[8],选取了26 本影响因子较高的期刊,统计得到如下科学数据出版期刊对应的学科领域划分(表1)。

对于表格中统计的26 种期刊进行分析,其中纯粹发表数据论文的期刊有13 种,同时发表传统论文与数据论文的期刊有13 种。同学科在出版的数据类型上也存在很大的差异,如:地学[9]、物理学[10]数据较多关注测绘测量观测的基础学科数据的再加工;医学[11]数据包括对于基础数据的临床案例的数据收集和分析、医学研究过程中的医学记录等;心理学[12]侧重于心理实验过程产生的用户数据等;软件和计算机[13]数据的出版包括算法思想等代码、编程数据。对期刊出版的数据出版情况及所属学科进行统计结果见图2–3。

2 典型数据期刊出版数据内容分析

2.1 年度出版情况

基于数据期刊的出版数据内容分析,可深入了解出版数据的学科占比、数据来源等内容。本文以Scientific Data[9]、Earth System Science Data[14]、GigaScience[15]三本具有代表性的数据期刊为例,具体统计分析这些数据期刊在Web of science 数据库中收录统计的发表数据论文量、数据被引频次、h指数、数据学科占比、数据来源国家占比、数据来源机构占比。

表1 科学数据出版平台出版类型与学科Table1 Types and disciplines of scientific data journals

图2 统计源期刊发表数据论文量年度增长趋势Fig.2 Annual growth of data papers published in source journals(in quantities)

图3 统计源期刊数据出版所属学科占比Fig.3 Disciplinary distribution of data papers published in source journals(in proportion)

2.2 Scientific Data 出版科学数据内容分析

我们进一步对Scientific Data 发表数据论文情况展开,对数据集项目来源和学科分类进行统计,如下图(图5-7)所示。

通过统计可以看得出数据出版在科研领域已经得到广泛认识,各个机构和学科的数据发表需求逐渐增强。

3 我国在科学数据论文出版的实践

近年来,我国在数据论文与数据期刊方面也做出了具体实践。包括2015年由中国科学院计算机网络信息中心主办的《中国科学数据(中英文网络版)》[16]和2017年中国科学院地理资源研究所主办的《全球变化数据学报》[17],还有2018年由国际数字地球学会、中科院遥感地球所、英国 Taylor&Francis 出版集团等联合出版的国际学术刊物《地球大数据(Big Earth Data)》[18]等的以数据论文发表为主的数据期刊的出现,以及部分期刊专门设置了数据论文专刊,对相关数据集进行描述和发布。

3.1 《中国科学数据(中英文网络版)》数据论文出版

《中国科学数据(中英文网络版)》(China Scientific Data,简称《中国科学数据》)是2015年国家首批批复创办的网络连续型出版物的试点之一,是中国第一本面向多学科领域科学数据出版的学术期刊,由中国科学院计算机网络信息中心主办。期刊致力于科学数据的开放、共享和引用,推进科学数据的长期保存与数据资产管理,探索科学数据工作的有效评价机制,推动数据科学的发展,促进科学数据的可发现(FINDABLE)、可访问(ACCESSIBLE)、可理解(INTELLIGEBLE)、可重用(REUSABLE)[19]。

自创刊以来,截止 2018年8月,期刊已经发表具有领域科学研究特色的数据论文 177 篇,重点关注生命科学与医学、地球系统科学、空间科学与天文学、物理学、化学化工、材料科学与工程、信息科学、社会科学等领域的基础数据及数据产品。论文发表学科统计情况如图8所示。

3.2 《全球变化数据学报》数据论文出版

《全球变化数据学报》是2017年由中国科学院地理科学与资源研究所创办的正式期刊。以全球变化科学研究领域(以地理科学、资源科学、生态科学、地理信息科学为重点)数据出版为核心内容,以高起点、高质量数据带动高影响度的科学发现,以期提高全球变化领域的数据质量和世界影响力。该刊与“全球变化科学研究数据出版系统”共同构成元数据、实体数据与数据论文关联一体出版。截止 2018年11月《全球变化数据学报》共计发表数据论文 159 篇,其中包含《地理学报》2014年增刊与全球变化科学研究数据出版系统联合发表的21 篇数据论文。

表2 数据期刊(典型案例)的数据出版情况Table2 Publishing and citation information of some typical data journals

图4 数据期刊(典型案例)年均发表情况和引用情况(数据统计截止到2018年7月)Fig.4 Annual average publications and citations of some typical data journals(by July 2018)

图5 Scientific Data 发表的科学数据来源国家及相应数据数量Fig.5 Country distribution of the datasets published in Scientific Data and corresponding dataset quantities

图6 Scientific Data 发表的科学数据来源机构及相应数据数量Fig.6 Institutional contributions to the datasets published in Scientific Data and corresponding dataset quantities

图7 Scientific Data 发表科学数据学科及相应数据数量Fig.7 Disciplinary distribution of the datasets published in Scientific Data and corresponding dataset quantities

图8 《中国科学数据》发表论文学科统计Fig.8 Disciplinary distribution of the data papers published in China Scientific Data

4 小结

数据出版作为数据共享的重要模式之一,近年来得到迅速发展。随着信息技术的快速发展,以及大数据时代下科研模式的转变[20],未来数据出版的需求会快速增长,如何能够高质量的发布数据,促进科学数据的开放共享还面临挑战,我们还需要完善数据出版中的作者贡献、数据版权、处理参数、数据格式、应用工具、数据引用、使用权限等方面的描述规范,需要完善科研评价体系,需要积极参加国际数据出版的活动,共享能力和资源。

猜你喜欢

论文期刊学科
期刊更名启事
期刊简介
【学科新书导览】
土木工程学科简介
期刊问答
“超学科”来啦
论新形势下统一战线学学科在统战工作实践中的创新
下期论文摘要预登
下期论文摘要预登
下期论文摘要预登