APP下载

国家高端交流平台建设体系及其开放科学实践策略*

2021-04-19祝忠明

图书与情报 2021年6期

祝忠明

(1.中国科学院西北生态环境资源研究院 甘肃兰州 730000)

国家“十四五”规划和2035 年远景目标纲要指出,“十四五”时期,我国经济社会发展进入以高质量发展为主题和根本要求的新发展阶段,科技创新和科技自立自强居于国家建设发展全局的核心地位,将发挥推动高质量发展的战略支撑作用。 针对国家科技创新体系本身的高质量发展, 纲要进一步提出了强化国家战略科技力量,建设一系列重大科技创新平台的部署。 构建国家科研论文和科技信息高端交流平台(以下简称“高端交流平台”)即是重大科技创新平台建设的重要内容之一,充分体现出高质量科研论文和科技信息作为支持科技自主创新核心战略资源的作用和意义。

本文将主要结合高端交流平台概念提出的背景,在明确其建设内涵、定位和作用基础上,提出国家高端交流平台建设的基本框架和体系;并从全球学术交流体系向开放科学交流体系变革的趋势出发,重点讨论高端交流平台实施中的开放科学实践内容和策略。

1 高端交流平台的建设内涵及定位

1.1 高端交流平台的内涵界定

高端交流平台是国家“十四五”规划纲要关于国家科技信息交流平台高质量发展的一种定位、方向和安排。 从纲要中正式出现这一新的提法和概念以来,有关高端交流平台建设的研究和讨论,已成为近期科技情报界和科技出版界共同热议的话题。 正确理解和界定高端交流平台的内涵,是对其建设内容、模式、标准、政策、策略和技术等进行有针对性的研究设计,促进形成各种具体落地实践方案的基础保证。

“高端”一词通常为一个与品质或价值有关的相对性概念,有较为广泛的应用场景。根据高端平台交流平台提出的背景和目标,可以将其定义为面向科技领域高端信息交流需求、服务高层次科研用户、组织高质量科技信息、支持高水平开放交流模式、提供高级知识服务的科技信息交流平台。

(1)面向科技领域高端信息交流需求,是指高端交流平台主要面向事关国家安全和发展全局的基础核心领域、重大科技前沿领域、以及国家急迫需要和长远需求的关键领域,瞄准和保障这些领域原创性、引领性研究和科技攻关等重大科技创新活动的信息交流需求;(2)服务高层次科技用户,是指从事重大科技创新活动的科技团队、科学中心、创新基地、国家实验室等高端交流平台的优先服务对象,亦即重点服务于国家战略科技力量;(3)组织高质量科技信息,是指高端交流平台的知识内容主要来自高影响力科技期刊和高水平学术会议的科研论文,重大科研活动产出的高质量科学数据,以及关联组织高质量科学成果涉及的各种关键科技信息等;(4)支持高水平开放交流模式,是指高端交流平台对科研成果和科技信息的报道、组织、发现和传播,应以开放科学原则和导向,支持全方位深层次的开放共享,实现及时、快速和便捷的高效率交流,并坚持将国际高质量科研成果和科技信息的“引进来”与国内高水平科研成果和科技信息的“走出去”相结合的双向开放实践策略,形成国内国际双循环相互促进的科技信息交流平台新发展格局;(5)提供高级知识服务,是指高端交流平台提供的服务超越基础性的信息交流服务,重点提供基于科研活动生命周期的知识关联汇聚、发现与融合、计算与分析等智能性知识服务。

高端交流平台是我国“十四五”时期在科技信息交流平台领域贯彻高质量发展战略导向的具体体现,也是国家科技创新体系新发展格局对高质量科技信息交流支撑平台的必然要求。某种程度上,它是一个具有高度针对我国高端科技信息需求和具有高度中国化语境特征的概念。 但在国际对比研究和讨论语境下,具备组织高质量科技内容、提供高级知识服务的国际科技信息交流平台亦可视为一般意义上的高端交流平台。

1.2 高端交流平台建设的定位和作用

从当前国内及国际科技竞争环境和发展态势来看,国家高端交流平台的建设具有多重定位和目标。主要如下:

(1)满足高水平科技创新信息需求,发挥高端科技信息交流保障作用。 高水平科技创新需要高水平科技信息交流平台的支撑和保障,当前国内高水平科技信息的交流保障和服务能力存在明显的短板。一是中国高水平科技期刊数量较少,不能满足国内高水平科研成果的发表需求,大量高水平科研成果持续流向国际一流期刊;二是国内学术数据库商主要局限于国内成果的汇聚服务,不能满足国内科技界对国际高水平科研成果的利用需求,只能长期高成本引进国际主流学术数据库,包括对国内高水平科研成果国外发表后的二次引进。 新发展阶段,我国将构建和强化以国家实验室、 国家科学技术研究开发机构、高水平研究型大学、科技领军企业为重要组成部分的国家战略科技力量,并将在若干重大基础核心领域、科技前沿领域、以及领域关键核心技术方面,实施原创性、引领性科学计划和科技攻关工程,对高端科研成果和科技信息的交流和供应提出了更高保障要求。围绕战略性科技力量以及重大科技攻关工程的实施, 提供高质量科技信息的供应和交流保障,这是国家高端交流平台建设的首要动因和目标,也是将其建设提上议事日程的关键机遇期。

(2)争取与我国科技实力和国际地位相匹配的科技话语权,发挥深入参与全球学术交流治理的作用。 我国经济社会发展在国际分工体系中总体上仍处于价值链和创新链的中低端地位,科技信息交流领域也基本如此。高水平科技期刊、高影响力科学数据中心、权威科技信息发现分析平台等,基本上都被国际机构所垄断或主导。随着我国科技投入、科研队伍和科研成果产出的规模已跃居国际前列,整体科技实力得到显著提升,实现从国际科技信息交流分工体系价值链和创新链的中低端向高端化提升发展,取得与我国科技实力相称的应有地位,理应成为我国高水平参与国际科技信息交流大循环应有的发展逻辑。更重要的是,高水平科技期刊体系在某种程度上扮演和发挥着事实上定义和引领科技发展格局的角色与作用,而我国的科技期刊数量占国际科技期刊总数的5.1%,SCI 收录的中国高水平科技期刊数量占比只有2.6%,与我国在全球高水平论文产出中已经占到28.3%的体量和实力极不相称,使我国科技期刊系统在全球科技创新成果的报道、交流和引领发展中的话语权能力较弱。 结合国际开放科学交流的大趋势,进行国家高端开放性学术期刊体系在数量规模和质量水平方面双向提升建设,将在积极推动全球学术交流版图的重塑,争取国际科技领域的话语权、引领发展能力和竞争优势,主动参与全球科技治理等方面,充分发挥关键抓手作用。

(3)形成国家高端战略科技资源体系,发挥科技信息安全保障作用。谋划高端交流平台建设,也在于要构建自主可控的国家战略性科技信息资源安全保障体系。目前,国际大型科技出版商和数据库商已经形成对高端科技信息交流服务的垄断局面,当前国际上出现的逆全球化现象对我国高端科技信息安全供应带来潜在风险。 特别是美国为扼制我国高科技发展采取的一系列脱钩政策和行动,不排除延伸扩展到科技信息交流的领域,对我国高端科研成果和数据获取进行“断供”。 因此,高端交流平台的建设,一要通过重点加强国内高水平期刊和数据中心的建设,促进我国科研人员产出的高水平科研论文和科学数据的回流,并吸引国际高水平科技成果和数据的流入;二要重视对国内尤其是国际高端科研论文和科学数据进行符合长期保存国际惯例的备份保存和应急服务机制。

2 高端交流平台的建设体系

面向重大科技创新活动的高端交流平台,是对当前国内科技信息交流平台体系的优化升级和拓展提升建设。 其完整的体系建设,是一个多元化、分布式、专业性、开放性的科技信息保障体系,包括高水平科技期刊、高影响力数据平台等组成的支持科研论文和科学数据发表(布)的学术交流平台,以及支持高水平科研论文、数据、以及权威性科技信息融汇集成和挖掘分析的科技信息服务平台,是一个围绕高端科研成果和信息的出版、交流、发现、长期保存等学术交流生命周期的知识生态系统。 其核心在于构建科技信息交流领域的双一流工程——建设世界一流的出版交流平台或科技期刊群(一流科技成果的交流和传播)和一流的科技知识服务平台(一流科技成果的汇聚和集成服务)。

高端交流平台体系建设发展的基本框架(见图1),它由4 个子平台体系组成。

图1 国家高端交流平台体系建设框架

2.1 国家高端出版交流平台体系

以提供高端科研成果和数据出版和交流服务功能为主,包括国家高水平科技期刊群、国家高端开放出版平台体系、国家科学数据中心体系和国家高端科技报告平台体系。

国家高水平科技期刊群的建设,事关我国全球科技话语权和全球科技创新发展引领能力建设。我国在世界一流科技期刊体系中仍然处于数量规模小、质量影响力整体较弱的状态,入选SCI 的中国期刊只有225 种,影响因子平均值为0.869。近年来国家出台了一系列推动本土期刊向国际一流期刊提升发展的政策和计划,我国SCI 期刊的学术影响力指标有较为显著的提升,但其年均载文量却有明显下降趋势。因此,建设世界一流中国科技期刊体系仍将是国家高端交流平台体系建设的重中之重。

国家高端开放出版平台体系主要瞄准国际学术交流体系加速向开放科学交流体系转变的趋势,推动以开放科学原则和FAIR 原则进行开放出版平台的布局,支持开放获取期刊、预印本、数据出版、多元科学产出融合出版等,开展开放同行评审、开放评价等开放科学交流实践。 在新型学术交流体制转型重塑过程中,争取获得与国际同步的新的出版力量布局、科技话语权、学术治理贡献和引领发展能力。

国家科学数据中心体系的建设,是实现对国家重大科技创新活动中基础性、战略性科学数据资源进行充分汇集、开放共享和长期保存的关键基础设施。特别是在开放科学体系下,开放数据已经成为与开放科研论文同等重要的科学产出。近期,我国已启动建设了“国家高能物理科学数据中心”等20 个国家科学数据中心、“国家重要野生植物种质资源库”等30 个国家生物种质与实验材料资源库。 未来仍然需要继续加强国家数据中心体系的建设完善,产出高影响力科学数据库、数据集和数据仓储等,弥补与国际科学数据建设领域存在的差距,改变在关键核心科学数据领域话语权不足的局面。

国家高端科技报告体系的建设,主要围绕国家重大项目和科技创新活动产出的高水平科技报告的构建数字化专门化的平台,支持其汇集和共享利用。从2014 年出台国家科技报告制度政策以来,已启动建设国家科技报告服务平台,一些地方也建立了地方科技报告服务系统,在国家及地方重点科技项目报告的汇缴和服务方面取得了积极效果。 国家高端科技报告平台的建设,应主要依托现有的基础,重点进行高水平科技报告的精选,强化国内科技报告国际传播和影响力。

2.2 国家高端科技信息资源体系

主要由提供高端科技信息资源保障功能的各个数据库组成,包括高水平科技论文数据库、高影响力科学数据库或数据仓储、高质量科技报告数据库、高水平专利数据库和战略科技信息资源长期保存系统等组成。

高水平科技论文数据库、高影响力科学数据库或数据仓储、高质量科技报告数据库等与国家高端出版交流平台体系相应的子平台的建设,在一定程度上属于一体两面,各个数据库的数据知识资源首先即来自相关的出版交流平台。同时,各高端科技信息数据库必须要纳入对国际高水平科技成果和科技信息的采集组织,以形成对国内国际科技信息领域“两个市场、两种资源”的充分集成利用。高水平专利数据库平台的建设,主要围绕领域关键技术创新的专利服务需求,重点进行国内国际高水平发明专利的筛选组织。

战略性科技信息资源长期保存系统主要对各高端数据库内容进行统一长期保存。 2014 年,国家科技图书文献中心启动了国家数字科技文献长期保存体系建设,作为国家科技资源的战略保障平台,已经对引进的68 家出版社的数字科技文献数据库进行了协议性长期保存,以满足因网络攻击、技术故障、人为失误、地缘政治等可能造成出版社无法提供服务的情况下,可以应急启用长期保存资源提供相应的服务。在国家高端交流平台体系建设中,需要在此基础上重点加强和完善对高端科研成果和科技信息实施全面性长期保存。

2.3 高级知识服务平台体系

主要由提供高端科研论文和科技信息集成、发现和分析等高端知识服务功能的各子平台组成,包括高端性的知识发现服务平台、综合性学科资讯平台、虚拟学术社区、以及科学引文与影响力计量服务的平台。

高级知识发现服务平台是在高端科研成果和科技信息资源基础上,围绕科研活动全生命周期,构建和提供各种融合知识发现和知识计算能力的智慧性知识服务。包括在平台中无缝集成各类工具,以支持科研人员从文献查找、发现项目机会、跟踪研究动态、进行科研实验、发布研究成果、共享研究数据、监测其工作影响等的科研活动,以全方位地对科学活动进行支持;利用人工智能技术,从大规模文本或数据集中进行知识的识别、分类、标注、知识图谱关系构建等知识内容的提取和精细整编,提供高价值的知识服务产品;以及融合知识建模、知识发现与情报计算方法,从信息的检索获取转向知识内容的深度挖掘和分析,构建知识网络、进行态势感知、发现隐含知识、开展科研画像服务等。

高端性综合性学科资讯平台是对传统学科信息门户建设模式的升级。主要围绕前沿学科领域,以信息自动监测技术方法为主,通过建立对信息资源学科主题进行相关性评价和权威性计量的可计算模型,实现领域各类型权威信息的采集和集成,并提供符合上述高级知识服务平台功能特性的知识服务。其资讯收录范围以学科领域为主要边界,覆盖内容类型广泛,包括重要研究成果(论文、专著、专利、报告等)、重要新型产出(数据、软件、实验手册、科学视频、学术博客等)、重要学术信息(项目、专家、机构、期刊、会议等)、甚至重要产业技术信息(如产业政策、技术、企业等)。

高端虚拟学术社区的建设,以学术社交网络平台为主的专业领域虚拟学术社区为主,主要面向高层次科技创新用户, 提供非正式科研学术交流的互动网络平台,在跟踪前沿研究、共享研究成果、建立学术关系网络、构建学术身份、促进互动交流、提高个人成果传播和影响力方面发挥积极作用。

新型科学引文与影响力计量服务系统的建设主要在于“建立中国特色、具有国际影响力的‘科学引文索引’系统”。 科学引文索引系统SCI 在核心期刊筛选、高影响力论文、科学家、机构、国家等科技绩效评价中发挥了积极的作用。但“SCI 至上”在学术评价、绩效考核、科技资源配置中已经产生累积性的负面影响,SCI 本身存在的基于表面性引用次数、 自引用、统计显著性成果、作者权威性、期刊影响因子、区域等引用偏见问题,开放科学发展引发的开放计量和评价趋势,以及中国科技评价转向以“创新质量、绩效和贡献”为核心的一系列改革措施的出台,都对建立新型的科学引文与影响力计量规范、方法与指标体系提出了新的要求。新型科学引文与影响力计量服务系统,需要覆盖更多的科学产出,深入到基于内容的分析,综合多种学术利用行为,开放评价和计量过程及结果,使科学引文计量和评价的作用得到科学合理地发挥。

2.4 重要基础设施性科技信息资源体系

主要由支持科技知识信息关联融合利用服务实现的各种基础设施性资源库组成,包括高级科技专家库、重点科技项目库、重要科技机构库、国家科技术语库、以及国家科技信息资源持久标识符体系组成。

科技专家、项目、机构和科技术语是科研过程中广泛关注和利用的综合科研信息,通过系统收集和组织这些信息,建成背景知识库,为科研信息的组织趋向知识图谱驱动的多模态关联和情境化开放组织应用,提供可靠、规范、一致化的背景知识基础,可以更好地服务科技创新活动。

国家科技信息资源持续标识符体系的构建,将在实现科学信息和实体的开放关联组织中发挥中枢作用。 通过建立为论文及各类科学产出、科学家、科研机构、资助信息等各类有意义的科研信息实体提供全球唯一、持久、可解析的标识符登记管理机制,将使这些实体的识别、关联、发现、验证、引用、评价、互操作更加可靠、可信和一致化,更容易实现跨学科、跨领域、跨国家的自动化信息流动,提高科学产出报道和共享的速度和精确性,通过揭示研究产出之间的关联性导致新的知识发现和创新。 持续标识符体系的建设是实现开放科学交流系统的要件,利用FAIR 原则和FAIR 数字对象(FAIR Digital Objects),已是构建可行的、可信的和长期可持续的持久标识符体系的运行和服务的最佳实践形式。在目前的环境下,需要借鉴融合国际上已经得到广泛应用的多种持久标识符模式,如用于论文和数据等产出的DOI、科研人员标识的ORCID、科研机构标识的ROR(Research Organization Registry)、基金项目Crossref Grant ID,结合中国开放科学的独特实践,逐步构建起符合国家高端交流平台体系发展要求的开放化、国际化、标准化的国家科技信息持久标识符支持体系。

3 高端交流平台的开放科学实践策略

在传统的科技信息交流模式下,世界五大出版商已垄断了全球四分之三的出版市场,且出版商构建的科技文献数据库也从单纯的出版物元数据仓储演化为复杂综合信息网络,支持从文献检索到学术履历跟踪、科研合作、项目资助机会发现等深度知识分析服务。 继续围绕这种传统模式构建高端交流平台,将面临成本持续上涨和向上突围困难等巨大挑战。 我国近年来推出的发展壮大我国世界一流科技期刊体系的各种行动计划,取得了积极效果,但对中国出版交流系统在全球体系中的地位和作用尚未带来实质性变化和影响。 依靠引进方式进行高端交流平台的建设,不仅需要继续承受高昂的投入,而且也不能消除科技信息安全保障的风险。 事实上,国际科研学术界也一直在不断探索和变革传统学术交流系统的范式和路径,以摆脱出版商强力控制学术出版市场而带来的学术交流危机。从科研论文的开放出版,到科学数据的开放共享,再到科学软件的开源,以及开放同行评议、开放计量、开放评价等,一场支持科研学术交流过程转向开放、透明、高效的开放科学运动已在大力推动全球学术交流体系的重构,并已产生广泛深入影响。因此,国家高端交流平台的构建,需主动把握这种变革和趋势,以开放科学思维为主线,以参与全球开放科学治理为载体,以开放科学方法为主要实践框架,形成融合国内外高端科研成果和提供高端知识服务的开放交流平台。因此,本文在这里选择国家高端交流平台体系中的核心部分,提出面向开放科学环境的实践策略建议。

3.1 推动建立支持国内高水平科技论文的开放出版体系

2020 年,全球近50%的出版物以某种方式开放获取,与COVID-19 相关的出版物近70%提供开放获取,2010~2020 年间的全球开放获取论文已占到全部论文的38%,而Web of Science 索引的最新论文中超过50%的支持某种程度的开放获取。 这些都表明,科研论文走向开放获取的趋势和方向已经非常明确,高水平论文的开放获取也不例外,这为构建开放获取期刊平台体系提供了充分的趋势性和可行性证据支持。

开放获取在中国的发展近年来也势头强劲,开放获取出版物的增速(18.1%)超过出版物平均增长率(12.04%)。 这主要得益于国家科技部、自然科学基金委和中国科学院等重要资助者和研究机构对开放获取的支持,包括出台公共资金资助科研论文的开放获取政策,加入全球OA 2020 计划等。中国科研人员对开放获取的误解和不信任在近几年也普遍转向积极支持的态度,近75%的学者在开放获取期刊上发表过文章,信任、阅读和经常引用开放获取期刊文章,大部分人认为开放获取期刊发表的内容质量较高。

在具体的推进策略上,先期可以支持入选期刊卓越计划目录的期刊优先实现开放出版。 但入选目录体系刊物规模目前只有285 种,有225 种被SCI索引,只占其索引期刊总数9500 多种的很小一部分,索引中国期刊发表论文数只占全球SCI 索引论文总数的1.72%,而2019 年中国作者发表的SCI论文数已占全球当年SCI 论文的28.34%。 显然,这与中国持续上升的科技实力完全不相称,也难以形成中国期刊在国际一流期刊体系中的规模效应。

逐步扩展中国高影响力期刊规模上,可结合“十四五”规划中的重点科技前沿领域,组织和创办新型高质量开放获取期刊,逐步形成以国内高水平开放获取期刊为主的开放期刊体系。 从跻身国际一流科技期刊的角度出发,新创办的期刊应以英文版期刊为主。有研究预计,与我国科技实力相乘的中国英文期刊规模,需要从当前的350 多种扩展到至少1 000种左右,这需要国家在英文科技期刊审批中予以更大的政策支持。

另外一种可行的路径是支持国内高质量期刊转变办刊模式,支持双语出版,提高国际影响力,打造其成为具有国际影响力的期刊。 科技期刊双语出版是国内外非英语母语国家适应国际、国内两个市场发展的重要举措。中国知网推出的“中文精品学术期刊双语数字出版工程”,通过双语出版、双向传播和增强出版等融合创新的方式,已经在这方面进行了积极的探索和实验,帮助海外学者获取和方便使用中国学术研究成果,取得了积极的效果和经验。

总体上,发展世界一流的中国科技期刊体系,不仅要全力推进数字化、专业化、集团化、国际化进程,更要发挥中国科技期刊大部分由专业领域的学协会和研究机构主办的优势,通过开放获取出版实现学术出版和交流控制权向科学共同体回归的目标,加快中国学术期刊在开放科学交流体系中战略有利地位和引领优势。

3.2 积极支持高水平开放同行评议预印本交流平台发展

预印本平台从知名的arXiv 平台开始,已经有三十年的发展历史。 随着开放获取和开放科学的深入发展,预印本平台发展已经得到科学界的广泛认可。特别是在COVID-19 流行期间,有关COVID-19 的预印本呈现井喷式的增长。 仅在2020 年,COVID-19全球大流行就带来了3 万份预印本。 COVID19发生的前5 个月期间(2020 年1 月-2020 年5 月),MedRRxiv 和bioRxiv 平台的发文量比前5 个月增长了61.2%。 显示出预印本平台在加速科学知识传播、特别是应急学术交流过程中的重大作用,凸显了开放科学的学术交流和科学传播价值。

与传统的预印本平台不提供同行评议相比,当前的预印本平台已经引入了开放同行评审模式,形成一种被称之为PRC(Publish-Review-Curate)的新型出版模式,其完整的研究成果出版过程已逐步形成与传统学术出版交流体系相融合的闭环模式。一种典型的研究成果发表过程为:作者向平台投稿;平台对投稿进行人工或借助AI 工具进行综合预审查,包括是否符合投稿政策和伦理要求等;通过预审查的投稿及其支持数据即在平台快速公开发表;平台启动对投稿文章的开放同行评审,同行评审意见将同文章一起开放发布,作者根据评审意见对文章进行修改,文章的相应修改及其各个修改版本都可以公开发布;通过同行评审的文章发送至主流的文章索引服务平台或开放知识库。

PRC 是一种开放出版平台模式,和期刊之间不是替代关系,可以与传统出版服务融合,形成对出版服务过程的整体优化。如bioRxiv、medRxiv和一些期刊建立了双向合作关系,支持预印本进入期刊正式审稿流程。期刊对于预印本也持积极合作态度,一些期刊要求作者将论文先发布到预印本平台,或者设立专门负责从预印本平台筛选论文的任务。 预印本对论文的初步审查,潜在性地提高了论文的质量,优化了同行评审过程。 如bioRxiv 提供的B2J(bioRxiv-to-journal)服务跟领域200 多种期刊合作,作者发布在bioRxiv 的文章同时可以选择拟正式发表的期刊,由bioRxiv 自动将文章的全文和元数据等推送给作者选择的期刊的投稿系统。

PRC 同时也是一种支持解构化出版过程的出版模式。以Review Commons为代表的第三方开放同行评审服务,提供了一种将论文评审过程从特定期刊独立出来的服务,提供中立于期刊的评审,评审结果公开透明。 其目的在于使评审者关注文章的科学价值而不是特定期刊的标准来开展评审,提供更加客观和可移植的评审服务。 其实质是将科学评价和编辑决策进行分离,实现更加透明和高效的出版体制。Review Commons 平台提供代表作者向合作期刊投稿的服务,对期刊来说,能够按照透明同行评审的原则,认可评审意见的真实性。

同行评审是科学出版保证质量的事实标准,PRC 模式的预印本平台引入“先发表,后评审”的开放同行评审机制,兼顾了发表效率和发表质量。同时,这种模式可以与传统期刊出版模式结合,有理由对其进行关注和投入,纳入高端交流平台的建设体系。

3.3 建设具有高影响力的科学数据库或科学数据平台

开放科学数据与开放科研论文是当前开放科学实践中的两大支柱。 科学数据的开放有多种型态和方式,包括论文支撑数据的发表、数据论文、数据仓库或数据中心平台发布的数据集、以及专门性的科学数据库等。从高端交流平台体系建设的角度,应主要着眼于开放科学数据中心、数据仓储或数据库等数据平台的建设。 我国已经启动了国家科学数据中心体系建设,但在诸多学科领域仍然存在数据碎片化、集中度不足、数据质量不高等问题,缺乏国际上广泛认可的权威数据库,科研团队主要依赖国外科学数据库,在科学数据方面的国际话语权不足。 因此,需围绕事关国家安全的基础核心领域、战略性科技前沿、“卡脖子”领域关键核心技术等方面,按照FAIR 原则,进行高价值数据平台的长期建设和积累,满足国内科研创新对高端科研数据的保障需求。并加强推动部分已经有一定国际影响力的国家科学数据中心形成世界知名科学数据中心,进一步提升我国国家科学数据中心的国际影响力,增强整合和汇聚全球科学数据资源能力。

3.4 支持复杂动态科学产出关联出版的学术交流平台探索实验

在开放科学和数字学术环境下,传统科研论文的知识表达能力和组织模式,已证明不能适应开放学术交流体系的最佳科学记录方式要求。 采用多样化、包容性和深度互连的知识表达结构和模式,提供数据、代码、工作流、实验方法过程最大限度地开放、重用、验证和审查,以支持研究结果的复现等,是开放科学平台积极探索和发展的方向。如CODECHECK 服务,提供对文章的支持程序进行独立执行、检查和认证,并承认检查结果贡献和赋予DOI 进行标识, 公开检查结果公开发布,形成一种从发表静态科学内容到动态可执行结果的交互式科学应用;Protocols.io则提供了发布和共享研究方法相关的一系列知识交流服务;Code Ocean提供对科学过程的代码、数据、计算环境、结果和元数据进行封装,并与文章、长期保存服务、深度学习框架、开放工具等进行关联集成,形成研究过程和研究结果的可计算和复现。

高端交流平台进行这种变革性学术交流模式和平台的探索实践,积极围绕高端科研论文的出版交流过程,构建论文支撑数据、数据分析工具和代码等研究资料的结构化、可计算化和同步关联化出版,支持研究过程和研究结果的互动复现,以及面向可计算化的大规模科学产出挖掘分析应用场景,有助于我国在高端交流平台的建设中形成一些原创性、引领性的平台建设模式和应用。

3.5 建立全球高水平开放获取论文的监测汇聚与高级知识服务平台

早在2018 年,中国已成为全球最大的SCI 论文生产国,2019 年已经占到全球SCI 论文的28.34%,达到460,363 篇;中国作者为国际Top 10 期刊贡献了35.1%的论文。 且当前全球近50%的出版物以某种方式可以实现开放获取。这些数字表明,从构建高水平科研论文汇聚服务平台建设过程中, 可以优先考虑建设对国内外高水平开放获取论文进行分领域分主题动态监测、采集和整合组织。从实现领域高水平科研论文完整集成出发,对于可开放获取的内容采取优先监测和全文采集集成的方式,对不支持开放获取的科研论文先考虑对论文元数据的采集,并采集提供论文全文访问链接,以支持从论文发现到论文获取链条的基本完整。 对于国内科研人员在高水平国际期刊发表的成果,这种监测采集服务同时还可以发挥对我国公共资助成果的系统收集和长期保存作用。

基于内容的监测汇聚,可以按照高级知识服务平台的功能和服务建设要求,设计实现面向科研活动全生命周期各种高级知识服务。

4 结语

当前我国科技信息交流平台的建设总体上处于国际科技信息交流分工体系的中下游地位,在国际科技竞争日益激烈,我国诸多关键领域面临科技封锁或卡脖子问题的制约下,“十四五” 规划对我国科技界在基础核心领域、重大科技前沿以及关键领域核心技术方面,提出了实现原创性、引领性攻关突破的要求。面对这种严峻的科技创新挑战,迫切需要建设国家高端交流平台,为各种重大科技创新活动提供高端科技信息的保障和交流支撑平台。 文章主要对高端交流平台建设的内涵、定位和作用进行了分析界定,提出了一个高端交流平台体系建设的基本框架,并结合国际学术交流体系向开放开学体系变革的趋势,对以开放科学为导向的国家高端交流平台建设的内容和实践策略进行了讨论。 面向开放科学环境的高端交流平台建设,有利于寻求获得突破出版商和数据库商控制的学术出版交流体制的机会,以更加积极主动的姿态参与开放科学发展和治理,争取获得与我国经济社会发展实力和科技实力相匹配的科技话语权,形成更加有利于高端交流平台长远建设和发展的条件。