APP下载

从信息平台到循证平台:一个以证据为核心的国家科技信息高端平台构建新模式*

2021-04-19杨克虎兰州大学循证社会科学研究中心

图书与情报 2021年6期

杨克虎(兰州大学循证社会科学研究中心)

2020 年10 月,党的十九届五中全会审议通过的《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》明确提出了“构建国家科研论文和科技信息高端交流平台”(以下简称“高端交流平台”)的战略部署,显示了党和国家站在“百年未有之大变局”关口对我国国家科技创新体系基础设施建设的重视和支持,这一国家战略也迅速吸引了整个科学界特别是科研管理、信息管理等领域工作者的关注和讨论,可以预见在“十四五”乃至更长一段时间内都将成为一个学界持续关注与讨论的科学问题。

笔者认为,如将以证据为核心,在过去近30 年间迅猛发展,已从医学领域应用到社会科学及实践决策领域且广受好评的循证理念和方法,引入到高端交流平台构建这一国家战略的学术讨论与实践实施之中,推动国家高端交流平台从信息平台走向循证平台,无疑将会是一个全新的视野。循证平台顾名思义就是以证据为核心的技术平台,而证据就是经过系统评价、接近事实真相的信息。通俗来说就是经过研究后得出的结论信息。循证平台与信息平台的主要区别就是信息组织与证据组织的区别,将国家高端交流平台建设为循证平台,既是一次信息平台资源组织架构的升级重构,又是一个创新的平台知识服务模式的打造,是外在发展需求及内在科学使命驱动共同的结果。

首先,将国家高端交流平台打造为循证平台有着需求驱动。据Web of Science 数据库统计,从2012 年至2021 年(截至2021 年5 月)近10 年间仅中国科研人员发表SCI 论文的总数已累计达到339.7 万篇。科研论文的增加在为科学工作者提供了可供选择的丰富文献的同时,也对文献进行有效获取和科学组织提出了考验,如何提高文献信息的检索效率一直是图书馆、数据库商及相关从业者苦思冥想却又难以完全满足用户诉求的问题。不可否认,云计算信息存储、语义化知识组织,以及核心期刊遴选等极大地提高了用户的信息获取体验, 但当前大数据时代困扰用户的信息数量庞大、 筛选困难等信息不对称问题依然存在,如果在国家高端交流平台的构建中不能从整个信息资源的组织模式上进行革新,信息不对称问题将一直存在,也就难以企及“高端”所对应的定位。从信息资源知识化、将知识证据化无疑就是一个可供选择的信息组织革新思路。

其次,将国家高端交流平台打造为循证平台有着理论支持。目前,学界对国家高端交流平台的理解较为多样,但无论如何定义“高端”的广度和深度,“高端信息交流平台”都始终是一个信息平台,其建设也脱离不了必须考虑信息资源的相关性和用户服务的可及性这两大绩效考量指标。正如Slawson DC等所言,任何信息源的效用都取决于它的相关性,并随着准确性提升而倍增,且随着信息获取工作量的增加而倍减。因此,国家高端交流平台构建的目标就是高相关性、高准确度和(用户的)低工作量。运用证据质量分级理论推动信息资源向证据资源、从低级别证据向高级别证据的转化无疑就能提高平台的资源相关性以及服务可及性。

在循证科学中,以证据分级思想为基础的证据金字塔(见图1)是用户(包括决策者或研究者)根据解决问题的需要,对相关信息进行汇总分析、研究后所获得的严谨度不同的知识体系。在实践中用户可根据证据的级别高低分级,将可获得的最高级别的证据作为最佳证据;如果最高级别证据缺失,则采用次之的证据。由证据金字塔可见,层级越高的证据越是应用严格的方法进行理性分析的成果。 如采用随机对照试验(Randomized Controlled Trial,RCT)所取得的结论定义为高质量证据,而对结论进行系统评价(Systematic Review,SR)所得证据则为最高质量证据。 然而,由于现实中各种条件的限制,科研论文和科技信息平台不可能保证其所提供的信息均为高质量证据,大量的原始文献即低级别证据是证据体系的最重要组成部分,从低质量证据向高质量证据的转化存在着巨大的发展空间。

图1 证据金字塔[3]

再次,将国家高端交流平台打造为循证平台有着实行方法及技术保障。从已有的方法来看,实现从低质量证据到高质量证据转化并不困难,如对作为低质量证据的原始文献依据严格的程序进行文献摘录、整理汇编以及系统评价等均可转化成为高级证据,如循证医学领域的知识服务系统Clinical Evidence(CE)除提供基本的知识服务和医疗知识,以及发表超出传统期刊范畴、经过同行评议的系统综述外,也通过全面的文献证据搜索与科学评价对最新的预防及治疗知识进行汇总进而形成系统综述和总结报告,及时对各种预防、治疗和干预手段的利弊进行权威性论述,运用科学方法在实现低级别证据向高级别证据转化的同时也向用户提供了科学决策知识服务。

当然,海量的原始文献为国家高端交流循证平台的构建提出了挑战,但现代信息技术特别是自然语言处理(Nature Language Processing,NLP)技术的发展和自动文摘等应用场景的出现为这一难题提供了解决方案。如有研究显示,发表一篇系统评价平均需花费研究者67.3 周的时间,而Clark通过使用10 余个自然语言处理工具则在两周内完成了液体摄入对尿路感染影响的系统评价,大大缩短了时间周期。 自动文摘处理更是技术成熟,目前已在Web 搜索、智能问答、舆情监督等领域得到广泛应用,面向原始研究文献的自动文摘更是在技术迭代、关键技术研发方面发展较快。

最后,将国家高端交流平台打造为循证平台可以创新平台知识服务模式。 Haynes RB于2001 年提出了一种循证服务平台的“4S”模型,其从低到高包含原始研究(Original Studies)、对证据的系统综述(Syntheses)、对研究和综述的摘要(Synopses)以及循证信息系统(Systems)等4 个层次,用户可以按从高到底的顺序进行信息检索。 2006 年,Haynes RB在“4S”模型的基础上构建了“5S”模型(见图2),自底向上分别为研究(Studies,原始性研究)、综述(Syntheses,如Cochrane 系统评价)、摘要(Synopses,单个研究或系统评价的简短描述)、总结(Summaries,特定主题的证据总结)与系统(Systems,个体信息与相关最佳证据相结合的决策支持系统)。 不管是4S 模型还是5S 模型,其均有别于当前主要科研论文和科技信息平台所拘泥于主题、篇名等检索层面,为用户的信息获取提供了一个从高到低的优先分级选项。

图2 循证知识服务模型[9]

综上可见,将国家高端交流平台打造为循证平台有着从需求驱动、理论支持及方法技术保障等有利因素,也能够创新传统文献数据库或知识库的知识服务模式。本文仅仅从有利因素、服务模式等方面提及了一些设想,在顶层设计、制度保障、协同机制等宏观层面,以及证据转化方法、技术实现等微观层面还有着诸多研究空间,亟待科学共同体给予更多研究及探索。