APP下载

甘肃中医药大学机构知识库建设初探*

2023-01-19黎斌宁吴玉丰宋志靖殷世鹏

甘肃科技 2022年10期
关键词:中医药大学学者成果

黎斌宁,吴玉丰,柳 春,宋志靖,殷世鹏

(甘肃中医药大学图书馆,甘肃 兰州 730000)

机构知识库(IR)最早出现于欧美国家,是学术机构通过利用网络收集、保存、管理、检索和利用本机构内科研人员产出的智力成果而建立的数字资源仓库,其所收集的智力成果不仅包括已公开发表的各类学术论文,也包括未发表的学术论文、科研进展报告、技术报告、硕博士论文、实验数据及其他灰色文献等[1]。高校IR是收集、存放由大学师生撰写的、可供大学内外用户共享的学术文献数据库。高校在教学和科研过程中,产生大量学术成果。将这些学术成果进行有序化收集、整理和发布,建成高校IR,对高校科研和教学的发展都有着积极的推动作用。在我国,中医药院校IR建设起步较晚、规模较小,截至2020年11月30日,全国24所中医药院校仅有12所中医药院校图书馆建有IR(包括学术成果库、学术成果平台和本校学术论文库)。即便如广州中医药大学、天津中医药大学、山东中医药大学、南京中医药大学、成都中医药大学等全国比较著名的中医药院校,虽都建立了自己的IR[2],但所见前期建设遇到问题的相关文献报道较少,仍处于摸索阶段。本文梳理分析甘肃中医药大学IR建设存在的问题并给出解决方案,希望给同类院校在IR的前期建设中提供借鉴与参考。

1 本校IR建设意义

甘肃中医药大学1978年建校,经过40多年的建设,校本部(五里铺校区、和平校区)现设有21个教学机构,教职工900余人,在校生约1万余人,博硕研究生培养规模逐年扩大。学校历年产出各类学术著作、学术论文、会议报告、科研成果、专利、专著、译著、编著、演示报告、行业标准、研究报告、成果、软件著作权以及报纸、影音文件、图片文件等约11万余件。除此以外,还有合并后的定西校区、甘南校区,以及4所直属附属医院,7所非直属附属医院产出的大量成果。这些成果分散在各个数据库、网络和学者本人手里,学校建立IR,既可为学者提供保存这些资源的平台,节省他们的时间和费用,方便学者自我审视和利用自己的科研效果,还可以提高机构资源的被发现率和引用率,扩大机构的学术影响力和声望,促成科研管理部门和各二级学院对智力资源的实时掌握和管控,并最终实现教学、科研、图书、档案、人事等系统的互通、融合和共享,对教学科研发展起到积极的推动作用。为此,学校图书馆于2018年9月开始创建甘肃中医药大学(以下简称“学校”)IR。

2 学校IR的建设模式

IR的建设模式一般分为3种,即独立机构建设模式、同行联盟建设模式、跨行联盟建设模式[3]。学校IR采用独立机构建设模式,即采用与第三方数据制作商合作的方式进行IR建设。在调研了同类大部分高校所建设的IR之后,选择与重庆维普资讯有限公司合作开发。维普IR平台底层架构为Apache基金会开发的Hadoop架构,该架构是一种能够对大量数据进行分布式处理的云计算软件框架,数据处理可靠、高效并具有可伸缩性。

3 学校IR的平台架构

平台由逻辑框架架构、底层框架架构及功能模块框架三大部分组成。采用大数据资源池作为数据源头,本地底层数据通过管理层进行管理,应用层采用分布式架构。

3.1 逻辑框架架构

建立学校(含附属医院)各级机构对应的学者库,利用WOS系列数据库(SCIE、SSCI、A&HCI、CPSI-S、CPCI-SSH等)、EI、Scopus、Pubmed、知网、维普、万方、超星及CSCD、CSSCI、国家自然科学基金、国家社科基金、中国知识产权局专利、Wiley、Proquest、ScienceDirect、Springe、自建库等数据库全面收集本校学者的知识数据,并对各级机构元数据及科研成果进行管理与展示。

3.2 底层框架架构

将收集到的学者知识成果数据存入元数据仓库,对学者的文献类型、所属领域、主题、所在机构等进行资源聚类,通过定题分析归入期刊文章、论文(学位、会议)、报告、专利、标准、著作等成果类型中,最终生成学者的信息报告。

3.3 功能模块构架

系统功能模块由IR网站模块、资源建设模块、数据管理模块、知识服务模块等构成。采用B/S构建,将系统功能的核心部分集中于服务器上。采用全新的机构树管理体系结合机构词表构建,可在树状组织上对机构的层级关系及产出数据进行便捷地新增和修改工作。

4 学校IR的内容建设

IR建设着重于三个库的建立,分别是学者库、机构库和成果库,他们是IR的三大支柱,是IR建设的核心,是机构库建设的重要内容,三者相互关联,彼此依存,共同构成IR最重要的基本库。在此基础上,分析、统计功能才能得以拓展,进而开发其他专题库,统一调度放大IR多维度揭示效应。

4.1 成果库建设

4.1.1 内容建设

广义上讲,IR的内容建设应该收集、保存机构成员在教学、科研和工作中产生的各类知识产品。包括已经公开的知识产品,如期刊论文、会议论文、专著、学位论文、专利文献、成果、科技报告等,以及未公开的智力产品如讲稿、课件、处方、手稿、研究过程中的阶段性成果和数据等等。大部分高校的IR在建设之初,成果库的内容建设都是从各类数据库中获取公开数据,后期再根据机构自身特点定制开发相应的模块并由学者自己补充完善。学校IR正处于建设初期,内容建设也以机构收集各类数据库中的成果为主,个人认领并补充为辅,这种模式能尽快搭建起成果库的基础。

4.1.2 收录范围

近年来随着国家财力的增强,受国家发展中医药、中医药人才培育政策的支持,学校办学规模急剧扩大,校本部由刚开始的三个教学部发展到二十余个,学校由一个校区发展成一校四区,附属医院由一所发展到直属四所、非直属七所。建设初期,我们对首批入选学校机构库的成果范围进行界定:现阶段则全面收录四个教学校区发表的文献;对于附属医院,确定暂时只对第二附属医院发表的文献全面收录。其他附属医院的成果只收录以甘肃中医药大学署名的成果。

4.1.3 建设效果

截止2021年6月,学校IR以各种元数据获取方式(数据加工、数据合作交换、数据收割等)收录得到各类成果数据26 014条。其中,中文文献25 025篇,外文文献989篇;期刊文献20 971篇,会议论文2 502篇,学位论文1 746篇,科技成果454篇,专利321篇;医药卫生类文献18 630篇,其他类7 384篇;被WOS收录772篇,Scopus收录1 735篇,EI及CSSCI分别为123篇和105篇。成果库建设虽然还存在数据不够完整,更新速度较慢的问题,但效果总体是明显的。

4.2 学者库、机构库建设

学者是学术交流的主角,是机构成果的创造者和使用者,更是IR建设的原动力[4]。完备的高质量学者库,能够系统反映各学者的研究历史与研究成果等学术生态信息,反过来又能调动学者学术研究的积极性,促进科研成果的产出。

前期学者库和机构库建设效果不理想,比较突出的问题,一是学者数量不准确,如系统显示学者5 806位,远远超出实际人数;二是同一学者呈现多个机构名称;三是二级机构名称与现机构名称不完全相符,如系统显示的二级机构有80个,而目前实际机构为54个。究其原因主要在于学者库和机构库的学者、学者机构信息和二级机构信息直接来源于成果库,而非先从学校内部收集完善学者与机构信息再建学者库和机构库。第一个问题的产生是由于元数据制作错误,误将全部合作者均视同为学校学者而纳入学者库。第二个问题的产生是因学者发文机构署名时或者没有标注二级机构,或不规范的采用了合作者的二级机构名称,或作者机构随行政岗位变动而变动,或二级机构更名而不一致,这些都造成了同一作者出于不同二级机构,使得作者与二级机构没有一一对应,其成果被分配到不同的二级机构库里。第三个问题产生的原因是机构名称变更没有溯源和对接。为此,我们特制定了学者库和机构库建库标准和规则,重新规范打造学者库和机构库。

4.2.1 入库学者规则制定

确定现阶段入库学者为四个校区的全体正式、人代人员及第二附属医院的全体正式、人代人员;其他人员往往具有多重身份,暂时不入学者库。但是发文署名为甘肃中医药大学的成果入成果库。待以后条件成熟,再进一步扩大学者录入范围。对入库但暂时还没有学术成果职员不在前台显示。

4.2.2 入库学者机构确定标准

学者机构确定原则、依据和标准:要保证机构库二级机构成果的准确性,原则上要求学者归属的机构是相对稳定的,尤其是多肩挑人员不随行政岗位变化而变化,否则,管理人员需要不断修正学者机构。鉴于IR主要反映学者学术成果,其学术成果之大部分应与承担的教学方向一致,因此,部分兼具教学、行政、科研等多重身份,且分属不同二级机构的学者,机构选取标准是依据学者所在教学院部作为其机构,放弃其可能存在变数的行政任职机构,而将这部分信息在个人简介中予以反映。

4.2.3 学者个人简介要求

学者个人简介信息可从院部主页、个人主页中提取。没有可直接提取的信息,需要学者自行完善这部分内容。模块需要设定内容框架,明晰个人简介中应该反映的主要内容,如身份信息,履职信息,所在学院,教研室,承担的课程,研究方向等与科研有关的信息,便于数据库从中获取有用的信息,提供更深度的服务。

4.2.4 建立健全机构变迁一览表

甘肃中医药大学是一所只有四十一年建校历史的年轻院校,也正因为年轻所以变数就大,又赶上教育大发展、中医药事业大发展的好时机,学校这些年发展变化巨大,二级教学机构从建校时的三个系增加到十七个学院,还建有各种实验室、研究院所等,其间机构拆分、合并、新增,几经变迁,需要尽可能地理清现机构与原机构的传承关系,无法理清的需要制定出规则,建立机构变更一览表,使成果入机构库时有比较准确、比较合理的依据,从而比较客观地反映各二级机构的学术成果。

5 问题和展望

5.1 管理与推广

学者的支持和理解,一定程度上关系到IR建设的成败。从当前学校IR的使用情况来看,大部分用户虽已提交了成果,但对IR仍缺乏了解,对IR的重视程度不够,导致了学校IR后续使用和成果提交的动力不足。因此,IR的营销和推广是必不可缺的。虽然机构知识库的管理人员或学科馆员可以对用户开展IR教育,使其了解IR的价值,推动用户使用IR,但图书馆还不能担当意见领袖,所以学科馆员的游说和教育并不能引起用户对IR的过多关注。从现实来看,IR的宣传和推广工作存在较大阻力。

5.2 元数据管理

在IR建设过程中,产生了大量元数据的累积现象。如何有效地管理这些元数据,使之能够更精确地定位到要检索的文献,这是在IR的使用过程中提高使用者满意度的关键所在,也是有待于研发的新难题。

5.3 后期开发

在完善IR基本库的基础上,形成强大的分析、统计功能,可以轻松实现学校科研管理部门和各二级学院对智力资源的实时掌握和管控。在此前提下,进一步开发其他专题库,完善IR多维度揭示效应。

5.3.1 完善IR基本库

如前所述,目前学校IR只收录了四个教学校区和第二附属医院发表的文献,其他附属医院的成果未来是否应该全面纳入,这是一个值得探讨的问题。

5.3.2 开发

能够实现教学、科研、图书、档案、人事等系统互通、融合和共享的新模块,助推学校教学科研水平的整体提升。

5.3.3 开发名中医学术思想传承的新模块

中医是个传承性很强的学科,学校拥有国医大师1人、全国名中医3人、省级名中医63人。建校初期学校汇聚了于己百、周信有(2017年荣获国医大师称号)、郑魁山、宋贵杰、王文春等知名学者,基于学术传承又涌现出了张士卿、王道坤、曹玉山、李金田等中医名家。老前辈的学术影响了一代又一代的中医学者,新生代跟随前辈的脚步,溯本逐源,深入研究,将他们的学术思想传承下去,也是我们IR后续建设肩负的使命。

6 小结

IR建设初期,注重搭建学者库和机构库,使成果数据明确地指向学者、机构、科研团队;通过学者、机构以及科研团队得以准确统计出学者的科研产出及影响力,以满足多角色的功能需求。内容建设以机构收集各类数据库中的成果为主,个人认领并补充为辅,这种模式能尽快搭建起成果库的基础。对机构不确定或边缘模糊的学术成果收集任务,需要我们工作人员及学者相互配合来完成。

猜你喜欢

中医药大学学者成果
山东中医药大学科研创新团队介绍
陕西中医药大学附属医院肾病二科简介
陕西中医药大学附属医院肾病二科简介
学者介绍
学者简介
学者介绍
验收成果
工大成果
ESL Learners’ Semantic Awareness of English Words,Semantic Transfer and Its Implications for Vocabulary Teaching in a Second Language
2018数博会4大成果