APP下载

基于知识图谱的国内外图书馆学科内容比较研究❋

2014-12-25杨思洛韩瑞珍

图书馆 2014年1期
关键词:情报学图书馆学图谱

杨思洛 韩瑞珍

(1.湘潭大学公共管理学院 湖南湘潭 411105;2.湘潭大学旅游管理学院 湖南湘潭 411105)

在知识经济时代,知识已成为经济社会发展的首要资源与第一动力,作为一种有效获取知识、发现知识和探测知识的新领域与新手段——以知识单元为分析基础的科学知识图谱正在蓬勃兴起。〔1〕对科学 (学科)研究结构与趋势的分析一直是图书情报学科研究和实践的重要内容;对图书馆学科本身也有众多探索。〔2〕目前除传统文献计量或定性的历程回顾和综述总结外,运用知识可视化方法分析图书馆学科的相关研究中:有些是国内外学者在研究知识图谱的工具和方法中,以图书情报学科为例进行论证;〔3〕另外,少量研究把图书情报学科作为一个整体进行分析;〔4〕此外,也有部分论文针对图书馆学中特定内容的可视化研究,例如研究数字图书馆、图书馆服务、公共图书馆、农村图书馆、图书馆管理、某一图书馆学期刊等等;〔5-6〕虽然有一些论文对国内外图书馆学科知识图谱的探讨,〔7-9〕但是缺少基于比较视角的系统研究。本文可视化分析图书馆学科的研究热点和发展趋势,分析比较发现国内外相关研究的异同,旨在认识图书馆学科的新现象和规律,为国内图书馆学研究与实践提供借鉴。

1 研究方法与数据来源

学术论文是对某科学领域中的学术问题进行研究后,表述和交流研究成果的重要载体和形态,也是知识图谱主要的数据来源。从研究内容的可对比性、研究数据的代表性和可获得性、研究工具和软件的可用性等多方面考虑。经过反复实验和多方面咨询专家,最后决定选择最近10年的国内外数据进行分析。国内选择CSSCI数据库,具体检索式为:“LY02,LY03,LY04,LY05,LY06,LY07,LY08,LY09,LY10,LY11:LX=论文^XK=图书馆、情报与文献学^XW=120501$”,共检索到15121篇论文。国外选择WoS数据库,具体检索表达式为:“主题=(librar*);精炼依据:Web of Science类别=(INFORMATION SCIENCE LIBRARY SCIENCE)AND文献类型 =(ARTICLE);时间跨度 =2003-01-01——2012-10-21,数据库 =SSCI,词形还原 = 打开”,共检索到6657篇论文。综合使用文献计量分析法和社会网络分析法,对相关论文下载到Excel分类汇总处理,使用VBA自编程序和使用SATI软件对合著和共词分析;并通过Net-Draw和Citespace软件可视化结果。

2 图书馆学知识基础图谱

图书馆学的知识基础可以分为两类:一是由图书馆学的早期奠基性文献组成;二是由一组共被引频次和中心性都比较高的关键文献组成。图1和图2分别为国内外图书馆学研究论文中,共被引网络形成的知识基础图谱,它们形成了图书馆学研究的脉络。

2.1 国外图书馆学领域经典文献

从图1中看出,图书馆学的第一篇奠基性文献是Bradford于1934年发表在《Engineering》上的论文《Sources of information on specific subjects》。布拉德福是世界著名的文献学家和化学家,最早发现文献分散(离散)规律,在图书情报领域产生了重大影响。与这一杰作同一主题线上的是Garfield于1972年发表在《Science》上的论文《Citation analysis as a tool in journal evaluation》。〔10〕加菲尔德是 SCI创始人、美国科学情报研究所和科学计量学的奠基者。该文中他提出“科学政策研究可以通过引文的频次和影响来排序期刊”,在核心期刊和科学评价方面与布拉德福定律一脉相承。

另外一篇奠基性文献是美国科学研究与发展局局长V Bush于1945年发表在《Atlantic Monthly》上的论文《As we may think》。首次提出了机械化检索的设想,这一极具影响力的文献被视为情报学的开端,对图书馆学领域也产生了深远影响。〔11〕此外,Glaser于1967 年发表的专著《The Discovery of Grounded Theory:Strategies for Qualitative Research》。该书在Google学术中被引高达46732次,是社会科学中影响力最大的论著之一。该书提出扎根理论(Grounded Theory),这是一种定性研究及理论建构的方法,特别适用于定性研究,在图书馆学领域也有大量应用。

2.2 国外图书馆学高影响力文献

除了年代较久远的高被引文献外,近期也出现了系列高被引或中心度较高的文献,在图书馆学领域具有高影响力。点的中心性是一个用以量化点在网络中地位重要性的图论概念,中心性高的文献一般是图书馆学研究中的关键节点。

被引量最高的文献是Kuhlthau于1991年发表在《美国情报学会会刊》(JASIS)上的论文《Inside the search process:Information seeking from the user’s perspective》,领域内被引量高达71次,其中心度排列第二位,为0.13。该文从用户的角度分析了信息查寻过程,通过实践调查构建了信息检索过程模型。〔12〕被引居第二位的论文是Wilson于1999年发表在《Journal of documentation》上的论文《Models in information behaviour research》。该文研究了信息检索系统的查寻与检索中,交流与信息行为间的联系;通过引入模型的嵌套分析不同层次信息行为问题。〔13〕被引居第三位的是同样是Kuhlthau的关于信息检索方面的著作《Seeking meaning:a process approach to library and information services》(2004 年第二版),其1993年第一版中心度排列第四位,为0.12;她还有多篇关于信息检索与信息行为的论著具有重要影响。

中心度最高的文献是 Fisher等人于2004年发表在《Journal of the American Society for Information Science and Technology》的论文《Information grounds and the use of needbased services by immigrants in Queens,New York:A contextbased,outcome evaluation approach》,中心值为0.15。该文阐述了Information grounds理论,通过对纽约皇后区的移民进行定性的实证,调查分析皇后区公共图书馆服务移民的知识需求和应对技能方案。〔14〕其次是Bates于1999年发表在《Journal of the American Society for Information Science》上的论文《The invisible substrate of information science》。阐明了隐含性的情报学科基础性的科学范式的关键要素;另外,Hider和Pymm于2008年发表在《Library&Information Science Research》上的论文《Empirical research methods reported in high-profile LIS journal literature》。该文通过内容分析,分析了高影响力的图书情报学科期刊在2005年发表的论文,所用的实证研究策略和方法的分布。

图1 国外图书馆学文献的共被引时间序列图谱

2.3 国内图书馆学领域经典文献

国内图书馆学领域的重要经典文献是宋朝司马光所著《资治通鉴》,1956年由中华书局出版,它是中国第一部编年体通史,在中国官修史书中占有极重要的地位,与国内图书馆学领域研究文献史等方面相关。东汉的班固所著《汉书》,由中华书局于1962出版,是中国第一部纪传体断代史。清代永瑢等人所撰《四库全书总目》,由中华书局于1965出版,为我国古代最巨大的官修图书目录。此外,魏征的《隋书》和刘昫的《旧唐书》其被引率也较高。

对比国内外图书馆学领域经典文献,可看出国内的领域经典文献都为文献学或历史学方面的著作;国外则集中在图书馆学的文献计量、信息检索与研究方法方面的论文。其原因主要有:第一、虽然国内图书馆方面的实践与研究源远流长,但古代主要研究文献学、目录学和版本学等内容;现代图书馆学研究起源于国外,相关经典文献也较多。第二、国内外图书馆学的引用行为差异,在上世纪中前期国内也出现众多图书馆学研究者的许多论著,例如相关分类法、图书馆学基础理论方面的著作,但是国内趋向于引用最新的研究成果,而不像国外研究中的追本溯源,当然其中也与国内外行文习惯相关,国外论文前言部分都有对现状综述。第三、国内图书馆学研究人文趋向明显,喜欢利用图书;而国外以规范实证研究为主,引用论文较多。最后,因为样本来源于索引库,研究过程中样本的差异也是一个可能的原因。

2.4 国内图书馆学高影响力文献

国内高被引文献出现众多专著,其中被引最高的前三位都是专著,在高被引的前30位中有18本图书。中心度最高的前30位文献中也有12本图书(见图2)。

图2 国内图书馆学文献的共被引时间序列图谱

被引频次最高的著作是徐引篪和霍国庆于1999年的著作《现代图书馆学理论》,由北京图书馆出版社出版 (被引高达128次)。它主要将图书馆学置于网络环境下信息资源管理理论框架中探讨,融合社会学等相关学科知识,系统而深入地探讨了现代图书馆学的研究对象和学科体系、东西方图书馆学流派和学说、图书馆类型的理论重组、图书馆的作用等重大议题。其次,于良芝的《图书馆学导论》(2003)和黄宗忠的《图书馆学导论》(1998)被引分列第二和第三位,都是图书馆学理论研究专著。被引量排第四位的是张晓林于2000年发表在《中国图书馆学报》的论文“走向知识服务:寻找新世纪图书情报工作的生长点”,该文在国内较早系统研究现代信息环境和知识经济对图书情报工作的深层次影响;提出将图书情报工作核心能力定位于知识服务;分析了知识服务的观念、形式和操作模式。

国内中心度较高的图书馆学研究文献,前10篇都集中研究图书馆学精神、图书馆学核心价值等基础理论方面。中心度最高的为范并思于2004年发表在《中国图书馆学报》上的论文《公共图书馆精神的时代辩护》,其被引量也居第五位。该文认为公共图书馆精神的发展经历了平民化、社会教育和民主社会的保障三个阶段,并提出了系列观点“公共图书馆精神实质是保障社会成员获取信息机会的平等,从信息知识角度维护社会公正;‘收费对免费’的讨论是对这一精神的挑战”等。中心度并列第一的还有蒋永福于2003年发表在《图书馆》上的《维护知识自由:图书馆职业的核心价值》。论文在论述知识自由的概念、类型与障碍的基础上,提出“图书馆是维护知识自由的社会制度,图书馆职业的核心价值是维护公民的知识自由权利,图书馆职业必须坚持公益原则、服务原则和自由存取原则”。此外,位列第三和第四位的论文都为范并思发表的,关于图书馆核心价值和公共图书馆核心能力方面的论文。

从国内外高影响力文献来看,相同点就是一些作者都有系列的高影响力论著;除个别的外,高被引和中心度较高的论著并不重合。但是国内外在研究内容上差异显著。第一、国外相关高被引文献大多为论文,而国内则有众多专著。第二、国外的高影响力方面主题分布广泛,包括信息检索、用户信息行为与需求、文献计量方法,甚至也有情报学的理论研究;而国内研究主题集中在图书馆学基础理论、图书馆价值和图书馆精神等方面。

3 图书馆学研究内容结构图谱

关键词是作者从论文中摘出的能够反映文章基本内容的词。由于科研人员对同一内容或概念的掌握较为准确,因而所使用的关键词也趋向一致。一篇论文的关键词是其核心内容的浓缩和提炼,某学科相关论文关键词的分布频次与特征,能显示该学科的总体内容特征、研究内容之间的内在联系、学术研究的发展脉络与发展方向、学术研究的重点与热点等。〔15〕通过共词分析法可以分析共词网络的结构与特征,结合可视化工具,还能将分析结果直观形象地显现出来,进而达到可视化的效果。

表1 国内外图书馆学研究论文的前20个高频关键词

表1为国内外图书馆学研究论文的前20个高频关键词,其中合并了部分关键词(如“libraries”和“library”)。从统计的高频关键词来看,国内外图书馆学研究的热点高度重合。随着国内研究条件和科学交流的加深,国内外的研究成果可即时地获取和共享,还有许多业界学者以会议、进修和攻读学位等形式进行日益广泛的交流。第一、国内外对数字图书馆的研究都是热点问题,都出现了高校图书馆和公共图书馆等特指类型的词;第二、有关文献传递等信息资源共享受到共同关注;第三、对网络新技术及数字资源也都是重点研究内容。但是国内外也存在一些差异,第一、国外对情报科学和信息管理等研究比较关注,这可能是国外图书馆学与情报学一般合为一体,称为“图书情报学”的缘故。第二、国内高频词中出现了一些国家,主要是对特定地区的研究;国外词涉及面更加广泛。

3.1 国外图书馆学研究内容结构

图3 国外图书馆学研究论文的关键词共现图谱

国外6657篇图书馆学领域论文共有4688个关键词,共出现12850次。前80个高频关键词出现4467次(35%),对这些词构建共现矩阵,为反映重点情况,把共现频次阀值设为大于等于3次,然后再通过NetDraw可视化,得到图3,图中连线粗细代共现次数,其中各结点的大小和颜色的差异用度中心性(Degree Centrality)表示;各结点标记文字的大小用介数中心性(Betweenness Centrality),颜色用紧密度(Closeness Centrality)表示;连线粗细表示合作频次。关键词中表示研究的词主要包括图书馆、公共图书馆、高校(学术)图书馆和国家图书馆等类型,这些词聚集在图中心;其中,数字图书馆作为图书馆发展趋势,不应该作为研究内容,所以以研究对象对待。根据关键词的频率及共词联系,将国外图书馆学研究内容分为五大部分,需要说明的是,本文忠于原论文作者的标引,没有进一步处理一义多词和一词多义关键词的合并等;另一方面关键词知识单元间的关系错综复杂,所以图3中也是部分连线交错在一起。

①信息检索与文献计量研究。广义的信息检索包括“信息存储与检索”,国外图书馆学集中关注网络环境下,海量的信息资源检索问题,出现网络(Internet)、数据库(Database)、搜索引擎(Search engine)和信息检索(Information retrieval)等关键词。此外,出现了引文分析(Citation analysis)、文献计量学(Bibliometrics)和评价(Evaluation)等词,说明文献计量是国外图书馆学研究的重要内容,而且信息检索与文献计量也是十分相关的两个领域。②信息资源建设。图书馆学界历来比较重视信息资源方面。一方面,主要研究数字信息资源的建设,包括电子书、电子杂志、数字出版,以及在线编目和数字存贮等系列关键词。另一方面,资源共享、文献传递、馆际互借等词频次很高且联系紧密,说明信息资源共享是其研究重要内容。③信息服务是图书馆存在的目的。国外相关研究涉及面广泛,包括Web2.0环境下的信息服务、高校信息素养教育、参考咨询服务、读者研究、E-Learning等众多内容。④区域研究。在国外相关研究论文中出现许多国名关键词,包括美国、英国、加拿大、印度、中国等。因为SSCI收录的论文中出现了众多针对特定国家的研究,作者往往对研究区域予以标引,这些关键词也在一定程度上反映了全球图书馆学研究分布。⑤图书馆管理系统研究是国外关注的重点内容之一。研究图书馆自动化(Library automation)、图书馆系统(Library system)、信息系统(Information system)、计算机软件(Computer software)等词大量出现。

3.2 国内图书馆学研究内容结构

国内15121篇相关论文共有22326个关键词,出现58105次。前80个高频关键词出现13626次(24%),与国外相比,国内关键词一方面集中在“图书馆”等少数几个词,另一方面则更加分散。对这些词构建共现矩阵,为反映重点情况,把共现频次小于3次的数据清零处理,然后再通过NetDraw可视化,得到图4。与国外的情况类似,表示研究对象的各类型图书馆术语集中在图的中央。根据各词频次和关键词网络的测度,把国内图书馆学研究内容分为5大方面。然后,对比国内外图书馆学研究论文的关键词共现图谱,可以发现,图书馆学研究内容结构的异同情况。

①图书馆学基础理论研究。一方面,国内围绕“图书馆学”、“情报学”和“图书情报学”,以及图书馆学“研究对象”、“图书馆事业”、“比较研究”等展开;另一方面则集中在“图书馆精神”、“人文精神”等图书馆价值层面的探讨。②信息组织与检索技术。随着计算机网络技术的深入发展,在“因特网”环境下,实现“网络信息”从“信息组织”向“知识组织”和“知识管理”升级,主要研究“本体”、“XML”、“元数据”、“搜索引擎”等新的“信息技术”实现“资源整合”和“信息检索”。③信息资源建设是图书馆存在的前提和基础。国内一方面研究“文献资源”、“电子资源”、“网络资源”、“地方文献”和“特色数据库”的建设问题。另一方面则重点分析“图书馆联盟”、“资源共享”等信息资源共享内容,其中对国内资源共享的典范“Calis”较为关注。此外,对网络环境下,新兴的“开放获取”和“机构知识库”也有一些研究;对资源建设过程引起的“版权”、“著作权”等“知识产权”问题也是当前我国图书馆学研究的重要主题。④信息服务是图书馆学研究与实践永恒的主题。一方面,在“Web2.0”等新的“网络环境”下,“图书馆服务”的“服务模式”在不断变革之中,主要涉及“个性化服务”和“知识服务”等内容;另一方面,“读者服务”中也包括“电子阅览室”和“数字参考咨询服务”等新内容。⑤文献学研究。文献学是以文献和文献发展规律为研究对象的一门科学,国内主要关注历史文献学、古典文献学等。一方面研究“版本”和“文献考证”等“版本学”相关主题;另一方面,研究“四库全书总目”等“目录学”相关知识;其中也有对“四库全书”和“敦煌文献”等古代经典文献研究。

图4 国内图书馆学研究论文的关键词共现图谱

4 图书馆学研究前沿图谱

把国内外图书馆学研究论文近5年的题录数据,分别利用Citespace软件中提供的膨胀词探测(burst detection)技术和算法,通过考察词频的时间分布,将其中频次变化率高的词(burst term)从大量的主题词中探测出来,并根据词频的变动趋势,而不仅仅是频次的高低,来确定研究的前沿领域。

图5 国外图书馆学研究前沿图谱

由图5中可以看出,①主题词变化率较高的词中出现了Web、internet、电子资源(electronic resources)、数字图书馆(digital library)、电子杂志(electronic journals)等词,而且其中一些词年轮的外圈为红色,表明它们是近期突变出来的词,有关网络数字资源的研究将是其重要前沿领域。②公共图书馆(public library)、学术图书馆(academic libraries)、大学图书馆(university library)、国家图书馆(national library)等表示图书馆实际类型的词大量出现,说明对图书馆学实践研究的加强,特别是实际影响和作用(practical implications)一词突现。③信息素养(information literacy)、图书馆服务(library service)、信息检索(information retrieval)、馆际互借(interlending)等词的Burst值较大,信息服务与用户仍将是图书馆学研究中的重要内容。④情报学(information science)、引文分析(citation analysis)和影响(impact)等词表明,国外图书馆学与情报学之间的紧密关系,文献计量学等是共同关注的主题。

图6 国内图书馆学研究前沿图谱

根据图6,在国内,①图书馆、数字图书馆、高校图书馆、公共图书馆、图书馆管理、知识管理、图书馆学教育等词出现频率较高,表明关于各类型图书馆实践一直将是图书馆学研究的重点。②知识服务、信息服务、图书馆服务、信息共享空间、图书馆2.0和Web2.0等词在近期的Burst值较大,网络环境下信息服务是图书馆学研究永恒的主题。③特色数据库、数字资源、开放存取、机构知识库等关于网络信息资源建设方面的词大量出现,也将是未来的研究内容。④文献学、古籍、文献考证、版本等词出现较多,表明国内关于古典文献学和目录学仍将是研究内容之一。⑤情报学一词年轮的外圈红色最大,说明国内图书馆学对情报学方面的研究将大大加强,这也与实际情况相吻合,国内图书馆学情报学相结合,无论是理论研究、实践工作,还是专业教育都有越来越融合的趋势。

5 结论

本研究以国内外两大权威索引数据库SSCI和CSSCI为数据来源,系统对比分析了图书馆学学科的研究内容,并以可视化的形式予以展示。得出如下结论:

1)图书馆学高影响力作者情况国内外较相似,一方面近期作者其论文被引量较高,如国外的Tenopir C、Nicholas D,国内的张晓林、蒋永福和邱均平等;另一方面,则是一些业内的资深专家,近年被引次数多,特别是早期的经典论著,影响深远,至今仍被大量引用,例如国外的Garfield E、Borgman CL和国内的吴慰慈、黄俊贵和黄宗忠等。

2)对比国内外图书馆学领域经典文献,可看出国内的领域经典文献都为文献学或历史学方面的著作;国外则集中在图书馆学的文献计量、信息检索与研究方法方面的论文。从国内外高影响力文献来看,相同点是少量作者都有系列的高影响力论著;除个别外,高被引和中心度较高的论著并不重合。但是国内外在研究内容上差异显著,第一、国外相关高被引文献大多为论文,而国内则有众多专著。第二、国外的高影响力论文主题分布广泛,包括信息检索、用户信息行为与需求、文献计量方法,甚至也有情报学的理论研究;而国内研究主题集中在图书馆学基础理论、图书馆价值和图书馆精神等方面。

3)国内外图书馆学研究内容最相似的领域是图书馆的信息资源建设;其次,信息服务领域在整体上也相似,但国内着重研究服务的模式和形式,而国外则重视信息素养、高校读者,以及读者本身的研究;此外,信息检索也受到国内外的共同关注。在差异方面,国外崇尚实证与规范性的分析,重视文献计量方面的研究,对图书馆管理系统也研究较多,众多论文也有对特定国家(地区)的分析探讨;而国内,历来重视图书馆学基础理论研究,包括图书馆精神与图书馆价值等,对古典文献学和目录学也很重视。

4)从国内外研究的趋势来看,随着国际科学交流的频率与深入,国内外图书馆学研究内容将趋同发展。对公共图书馆、高校图书馆等各类型图书馆的实践是国内外图书馆学研究共同关注的内容。网络环境下图书馆服务和数字资源建设的研究仍将是图书馆永恒的主题。未来,国内外图书馆学情报学将有更加融合的趋势。但是,古典文献学和目录学仍将是国内图书馆学研究的重要内容之一。

1.刘则渊.科学知识图谱:方法与应用.北京:人民出版社,2008

2.杨思洛,韩瑞珍.知识图谱研究现状及趋势的可视化分析.情报资料工作,2012(4):22-28

3.刘启元,叶鹰.文献题录信息挖掘技术方法及其软件SATI的实现——以中外图书情报学为例.信息资源管理学报,2012(1):50-58

4.邱均平,温芳芳.近五年来图书情报学研究热点与前沿的可视化分析.中国图书馆学报,2011(2):51-60

5.胡晓梅.我国图书馆管理研究现状的知识图谱分析.图书馆,2011(6):114-117

6.刘丽.基于知识图谱的国际公共图书馆研究可视化分析.情报科学,2012(4):546-552

7.赵蓉英,王菊.图书馆学知识图谱分析.中国图书馆学报,2011(2):40-50

8.杨国立,李品,刘竟.我国图书馆学研究知识图谱分析.国家图书馆学刊,2012(1):52-59

9.宗乾进,袁勤俭,沈洪洲.2001-2010年我国图书馆学研究知识图谱——基于知识图谱的当代学科发展动向研究.国家图书馆学刊,2012(2):84-91

10.Garfield E.Citation analysis as a tool in journal evaluation.Science,1972,178:471

11.Bush V.As we may think.The Atlantic Monthly,1945,176:101

12.Kuhlthau C.C.Inside the Search Process:Information Seeking from the User’s Perspective.Journal of the American Society for Information Science,1991,42(5):361 -371

13.Wilson T D.Models in Information Behaviour Research.Journal of Documentation,1999,55(3):249 -257

14.Fisher K.E.,Durrance J.C.,Hinton,M.B.Information grounds and the use of need-based services by immigrants in Queens,NY:A contextbased,outcome evaluation approach.Journal of the American Society for Information Science & Technology,2004,55(8):754-766

15.马费成,张勤.国内外知识管理研究热点——基于词频的统计分析.情报学报,2006(2):163 -171

猜你喜欢

情报学图书馆学图谱
开放与融合:公安情报学进入情报学方式研究*
绘一张成长图谱
构建中国特色的情报学
国内图书馆情报学的发展现状与趋势探索
补肾强身片UPLC指纹图谱
卷首语
主动对接你思维的知识图谱
广西图书馆学会2013年年会暨第31次科学讨论会在贵港举行
广西图书馆学会2012年年会暨第30次科学讨论会在南宁举行
杂草图谱