APP下载

人工智能技术在国际知识管理研究领域中的应用

2020-12-22张裕晨邱均平陈仕吉

科技管理研究 2020年21期

张裕晨,邱均平,陈仕吉

(杭州电子科技大学中国科教评价研究院,浙江杭州 310018)

人工智能 (Artificial Intelligence,AI)被描述为拥有能够模拟精确描述的特征能力的机器,这一概念由麦卡赛等科学家于1956 年夏天首次提出[1]。近年来,随着大数据、云计算等信息技术的发展,AI相关研究范畴如深度学习、知识获取、自然语言处理、神经网络、智能搜索等不断发展,有望成为引领“第四次工业革命”的核心驱动力[2]。国务院于2017 年7 月印发的《新一代人工智能发展规划》提出要将人工智能上升为国家战略层面进行布局[3],我国AI 技术迎来了发展的关键时期。

斯坦福大学尼尔逊教授认为AI 是关于如何表示知识和如何获得知识并利用知识的科学[4],将来拥有AI 的组织不仅会提升知识服务的专业性,更给知识服务领域带来颠覆性变革。近年来,AI 作为一种数据智能已被广泛应用于知识管理(Knowledge Management,KM)研究领域,国内外学者也对此展开了相关研究。Avdeenko 等[5]运用人工智能技术提出了一种将知识管理系统(Knowledge Management System,KMS)中的隐性知识向显性知识转化的方法。Yu 等[6]提出了知识统一表达概念,他们将人工神经网络与遗传算法(ANN-GA)相结合作为知识挖掘技术应用于KMS 中,并证明了其有效性。Kornienko 等人[7]在AI 认知研究的框架内,描述了逻辑模型、基于框架和生产系统、语义网络等不同的知识表示方法。国内学者唐晓波等[8]认为AI 是一门关于知识的学科,知识服务将由原来的经验主义转化为数据驱动为主,服务将多元化、智能化。张省等[9]从技术、组织和战略3 个维度分析了AI对知识管理的影响,将知识管理划分为知识跨界协同、系统匹配优化和创新绩效激励3 种模式,并提出了相应的知识管理策略。欧阳智等[10]认为AI 对知识管理特别是知识创造产生了实质性的变革,并构建了嵌入深度学习、自然语言处理等人工智能技术的KMS 框架。田倩飞等[11]从知识收集、知识搜索、处理与知识挖掘、知识预测以及知识决策服务等诸多步骤阐述人工智能关键技术在知识分析中的应用与影响,提出人工智能2.0 时代知识分析将朝向全面、精准、自动、高效、智能和深度等方向发展。这些研究成果反映了人工智能已成为国内外学者进行知识管理研究的重要技术,本文的研究有助于我们系统了解人工智能在知识管理领域的实践(Artificial Intelligence in Knowledge Management,简称AI-KM)。

总体上,国内外学者对AI-KM 的相互作用已基本达成共识,并取得了一定的科研成果,但仍有2 方面不足:一是研究比较倾向于AI 技术研究,对KM 的分析略显不足;二是重视个案分析,所参考的文献有限,缺乏系统的国际前沿研究进展梳理。在国内AI 研究大发展的背景下,相关学者也很希望系统的了解目前国际上哪些人、机构在使用AI 进行KM 研究?AI-KM 研究论文主要涉及哪些主题?高影响论文及其主题分布是如何的?论文期刊分布及知识吸收自哪些领域?本文将围绕这几个方面的问题来对国际AI-KM 的应用进行研究。

1 数据与方法

选择Web of Science 数据库(包含SSCI 和SCI2个数据库),以TS=("artificial intelligence") and TS=("knowledge management")为检索式,检索得到2003—2019 年(截至2019 年7 月7 日)发表在各类期刊上主题关于人工智能和知识管理的388篇论文,题录导出格式为全记录加参考文献。AI 在知识管理研究领域中应用的论文年度分布趋势见图1。2003—2018 年AI-KM 研究处于平缓阶段,该时间段人工智能与知识管理的交叉研究平稳发展,论文产出多年来未超过30 篇。2015 年,论文数首次超过30 篇,并在2017 年达到了40 篇。这种增长反映了AI 技术在知识管理领域的应用近15年来处于平稳发展的状态。

图1 AI 在国际知识管理研究领域中应用的论文年度产出分

在科学计量与知识图谱绘制上,本文使用CiteSpace 5.4 和VOSviewer2 款软件。CiteSpace 是由国际著名的信息可视化专家陈超美教授用JAVA 语言开发的、基于引文分析理论的信息可视化软件[12]。VOSviewer是由荷兰莱顿大学的Nees Jan van Eck等[13]于2009 年开发的用以绘制各个领域科学知识图谱的文献计量分析软件。数据清洗、分析及制表主要使用excel 2007。

本文将从以下4 个方面对题录数据进行研究:一是通过Web of Science 数据库中检索到的AI-KM研究论文,来了解主要研究群体是哪些人和机构;二是通过构建关键词共现网络时间线图,并进行节点中心性分析、突显主题探测,来研究AI-KM 研究的主题都有哪些;三是通过文献共被引分析、聚类分析,识别出高影响力论文,并分析其内容特征;四是通过期刊双图叠加,识别出AI-KM 研究的期刊分布与知识吸收。

2 结果

2.1 AI-KM 研究主体

我们基于Web of Science 数据库中检索到的388篇论文进行机构和作者发文量排名前10 的微观统计,结果如表1 所示。机构发文方面,2003—2019年,只有来自中国香港的香港理工大学产出超过了10 篇,来自西班牙的格拉纳达大学以9 篇产量紧随其后,来自中国台湾的国立台湾科技大学以7 篇排名第3。吉罗纳大学(6 篇)、多伦多大学(5 篇)、卡洛斯三世马德里大学(5 篇)、加泰罗尼亚政治大学(4 篇)、帕维亚大学(4 篇)、阿姆斯特丹大学(4 篇)、卡拉布里亚大学(4 篇)这7 个机构发文量均小于10 篇。值得注意的是,这些高产机构的前10 名中没有一个机构是来自中国大陆的。这些机构首次发表AI-KM 论文的时间分布在2003—2011年,香港理工大学和格拉纳达大学首次发表时间都是2003 年,是高产机构中发文最早的2 个组织。在作者层面上,WANG WM(7 篇)、CHEUNG CF(6篇)、SANCHEZ-MARRE M(6 篇)、LEE WB(5 篇)、RODRIGUEZ-RODA I(5 篇)、TERENZIANI P(5 篇)发表的论文都达到了5 篇以上,CHAU KW、CHENG MY、CHOY KL 及COMAS J 均只有4 篇。他们是过去15 年国际上AI-KM 研究领域内最为活跃的组织和个人。

表1 国际AI-KM 研究产出论文量排名前10 的机构和作者 单位:篇

表1(续)

2.2 AI-KM 研究主题

通过关键词共现网络可以从宏观上分析AI-KM的研究热点及其联系,节点大小代表关键词出现频次,节点越大代表出现的频次越多,节点之间连线代表关键词之间存在共现关系,连线的宽度代表了共现强度,连线的颜色代表了首次共现的时间。通过CiteSpace 5.4 软件绘制得到了2003—2019 年节点数量为104,合作关系数为371,密度为0.069 3 的关键词共现时间线图,如图2 所示。由共词网络可以统计出2013—2019 年国际AI-KM 研究的高频关键词,按共现频次从高到低依次是人工智能(130)、管理(68)、系统(58)、知识管理(45)、模型(43)、专家系统(40)、知识(36)、设计(26)、人工神经网络(21)、框架(21)、神经网络(20)、决策支持系统(19)、性能(16)、本体论(14)、技术(13)、分类(12)、遗传算法(11)、算法(10)、预测(10)。共现高频词首次出现的时间段主要集中在2003—2013 年。这些高频关键词反映了国际AI-KM 核心研究主题和方法。

图2 国际AI-KM 研究关键词共现时间线图

在时间线图上,形成了6 个包含不同关键词的聚类,分别是0#theme logic structure identification(主题逻辑结构识别)、1#repetitive construction processes(重复施工工艺)、2#comprehensive evaluation(综合评价)、3#pull control policies(拉动控制政策)、4#networked enterprises(网络化企业)、5#medical web information(医疗网络信息)、6#decision support system(决策支持系统)。不同聚类里包含有相应的关键词,按照出现的先后顺序展示在时间线图中。早期的关键词通常词频更高,反映的是早期国际AI-KM 研究的主题,主要有人工智能、管理、系统、知识管理、模型、专家系统、设计、决策支持系统、分类等。后期的关键词词频相对较低,如近3 年出现的大数据、行业、财务困境预测、文本挖掘、平衡核心卡、临床决策支持、故障检测、资产管理、粒子群优化、进化、建筑学、嵌入性、记忆、机器智能、教育、认知计算、故障管理、情绪分析等,体现了AI-KM 领域的一些应用和研究前沿热点。中介中心性(Betweenness centrality)是测度节点在网络中重要性的一个指标,使用此指标来发现和衡量文献的重要性。将中介中心性大于0.1 的共现关键词按从高到底排序依次为知识(0.3)、知识管理(0.24)、人工智能(0.2)、框架(0.17)、专家系统(0.16)、管理(0.14)、神经网络(0.12)、本体论(0.12)、模型(0.11)、人工神经网络(0.1)。综合中心性及时间线图看,文本挖掘、嵌入性、认知计算、故障管理等是近3 年AI-KM 研究的前沿热点。

Burst 突显主题检测用于探测主题、作者、文献、期刊的突发性变化,可以反映在一定时期内相关主题的重要性程度。通过检测共探测到7 个突显主题(表2),按照时间先后顺序分别是decision support(决策支持)、expert system(专家系统)、artificial intelligence(人工智能)、decision support system(决策支持系统)、ontology(本体论)、design(设计)、decision making(决策)。从突显主题的分布来看,国际AI-KM 的研究在决策支持、专家系统以及设计方面关注度较高。从时间跨度来看,与决策有关的主题突显时间最长,从2003 年开始一直持续到了2019 年,反映了人工智能技术在知识管理决策系统方面的运用研究热度持续时间较长。在2009—2015年这个阶段中,国际AI-KM 研究对本体论、设计的研究关注程度较高。

表2 国际AI-KM 研究关键词共现突显前10 的主题

表2(续)

2.3 AI-KM 研究文献共被引分析

通过文献共被引分析可以从宏观上分析国际AI-KM 研究的高被引文献及其引证关系,采用VOSviewer 软件制作文献共被引标签视图,阈值设置被引次数4 次及以上,得到包含62 篇文献的共被引图谱,如图3 所示。圆形大小代表文献被引频次的高低,面积越大代表文献被引用的频次越高,相同颜色则代表文献属于同一聚类。从图谱中可以看出,AI-KM 的高被引文献共有8 个聚类,每个聚类都有一篇影响力较大的核心文献。总体上看,共被引文献群落分布较均匀。

图3 国际AI-KM 研究文献共被引标签视

对图谱进行深入分析,从中我们可以提取出被引频次超过10 次的6 篇文献信息,如表3 所示。1号文献“基于案例的推理:基础问题、方法变化和系统方法”概述了基于案例推理的基本问题,总结了案例检索、重用、解决方案测试和学习的方法,并讨论了基于案例的方法在集成系统架构中作为一种推理和学习方法的作用[14]。2 号文献“知识创造公司:日本公司如何创造创新动力”是一本专著,作者是Hitosubashi 大学的管理学教授野田光二,他在书中明确了2 种类型的组织知识:包含在程序和手册中的显性知识和仅凭经验学习的隐性知识[15]。3 号文献“基于案例的推理”是该主题的第一本综合性著作,书中阐述了基于案例的推理系统是如何根据存储在内存中的案例信息来解决新出现问题的[16]。4 号文献“信息与控制”系统介绍了模糊集的概念,并将包含性、并集、交集、补集、关系、凸性等概念推广到这类集合中,明确了模糊集合背景下这些概念的各种性质[17]。5 号文献“知识管理和知识管理系统:概念基础和研究问题”是一篇研究综述,文章在对不同领域的知识管理文献进行了回顾和解读基础上明确了该领域的研究重点,并详细介绍了组织知识管理的过程视图以及信息技术在这一过程中的潜在作用[18]。6 号文献“可移植本体规范的翻译方法”描述了一种在表示系统上定义可移植本体的机制,以标准格式编写的谓词演算定义由一个称为本体语言的系统翻译成专门的表示形式,使得研究人员可以共享和重用本体,同时保留专门实现的计算优势[19]。这6 篇高被引文献对国际AI-KM 研究有较大的影响。从发文时间上看,有4 篇文献是上世纪九十年代中期发表的,2000 年以后高被引论文较少。从涉及主题看,包括了知识管理、知识管理系统、显性知识、隐性知识等基本概念以及基于案例的推理、信息与控制、模糊集合等智能控制的算法,大部分是AI-KM 研究的基础理论和方法。

表3 国际AI-KM 研究文献共被引超过10 次的论文

2.4 AI-KM 研究的期刊分布与知识吸收

通过期刊的双图叠加分析可以从宏观上分析AI-KM 研究相关期刊在学科期刊地图上的分布及其与其他期刊间的联系。对2003—2019 年国际AI-KM研究期刊数据进行期刊的双图叠加分析,如图4 所示。左边是基于10 000 多种SCI/SSCI 期刊之间的引证关系创建的期刊地图,叠加后的椭圆代表了施引期刊在科学期刊地图中的位置,右侧的期刊图谱基于期刊的被引关系构建,每一个点也代表了被左侧施引期刊所引用的期刊[20]。作为施引期刊的2003—2019 年AI-KM 研究期刊位于左侧,椭圆的横轴表示了2003—2019 年AI-KM 研究发表论文的作者数量,椭圆的纵轴轴则反映了AI-KM 在2003—2019 年所发表的论文量。

图4 国际AI-KM 研究在2003—2019 年引证期刊轨迹

图4 中的每个引证轨迹代表了AI-KM 所引用文献的来源期刊。从左侧宏观的期刊类团位置上来看,388 篇AI-KM 论文期刊最主要分布在"数学、系统、数理”领域,代表期刊有(数字为引用次数)[24]EXPERT SYSTEMS WITH APPLICATIONS(中文名《专家系统及其应用》,主要发表有关专家系统的设计、开发、测试、实施、管理方面的研究论文)[7]、JOURNAL OF INTELLIGENT MANUFACTURING(中文名《智能制造》,主要刊发有关人工智能在制造业中应用的研究论文)、[7]ENGINEERING APPLICATIONS OF ARTIFICIAL INTELLIGENCE(中文名《人工智能的工程应用》,主要刊发有关人工智能方法在工程各个领域的实际应用的研究论文),其次是位于地图正下方的“心理、教育、健康”领域。结合引证轨迹,得到其引用期刊最大的引用领域是“系统、计算、计算机”,代表期刊 有[16]EUROPEAN JOURNAL OF OPERATIONAL RESEARCH(中文名《欧洲运筹学杂志》,主要刊登运筹学方法论(OR)和决策实践方面的研究论文),其次是“心理、教育、社会”领域。宏观来看,这4 个主要领域还存在着交叉引用的情况。除此之外,AI-KM 研究期刊还在“生态、地球、海洋”“分子、生物、遗传”等领域有分布和引用。从叠加图我们可以大体明确国际AI-KM 研究所分布的期刊及其与其他期刊间的联系和知识吸收关系。

3 结论

针对2003—2019 年国际AI-KM 研究主题论文,从高产作者和机构、主题共现、高被引文献网络,期刊叠加等方面进行了知识图谱分析,得到以下结论:

(1)国际AI-KM 研究主要集中在香港理工大学、格拉纳达大学、国立台湾科技大学等机构,且发文时间也相对较早。WANG WM、CHEUNG CF、SANCHEZ-MARRE M 等作者是过去15 年国际上AI-KM 研究领域内较为活跃的研究主体。中国大陆在该领域的研究相对薄弱。

(2)国际AI-KM 研究重点关注的主题涉及专家系统、人工神经网络、决策支持系统、本体论等方面,分别分布在主题逻辑结构识别、重复施工工艺、综合评价、拉动控制政策、网络化企业、医疗网络信息、决策支持系统7 大类群中。文本挖掘、嵌入性、认知计算、故障管理等是该研究领域的前沿热点。大数据、平衡核心卡、临床决策支持、故障检测、粒子群优化、嵌入性、认知计算等可能是今后研究的新热点。

(3)国际AI-KM 研究高被引论文的主题集中在知识管理、知识管理系统、显性知识、隐性知识等基本概念以及基于案例的推理、信息与控制、模糊集合等技术方法等方面。从时间上看,有重要影响力的高被引文献集中在了1993—1995 年,这些高被引论文为后后续人工智能技术在国际知识管理中的应用提供了研究基础,而近20 年高被引论文相对缺乏。

(4)国际AI-KM 研究的期刊主要分布在“数学、系统、数理”和“心理、教育、健康”等领域,并从“系统、计算、计算机”“心理、教育、社会”等学科领域进行知识吸收,说明AI-KM 研究交叉性较强。国际AI-KM 研究重点期刊主要有《专家系统及其应用》《智能制造》《人工智能的工程应用》《欧洲运筹学杂志》。