APP下载

人工智能研究热点发现

2023-08-01车晓燕

现代信息科技 2023年11期
关键词:可视化分析人工智能

摘  要:以SCIE数据库为数据源,使用CiteSpace可视化分析软件,通过关键词聚类、突现词辨析等方式,从作者、发文机构、关键词及研究前沿等角度分析国内外人工智能的研究热点及研究方向随时间的演进过程,了解人工智能研究趋势。同时对研究领域的主体进行了提取,并对他们的合作程度、科研力量进行了分析,追踪主要研究机构的科研动态。

关键词:可视化分析;CiteSpace;图谱分析;人工智能

中图分类号:TP391.1 文献标识码:A  文章编号:2096-4706(2023)11-0116-04

Discovery of Research Hotspots in Artificial Intelligence

—Analysis of Highly Cited Papers Based on Visual Tool

CHE Xiaoyan

(Beijing Institute of Petrochemical Technology, Beijing  102617, China)

Abstract: This paper takes SCIE database as the data source, uses CiteSpace visual analysis software, through the means of keywords clustering, sudden words discrimination and so on, and analyzes the evolution process of research hotspots and research directions of Artificial Intelligence at home and abroad over time from SCI database from authors, publishing institutions, keywords and research frontiers and other perspectives, so as to understand the research trend of Artificial Intelligence. At the same time, the main body of the research field is extracted and their cooperation degree and scientific research strength are analyzed, and the scientific research dynamics of the main research institutions are tracked.

Keywords: visual analysis; CiteSpace; atlas analysis; Artificial Intelligence

0  引  言

人工智能是一个综合性非常强的学科,研究内容广泛丰富。人工智能技术发展过程中加速了许多新兴行业的诞生。目前,人工智能技术除了在搜索引擎、推荐系统、计算广告、人脸识别、图像识别、语音识别、机器翻译、游戏博弈等领域大规模成功应用外,还在蛋白质结构预测、新药发现、国防军工等领域有了突破性的进展[1]。

为了探索人工智能研究脉络、前沿成果,发现AI科研团队及其研究重点,本文使用可视化软件CiteSpace对近十年人工智能相关文献进行了计量和图谱分析,梳理了其研究现状和发展趋势,以期为我校人工智能学科的研究提供可潜在的参考方向及合作目标。

1  数据来源与方法

本文数据来源于Web of Science检索平台的“Science Citation Index Expanded”数据库,以artificial intelligence为检索词,主题检索为路径进行精确检索,时间跨度为2011—2021年,检索结果近2.5万条,经过InCites数据库筛选出具有学科高认可度与影响力的高被引记录进行分析。

CiteSpace是一款基于Java语言开发的分时、动态和多元的科技文本挖掘及可视化的软件,通过寻径网络算法和共被引分析理论对文献进行计量分析,以探索某学科领域的演化路径、研究热点和研究前沿[2]。

2  研究热点与趋势分析

2.1  关键词分析

关键词反映的是文献主要内容,是文献的核心,高度概括了文献的研究目的、研究对象和研究方法[3]。因此,通过知识图谱分析关键词,其共现结果体现出某一学科在某一时间内的研究较为集中的方向。某一关键词在网络中的地位重要性常以关键词的中心性表示,高中心性及高频数的关键词代表着某段时期内研究者共同关注的问题,即研究热点[4]。

在设定阈值范围内,图1中显示节点标签为近十年出现频率最高的关键词,分别为神经网络、归类、模型、预测、算法、优化等,出现的频次分别102、81、74、64、51、37、32,这些高频词的首次出现时间大多在2012—2014年,是该分析时间段早期的研究热点,支撑向量机在2017年首次出现在人工智能研究领域,且中心度达到0.05,是近五年出现频次最高的关键词,另外后期中心度达到0.05的关键词还有建筑(0.11)、诊断、风险,是近期人工智能高被引论文中提取出的研究热点。

2.2  研究时间趋势分析

為了解不同时间切片人工智能研究关注点的动态变化与发展趋势,根据关键词首次出现的时间,将研究时间段内人工智能研究领域内的关键词建立时间横坐标图,如图2所示,按时间维度展现了十年间各年度出现的领域内研究主题,节点越大,表示该词的重要性越大,连线越多表示关键词之间的联系越多。

关键词时间趋势分析图中,各个高频词出现的时间点一目了然,神经网络、模型、模拟、优化等在研究时间范围早期已经存在,2017年后出现了支持向量机,卷积神经网络,逻辑回归。近两年出现的高频词以贝叶斯树,数据挖掘技术,修剪树安全性时出错,5G等,代表该领域最新的研究方向。

2.3  研究学科领域

从学科领域分析来看,在数据分析时间段内,早期的人工智能应用学科主要集中在计算机科学、工程、科学技术等较宏观的学科领域,2015年后用于心脏、心血管方面,而近几年研究主要集中在医药研发、健康保健等领域。并将有望从医疗大数据时代进入医疗大智能时代,真正让智能技术深度参与其中,提高筛选药物的准确性和效率[5]。

2.4  关键词聚类分析

聚类分析可以反映某领域的主题结构,对关键词进行聚类分析能够整合领域的研究内容和热点。一般认为聚类模块值大于0.3说明聚类结构显著,聚类平均轮廓值S>0.5聚类结果合理。

利用CiteSpace对高频关键词进行聚类分析计算后,关键词数据集合归于不同类,有较高相似度的高频词数据对象被分在同一类中,因而形成不同的关键词聚类块,类目号数字越小,聚类中包含的关键词越多。

聚类结果反映了人工智能研究领域中各分支领域。本研究范围内边缘计算、共晶溶剂、电子皮肤聚类明确,如图3所示,说明这几个研究领域成果更多,类内关键词相似度更高。

2.5  关键词突现

利用CiteSpace词频探测技术,可以探测数据突发,能捕捉到短时间内产生大变化的量值,使用关键词突现的计算分析功能可以获取重点关键词随着研究年份的变化趋势。在一定程度上反映某阶段的研究关注热点,有助于预测本领域的研究趋势。

一个研究前沿的兴起,必然会使相关关键词在短时间里频出,该前沿要么演变为下一个热点,要么证明方向错误很快被学者们抛弃,不管该关键词代表的前沿方向能否成为研究热门,其突现强度必然是远大于没有被广泛关注的关键词。

在CiteSpace图谱分析中,选择minute为1,时间跨度为2011—2021年,做关键词词频分析,共出现10个突现词。

算法、神经网络等热点发生在时间节选段的初期,2—4年内纳米管是研究时间段最早出现的突现词,2013年出现,热度持续三年。电子皮肤紧接着成为该领域的研究热点,在接下来的3年内比较集中,2018年不再是该领域的热点。而物联网、优化、肺炎等正是近几年的研究热点,一直延续到2021数据更新年。根据关键词词频分析中后期新增的热点词以及趋势分析中后期突发词,可以判断人工智能研究的前沿或热点领域为物联网及优化。

3  研究主体分析

3.1  主体机构分析

在本研究范围内,发表论文数量居前的分别为中科院Duy Tan Univ,Ton Duc Thang Univ,Univ Kurdistan Stanford Univ,Islamic Azad Univ,Islamic Azad Univ,UCL MIT,如图4所示。出现频次大于5次的研究机构中,早期有斯坦福大学、香港理工大学以及埃西亚斯大学,近两年首次出现在该领域的为瑞典卡罗斯卡学院和浙江大学,近十年曾在该领域发表高被引论文的国内机构有清华大学、华中科技大学、南京师范大学、北京航空航天大学、复旦大学、天津大学、西北工业大学、四川大学等。

中心度最高的机构为中国科学院、剑桥大学以及麦吉尔大学,数值大于1,达到CiteSpace的关键节点标准。在研究时间段内,斯坦福和香港理工均在2013年已经有高被引人工智能领域的研究成果,中科院始于2015年,而麻省理工学院和前沿人工智能企业DeepMind近两年没有高被引的论文。

从合作强度看,被引用率最高的机构与排名前十的机构之间合作更加紧密,尤其是排名前四位的机构。与中国科学院合作强度最大的是Thang Univ、Islamic Azad Univ两所大学。与Duc Thang Univ合作的机构最多,其中有Duy Tan Univ,Univ Kurdistan,Islamic Azad Univ,中国科学院,香港理工大学,且和前三名有两次共现。中国科学院、西安两所中国机构与亚洲越南伊斯兰库尔德等几个地区的机构合作较为紧密。马来西亚的学术合作机构主要与来自越南。东南亚学术机构源于地理属性,地区合作紧密。英美的合作相对他们与亚洲而言更加紧密,Ucl与DeepMind合作强度最大,美国内部机构合作频繁。

3.2  个体共现及共被引分析

3.2.1  作者共被引

当做作者共被引时,本质是将一篇施引文献的所有参考文献中的第一作者提取出来。CiteSpace分析出的数据,借助SCI数据库读取参考文献中著者信息的完整记录。

在本研究范围中的作者共现,最早的参考文献发表于2004年,尽管是早期的文献,但是被引量并不高,大多低于两次,而被引用率前三十位的文献均发表于2012年后。导致这种现象的部分原因为科技论文发表高峰在近十年内,另一方面也说明人工智能技术在2015年后得到了快速发展。

如图5所示,被引量最大的文献分别是2016年LeCun被引用126次,2017年Esteva被引用69次,2016年Gulsan发表的论文,被引频次为53次。2018年Li、2015年SchmiUber、2015年Jordan、2016年Bui发表的论文中心度大于0.1,达到了CiteSpace高中心值。

3.2.2  作者共现分析

在分析共现作者时,可以从作者的出现频次及强度方面分析运算结果。通过CiteSpace对人工智能800余篇高被引文献进行作者共现分析,进行数据统计分析,如图6所示,图中的节点大小代表了作者发文数量的多少,颜色色调代表了研究时间的早晚,冷色系代表研究时间早期,暖色为近期时间代表。连接线条的粗细代表了作者之間的联系强度,从图中可见,发文最多的是Himan①、Ataollah②、Wei③、Baharin④、Bui⑤、Demis⑥六位作者出现的频率达10次以上,且均是为2017、2018年出现的共被引现象,说明这几位作者在相关领域发表的高质量论文最多。查看分析图谱中的作者节点详细信息,可以获取每位作者的相关论文。

中心度越大,表示该节点在共现网络中的受关注程度越高。中心度最高的三位作者分别为Chen、Li以及Adamowski,说明在该研究范围内这几位作者的影响力广泛,发表的论文被更多作者引用,学术地位较高。

从节点的连线强度可以判断作者联系的紧密程度,作者①与②的合作强度最高,且与③④⑤都有合作,②和①③④⑤也存在合作,⑥相对独立,④和①②③⑤都有合作,排名前十的诸位作者中大多有合作关系,是近年来人工智能研究方向核心人员。

4  结  论

随着技术的不断进步、革新和需求,人工智能在各个领域正在经历快速的融合发展。同时,研究机构的地理分布也在发生着明显变化并伴随着研究成果的剧增,科研主要力量从21世纪初的欧美正在向亚洲地区转移。

早期研究中,人工智能主要涉及計算机、工程学科及心血管领域,近些年与医药研发、健康保健等方面紧密结合。具体研究内容由神经网络、模拟、优化逐渐转换方向至支撑向量机、建筑、诊断、风险评估、物联网等。未来,人工智能跨学科将快速突破,边界被打破,范围进一步拓展,并带来多维度技术和各应用场景的深度结合、叠加。

参考文献:

[1] 郭毅可.论人工智能历史、现状与未来发展战略 [J].学术前沿,2021(23):41-53.

[2] 陈悦,陈超美,刘则渊,等.CiteSpace知识图谱的方法论功能 [J].科学学研究,2015,33(2):242-253.

[3] CHEN C M. The Centrality of Pivotal Points in the Evolution of Scientific Networks [C]//Proceedings of the 10th international Conference on intelligent User interfaces.San Diego:Association for Computing Machinery,2005:98-105.

[4] 陈悦,陈超美,胡志刚,等.引文空间分析原理与应用 CiteSpace实用指南 [M].北京:科学出版社,2014.

[5] 朱珑.抢占人工智能发展制高点 [N/OL].人民日报,2020-06-08(19)[2022-10-15].http://data.people.com.cn/rmrb/20200608/19.

作者简介:车晓燕(1975—),女,汉族,北京人,馆员,硕士,研究方向:学科服务、学研支持保障。

收稿日期:2022-11-28

猜你喜欢

可视化分析人工智能
我校新增“人工智能”本科专业
2019:人工智能
人工智能与就业
数读人工智能
高校学生管理法治化研究:基于CiteSpace的可视化分析
我国职业教育师资研究热点可视化分析
声波吹灰技术在SCR中的应用研究
可视化分析技术在网络舆情研究中的应用
国内外政府信息公开研究的脉络、流派与趋势
下一幕,人工智能!