APP下载

知识关联视角下老子“道”学研究多元特征分析与知识体系构建

2022-07-05刘政昊倪珍妮桂文瑄钱宇星

现代情报 2022年7期
关键词:数字人文知识体系知识图谱

刘政昊 倪珍妮 桂文瑄 钱宇星

摘要:[目的/意义] “道”学知识体系庞杂、研究对象众多,从知识关联的视角出发分析和发现老子“道”学研究的多元特征并构建相关知识体系,对于促进新文科背景下老庄研究的系统性与多样性具有重要意义。[方法/过程]采用“作者—关键词”二模网络、主题时序演化网络和语义网络对“道”学研究文献的知识关联特征进行探索分析,并通过构建包含59 286个实体、95 612个关系实例的老子“道”学研究知识图谱实现知识体系的初步构建。[结果/结论]依托知识图谱构建的老子“道”学研究知识体系为道学研究者提供了关联知识发现的依据,其实现方案也为数字人文领域学者提供了新的视角。

关键词:老子道学;知识关联;知识图谱;数字人文;知识体系

DOI:10.3969/j.issn.1008-0821.2022.07.004

〔中图分类号〕TP391;G254;B223.1〔文献标识码〕A〔文章编号〕1008-0821(2022)07-0042-15

Multi-characteristic Analysis and Knowledge System Construction of

Lao Zi“Taoism”Study from the Perspective of Knowledge AssociationLiu Zhenghao Ni Zhenni Gui Wenxuan Qian Yuxing

(1.School of Information Management,Wuhan University,Wuhan 430072,China;

2.Center for Studies of Information Resources,Wuhan University,Wuhan 430072,China;

3.Institute of Big Data,Wuhan University,Wuhan 430072,China)

Abstract:[Purpose/Significance]Because of the complexity of Taoisms knowledge system,there are many schools of study.It is of great significance to analyze and find the development trend and multiple characteristics of Laozis“Taoism”research by using relevant literature data from the perspective of knowledge association.[Method/Process]This paper explored and analyzed the characteristics of knowledge association in Laozis academic research by using co-occurrence network analysis,topic timing evolution and semantic knowledge query respectively.Moreover,the“Daoism”study knowledge graph containing 4,662 entities and 1,933 relationships were constructed.[Result/Conclusion]The knowledge system of Lao Zis“Taoism”research provides a basis for Taoist researchers to discover related knowledge,and its implementation scheme also provides a new perspective for scholars in the field of digital humanities.

Key words:Laozi Taoism;knowledge association;knowledge graph;digital humanities;knowledge system

中華优秀传统文化博大精深,是一个国家和民族传承与发展的根本。党的十九大以来,习近平总书记多次就传承发展中华优秀传统文化做出重要论述[1-3],并强调文化自信作为我们中华民族最深沉、持久的力量[4],做好传统文化的保护与传承意义重大。老子“道”学作为我国优秀传统文化的代表之一,其深刻思想与内涵对于当代社会发展和价值传承具有重要作用[5],传承和发展以老子“道”学为代表的中华民族优秀传统文化既是文化自信的根本表现,也是构建影响世界的国家软实力、彰显国家文化魅力的核心要义。

老子“道”学是关于世界有无联系和系统发展的学说,又称大道学说或系统有无主义[6]。随着道学的不断传承和发展,衍生出了多样化的思想和理论,也进一步产生了不同的研究视角。传统的老子“道”学研究多从起源发展、思想内涵、文化传播等方面展开,重点对道家文化宗教起源[7-8]、哲学思想内核与著作[9-10]以及文化在国内外的传承与发展[11-13]进行较为详尽的论述,但由于其知识体系繁杂,研究对象众多,内容涉及本体论、认识论、逻辑学、系统论等诸多方面[14],导致长期以来相关研究未能形成一套相对规范成熟的体系,对于老子“道”学研究知识体系的构建也十分欠缺。

在新文科背景下,数字技术可以为传统文化研究赋能,并为传统文科相关研究领域的知识组织与重构提供技术支持[15-17]。知识组织是对知识进行高效管理和有效利用的基础,其关键在于根据不同类别知识内部间的联系,建立起次序化、规范化、系统化的知识关联体系[18]。老子“道”学相关研究文献作为结合先人智慧与现代思想的载体,从文献知识关联的角度发现该领域研究的特点、梳理完整的知识体系,对于后续系统性、多样性、创新性开展老子“道”学研究具有重要意义。

本研究以知识关联为切入点,针对老子“道”学研究中体系结构繁杂、内容多元分散等问题,从文献计量和知识组织层面,在总结和分析学术互动关联、主题演化关联、语义知识关联3种关联模式下老子“道”学研究多元特征的基础上,融合文本挖掘、知识图谱等自然语言处理技术,构建了包含“道”学研究主流知识结构和内容的知识体系图谱,为该领域研究的知识关联特征和学术热点发现提供了可供借鉴的方法与思路。

1相关研究

道学(Taoism)之名,始见于《隋书·经籍志》,原指老子创立的有关道的学说,广义上包括哲学的道家、宗教学的道教以及属于人体生命科学范围的内丹学,因而相关的知识结构、论述学说非常多元。道学作为中华本土文化的核心之一,从古至今都倍受哲学家、思想家及相关人文学者的关注。已有的研究中,很多学者结合自己的研究领域,选取某一研究视角对老子道学从不同层面进行不同侧重的解读,如李黎鹤等、詹石窗等从考古学与宗教学的角度出发,通过考察对比大量古文化遗存,对道学文化的起源和发展进行了描述性研究,并通过对该时期文物的研究对道教产生的历史环境和背景进行了十分详尽的分析与推测[7-8];詹石窗等、王文东以凝聚老子思想的《道德经》为主要研究对象,从文献学、哲学等研究视域出发,对老子道学的哲学内核进行了深入探讨与分析[9-10];汪桂平、李丰楙则从文化传播的研究视角对道教文化的国内外传承与发展进行了剖析,认为道学文化自华夏浓厚的伦理文化土壤中孕育诞生以来,在国内河西走廊以及马来西亚、日本等国家(地区)的传播塑造了整个东亚文明,且对于在国际冲突加剧、文化碰撞长存的今天依然具有积极启示意义[11-13]。

虽然老子道学的研究视域非常广阔,但也容易导致对老子道学核心思想把握不足、研究内容过于分散等现象,因而建立相对完整、规范的老子道学知识体系十分必要。现有的相关研究最早可追溯到明末清初思想家王夫之的“天道本体论”,他借鉴老庄朴素哲学思想提出了基于“道—性—心”的“内圣学”体系结构[19]。现代学者胡孚琛对道学的知识体系进行了更进一步的研究,并指出老子道学主要包含天地人哲学、政治管理学、文艺审美学、医药养生学、宗教伦理学、自然生态学、丹道性命学、方技术数学八大支柱[20];吴成国则认为“道生万物、道法自然、道常无为而无不为、弱者道之用、反者道之动”等思想即为代表老子“道学”智慧的核心体系[21]。此外,佘振苏在著作《复杂系统学新框架:融合量子与道的知识体系》中与现代量子物理学概念相结合,在继承中国道哲学的系统论思想的同时,建立了一个一元二面多维多层次的复杂系统本体论,并提出未来道家哲学和科学融合发展的三大主题:量子、生命与心灵[22]。

从上述研究可以发现,现有研究主要依赖领域专家的人工构建,从多个维度对老子道学本身的知识体系进行了不同粒度的分类。除借助专家的领域知识外,利用道学相关研究文献数据进行计量分析也可以挖掘出老子道学的主流研究范畴和研究内容,从而可以对老子道学知识体系进行进一步的完善与补充。当前,学术文献知识体系量化构建的思路与方法主要体现在以下两个方面。一部分学者更关注宏观的学术知识流动与主题演化,他们通常借助Citespace等科学计量工具,重点研究领域的学术热点和发展脉络。如翟宏堃等探索了国际心理健康素养领域的主题演化路径[23];王金丽等对区块链文献进行计量分析,得到了领域主题聚类与演化特征[24]。另一部分学者则更偏重于微观层面的知识组织,往往借助自然语言处理等技术实现知识的抽取、分类和融合。对于体系相对简单、结构性较强的领域,研究者多采用自底向上的自动化构建技术,如黄龙针对共享经济领域基于深度学习和神经网络自动化构建知识体系,并形成本体库[25];林鑫等对医学喹诺酮类药品不良反应子领域进行了知识体系的组织与重构[26]。而对于体系庞杂且呈现出碎片化特征的学科或知识,不少学者采用自顶向下构建知识网络的形式以加强知识间的关联性,如刘丰军等提出了网络百科知识的协同网络模型[27];贾力维等则对网络教学中碎片化知识进行整合与知识网络构建[28]。

随着知识图谱(Knowledge Graph)的提出与兴起,微观层面的知识组织与体系构建有了新的进展。知识图谱是一种用图模型描述知识和建模关联关系的技术方法[29],起源于语义网络,最初由Google提出用于优化搜索结果,发展至今已经应用于金融、医疗、人文等各个垂直领域的知识构建[30-33]。从知识组织的角度来看,知识图谱可以被理解为一种开放的语义知识关联与服务技术,知识关联是知识组织的核心环节,而知识图谱本质上就是知识关联的一种技术实现方式[34],可以有效描述真实世界中存在的各种实体和概念,并挖掘它们之间潜在的关联关系,因而成为表征复杂知识体系的主流方法。

综上,老子“道”学内容庞杂,学者们多选取某一细分领域或视角作为研究切入点,体现道学知识多元的同时也导致了研究内容过于分散的问题,不利于从整体的角度审视老子“道”学及其研究的宏大知识体系架构和主流特征。现有研究中,很多人文领域专家依靠豐富的领域知识,已对道学知识体系进行了不同维度的划分,本文认为,依靠文献知识间的关联特征对于构建“道”学本身及“道”学研究的知识脉络均能够起到较好的补充作用,并在分析相关研究特征、发现学术热点和研究生长点等方面具备独特的优势。

2研究设计与数据来源

2.1研究框架

本文以知识关联为研究切入点,基于数据驱动的老子“道”学研究知识体系构建思路,从学术互动、主题演化、语义关联三大关联模式出发,借助复杂网络的表现形式将文献研究的多元特征进行可视化分析,并在此基础上通过特征融合实现老子“道”学研究知识图谱的构建,从而发现近现代研究者们对老子“道”学思想内涵及不同对象的多领域、多角度解读方式及主流知识结构与相关学术研究热点。研究框架如图1所示。

2.2数据描述及预处理

本文采用的数据主要包括1933—2020年以来与老子“道”学思想相关的研究期刊和学术论文,由四知数智平台(https://www.kesci.com/org/sizhi)提供,具体包含了16 106篇期刊论文、628篇会议论文、840篇博士学位论文、3 047篇硕士学位论文以及1 042篇报纸文章。其中,期刊论文占比达到73.59%,是老子“道”学及其相关研究的主要来源。考虑到期刊论文数量占比较大且质量较高;学位论文篇幅较长且研究内容更为丰富;会议论文能够反映研究的前沿及热点,具有较好的前瞻性;报纸文章对研究整体趋势分析具有一定的影响,但其摘要及正文内容缺失较多、整体篇幅较短,且研究主题多与期刊、会议文章有所重复。因而将期刊、会议和学位论文文献作为知识关联特征分析的主要数据源。

2.2.1题录数据预处理

题录数据中包含中文关键词和机标关键词。由于早期期刊数据缺少中文关键词,且机标关键词并不能较全面地反映文章主要内容,研究基于TF-IDF算法从全文数据提取关键词作为补充。具体来说,首先将期刊论文、会议论文和学位论文的关键词作为用户自定义词典对全文数据进行分词,计算在该语料库中每个词语的词频(Term Frequency,TF)和逆文档频率值(Inverse Document Frequency,IDF),计算公式如式 (1)和(2)所示:

其中,N表示该词在文档中的出现频次,∑kkj表示在文档中所有词语的出现频次之和;∣D∣表示语料库中的文件总数;{j:t∈d}则表示包含词语j的文档数目。基于自定义的逆文档频率文件,提取每篇文章的关键词,最后将中文关键词、机标关键词以及自动提取的关键词合并,作为每篇文章的关键词。

2.2.2摘要数据预处理

考虑到文章摘要是对文章的精炼概括,涵盖内容与主题密切相关,因此选择相关文章摘要作为数据源。然而,在数据统计时发现,16 102篇期刊文章中有781篇缺失摘要、3 441篇摘要为全文部分内容,为了提高摘要数据的质量,研究利用TextRank算法对其进行抽取式摘要生成。

TextRank是基于拓扑结构的关键词抽取算法[35],该算法的基本思想源于PageRank算法,给定一段文本或句子T,经分词、词性标注等预处理后得到候选关键词/句序列,而后构建图G=(V,E),其中V是候选关键词/句组成的节点集,E是基于节点共现关系连结形成的边,图中任意两节点间的边权重为w。对于其中任意的节点(候选关键词/句)v,其TextRank值可通过式(3)迭代后得到。迭代至收敛后,按照节点权重由大到小对所有节点排序,最终可以得到文本T中最重要的k个关键词/句。

在摘要生成任务中,TextRank算法認为两个相似句对应的节点间存在一条无向有权边,句子间语义相似度计算方法如式(4)所示;该算法原理简单,且无需构造数据集训练。

TextRank算法通过计算句子之间的相似度与重要程度,得到句子的TextRank值。对于所有摘要缺失或错误的数据,选择每篇文章得分最高的前5个句子作为该文章摘要,为开放域的知识抽取补充高质量数据源。

3老子“道”学研究多元特征分析

3.1研究趋势整体特征分析

研究首先对各来源文献类型在1933—2020年12月近百年来的发文量及增长趋势进行了统计描述,其结果如图2所示。

从图2中可以大致看出,老子“道”学的研究已有近百年历史,总体上历经了缓慢增长、迅速增长与快速消退三大趋势。为了深入研究演化趋势,本文针对特殊的时间节点,结合当年文献的研究主题和内容,将“道”学研究发展历程划分为五大阶段,即萌芽期(1933—1977)、初探期(1978—1992)、快速发展期(1993—2007)、鼎盛期(2008—2016)以及衰减期(2017至今)。在获取的所有文献数据集中,相关研究最早可以追溯到1933年发表的《诸子学案绪言》,此时关于“道”的研究处于萌芽阶段,受限于时代及论文收录情况,早期论文数量较少,且相关研究局限于对道学文化本身的理解。此后的四十余年里,关于“道”及其相关内容的研究依旧较少,学术成果主要以期刊文章的形式展现,研究体系并不成熟,增长较为缓慢。1978年改革开放以来,我国提出了建设社会主义精神文明的重要思想,对于传统文化的研究开始受到重视,关于“道”的研究成果载体和内容均呈现出多样化的特点,相关研究也渐成体系,并扩展到对相关文化思想内涵的深刻解读。1993年,郭店楚简的发现使得学者对道家学派的作品原貌有了深层次的理解,相关研究得到很大程度的推进。加之这一时期我国提出建设有中国特色社会主义先进文化的指导方针,在流行文化盛行、消费主义初见端倪的格局下,对传统文化的研究成为一大热点。因此,此后相关研究进入快速发展期,以“道”为主体的学术研究整体上呈现快速增长趋势,并于2011年达到顶峰。然而2012年以后,老子“道”学的相关研究数量却逐年递减,并在2016年以后有加剧的趋势。不过虽然发文数量有所减少,但研究内容却逐渐趋向于对“道”学衍生的相关领域的探索,如美学、法学、生态学、茶艺学等,可见学术界正在尝试扩展研究边界,并从多种视角挖掘新的研究内容。

3.2学术互动关联特征分析

为了分析不同学者的研究领域及学者间的合作情况,本文将关键词及作者按照频次排列,选取排名前100的关键词及作者,得到如图3所示的“作者—关键词”二模网络,其中以“@”开头的节点表示作者,以“#”开头的节点表示关键词,节点大小表示频次高低。节点间的连线表示共现关系,图中显示了共现频次高于10的关系,连线越粗表示两个节点间的共现频次越高。此外,该图还反映了共现相关性强度的聚类结果,不同颜色表示不同类别。

由图3可知,学者们对于“道”的研究大致集中于对于“道”具体内容层面的解读及应用(红色部分),以及更为宏观的、对于不同学派和思想的对比、融合及分析(黑色部分)。对于老子“道”学的研究主题则相对广泛,且多数学者更倾向于聚焦领域内的某一具体概念进行个人解读与思考,因此网络中除了“万物”与“道家”两个节点外,不存在度中心性较高的关键词与作者,网络全局聚集系数也较低。由此可见,一方面,与自然科学和社会科学相比,人文科学更注重于对某一研究问题的立场和独立思考,因此科研人员间流动与合作的现象并不明显;另一方面,在“道”学相关研究中,目前仍处于百家争鸣的学术环境之中,明显的学术派别尚未形成,这对老子“道”学的研究提供了相对包容的环境,也更有利于促进多元思想和方法地融合。

3.3主题演化关联特征分析

主题演化分析能够较好地识别某个研究领域在一定时间内的主题发展、演化与流变特征,从而帮助研究者更好地了解某个领域的发展。研究对关键词进行了基于时间演化的细粒度聚类,利用VOSviewer绘制主题时序网络,如图4所示。其中每一列表示一个主题,并自下而上反映了各主题随时间的演化情况。

在确定主题大类后,利用CONCOR算法对每个主题依次进行凝聚子群分析,进而确定细分领域,并得到“道”学研究的七大主题内容,如表1所示。七大主题中既包含对于“道”内容层面的解读及应用,也包括对于不同学派、思想的对比及行文风格、典籍翻译等延伸性研究,且各主题之间还存在一定的关联与交叉。

在对于“道”内容层面的解读及应用方面,聚类结果一定程度上印证了胡孚琛所提出的道教的八大支撑体系,即:天地人哲学、政治管理学、文艺审美学、医药养生学、宗教伦理学、自然生态学、丹道性命学、方技术数学[20]。其中,文艺审美学(#2)、政治管理学(#3)、哲学(#4)、医药养生学(#5)、自然生态学(#6)仍然是当下学者关注的重点研究领域,而宗教伦理学、丹道性命学与方技术数学的相关研究较少。人文精神及文艺审美学一方面探讨了老庄哲学中的人生境界[36],如“虚静”“坐忘”;另一方面研究了这种意境在音乐、美术、建筑等方面的渗透,形成自然主义的审美意识[37]。道家的政治管理学主要包括对于政治管理思想的解读[38],如“无为而无不为”“兵强则灭”“小国寡民”等,而近些年对于该主题的研究主要集中于老子思想当代价值[39-40],尤其在企业管理及学生教育方面,老子思想得到了广泛的应用。道家哲学的主要研究内容包括“天道观”“本体论”等[41-42]道家的天地人哲学和“唯物主义”“唯心主义”、新理学等哲学方法论的研究;同时还涉及对诸多哲学家思想的解读与分析,如冯友兰、陈鼓应、海德格尔、牟宗三、王弼。医药养生学包括养生思想、医学理论等[43-44]。主题#6为道家的自然生态学,道家倡导“天道无为”“天人合一”,该思想是当代生态文明建设的核心[45-46]。

关于“道”的延伸性研究,则主要包括学说及版本研究(#1)、行文风格及翻译研究(#2)。主题#1包括不同时期的道家思想的研究,如先秦時期、魏晋时期,以及道家与其他学派间思想的对比与融合,如儒家、法家、墨家。此外,主题#1还包括对于典籍不同版本的相关研究,如帛书老子、楚简老子。主题#7则包括对于典籍的行文风格及翻译研究。该主题早期集中对典籍的语言特征的分析[47-48],如比喻、结构、用词等,后期逐渐转向于书籍的翻译研究[49-50]。

3.4语义知识关联特征分析

老子相关学术研究中充斥着对道家学说、思想及文化的思考论述,针对研究中呈现出的一些客观事实性论述语句,本文拟进一步对其进行细粒度的分析和挖掘,通过对文本摘要的三元组知识抽取并构建老子“道”学研究语义知识网络,以期发现“道”学研究相关知识描述的关联特征及其潜在的学术热点。

3.4.1开放域知识抽取

传统预定义的知识抽取任务中,抽取的目标关系类别是事先定义好的,且给定的语料的结构较为单一,而开放信息抽取的三元组的都是来自于待抽取的句子,无需预先定义抽取的关系,因而非常适合本研究情境,同时也大大提高了抽取效率。基于此,研究采取S,P,O序列标注策略,将三元组抽取视为有监督实体识别任务,建模与实验过程如下。

研究首先采用Python+Tkinter框架自行编写的标注工具对其中的5 000条摘要信息进行了人工标注。在数据标注环节中,对于文本“老子思想与殷商文化有明显的渊源关系。老子作为殷人之后,深受殷商文化影响”,希望得到一些包含(实体,关系,客体)的三元组关系,如(老子思想,渊源,殷商文化)、(殷商文化,影响,老子)等。因此,在不考虑具体的实体和关系即未定义关系Schema的情况下,选择将主语标注为SUBJ、谓语标注为PRED,宾语标注为OBJ。标注示例如表2所示。

实验将标注数据集按照8∶2分为训练集和测试集,采用深度学习模型ALBERT+Bi-LSTM+CRF进行序列标注与实体关系识别,设置最大文本长度为128,训练50个Epoch,具体参数如表3所示。

实验首先利用ALBERT预训练语言模型对字向量进行训练,而后将生成词向量通过与定义的实体标签信息进行合并编码输入到Bi-LSTM模型加强词性分析,捕捉前后文的双向语义信息,最后通过CRF解码得到考虑标签之间依赖关系的全局最优标签序列,完成命名实体识别任务。该模型的整体结构如图5所示。其中,ALBERT层[51]架构的骨干网络与BERT类似,即使用Transformer编码器和GELU非线性激活函数,它对BERT进行了词嵌入向量参数的因式分解、跨层参数共享与段落连续性任务三大改造,因此参数量仅为后者的1/18,训练速度却是后者的1.7倍,大大提升了实验的效率。Bi-LSTM是由前向和后向的LSTM结合而成的一种深度学习模型,在更细粒度的分类时,需要前后词语的频繁交互,而Bi-LSTM可以更好地捕捉到双向的语义依赖。BiLSTM层的输出为每一个标签的预测分值,文本经过ALBERT与Bi-LSTM层后只能得到文本序列与标签之间的关系,却并未考虑标签与标签间的关系,CRF层则能对标签的转移状态建模,从而获得全局最优标签序列。

实验采用精确率(Precision)、召回率(Recall)、F1值(F1-Score)及微平均(Micro Avg)、宏平均(Marco Avg)对实验结果进行评价,最终的实验结果如表4所示。在实际的抽取过程中,由于训练集标注策略的问题,一些句子存在抽取出大量无用的三元组的情况,导致召回率较低;然而作为开放域的抽取实验,由于学术界的研究尚在探索阶段,因此目前在小样本标注数据集的情况下取得上述结果是可以接受的[52]。

3.4.2语义知识网络构建

经过实体消歧和人工校对后,实验最终提取出3 988个有效的三元组,揭示了研究文献中所呈现出的老子与道学、道家思想与道教文化等概念间的复杂关系。相关示例语义三元组如表5所示,其中实体和关系后注有相应的出现频次。

語义知识网络包含丰富的语义关系,并可以被检索查询。图6是基于Cypher语句查询与“天人合一”有关联关系的实体、具有“蕴含”关系的实体以及“老子”与“《道德经》”的距离5以内的所有关联路径。

通过分析语义网络的拓扑结构特性并进行相应的关联查询后可以发现,“主语”节点中与老子及老子“道”学思想和文化相关的实体度中心性较高,可以看出绝大部分文献的研究重点还是老子“道”学的思想内涵和文化精神;而“宾语”节点的度中心性普遍较低,但呈现一定的长尾分布特征,出现较多的词句模式主要是“…思想”“…范畴”“…学(说)”,因此,在构建研究知识体系的时候也会将上述语义信息作为重要参考依据。此外,通过语义知识网络还可以发现涌现出了一批与核心实体相关联,却似乎与该研究领域并不相关的词句,如苏轼、沈从文、柏拉图等人物和大学生心理、企业发展等现象,而这正体现了知识关联的价值。通过语义网络可以关注更多潜在相关的主题,并为进一步揭示二者之间的关系,甚至基于此发现新的学术研究热点和知识体系提供了诸多可能。

4老子“道”学研究知识体系构建

4.1关联特征融合与知识图谱构建

知识体系构建即通过合适的工具及元知识方法对碎片化知识的整合、组织与关联,并将其结构化的过程。前述研究分别从学术互动、主题演化和语义知识3个方面对老子“道”学研究的知识关联特征进行了分析,要构建“道”学研究知识体系,还需将上述特征进行进一步的融合,从知识关联的角度阐述研究学派、研究内容及其之间的内在逻辑。

为此,本研究将上述知识进行了进一步的关联融合,在语义知识网络的基础上构建了包含研究文献、作者、研究主题、关键词、思想学说、观点论述及其他知识实体七大类共59 286个实体和它们之间存在的95 612个关系的老子“道”学研究知识图谱,以作为知识体系的可视化表达方式,如图7所示。其中,文献与作者的关联基于学术互动网络,文献与主题的关联基于主题演化网络,而思想学说、观点论述则提取自语义知识网络中的宾语实体。

4.2老子“道”学研究知识体系

研究基于构建的知识图谱,首先将节点向量化,而后利用社区检测Louvain模块化算法(Louvain Modularity)对图谱进行社区划分和自动聚类,相应的Cypher语句如图8所示。Louvain模块化算法于2008年被提出,其核心思想是:在将节点分配给不同的类别时,通过比较社区密度来查找集群。

通过将簇内连接的密度与平均值或随机样本进行比较,可以量化评估将某个节点分配到某个群组是否恰当[53]。由于计算开销较大,Louvain模块度算法并没有完全采用模块度,而是采用一个启发式函数,因而效率较高;此外,该算法除了能够用于快速检测社区,还揭示了不同规模的社区层次。

实验结果显示共得到215个社区(Community),但其中204个社区成员仅有1人,6个社区成员有2人,1个社区成员有3人,剔除这些类别后共得到4类社区,如表6所示。

根据图谱中的社区聚类情况,本文发现了一些特征相似的研究主题及其研究者,综合分析同一社区内的作者的研究文献主题和关键词后,将主要的研究流派划分为4类,即以研究老子“道”学思想基本内涵及道教哲学思想为代表的“思想创发”派;以研究发掘和弘扬发展“道”学文化或研究相关文学作品、建筑艺术、历史人物等为代表的“文化守正”派;以研究“道”学在现代经济、管理等社会活动中应用的“古学今用”派;以研究从“道”学衍生出的自然、伦理、养生、中医等领域为代表的“学科交叉”派。表7列出了4种研究流派的主要特征、研究主题、涉及的学科及包含的客观知识、代表学者以及各流派之间的相关联系。

“思想创发”派的研究范畴主要集中于道家哲学思想本身,属于哲学或神学、宗教学分支,研究通常对老子“道”学主流学派如黄老、老庄、杨朱学派等进行理论纵深和理论创新,主要代表学者有胡孚琛、章启群、王希坤、杨儒宾等。该学派对应的研究主题主要有#1学说及版本研究、#4哲学;具体到研究内容来看,基于知识图谱的查询可知,老子道家哲学思想学说主要包括朴素辩证法思想、朴素认识论思想、无为而治思想、人本思想、仁学思想、隐逸思想、守柔思想、传统美学思想、健康养生思想;天体宇宙演化学说、象数理学说、五行阴阳学说等。核心观点论述则包含唯物唯实观、自然观、道德伦理观、生命观、大爱大顺观、福祸相倚观;本体论、和谐论、大同论等。

“文化守正”派的研究范畴稍广,涉及文学、历史学、文献学、考古学、艺术学等,这一流派的学者们的共同之处在于从不同角度为道家文化赋予现代意义,并为文化的传承与发展提出自己的思考。主要代表学者有吕锡琛、谭宝刚、刘固盛、王德峰等,研究主题涉及#2人文精神及文艺审美学,#7行文风格及翻译研究。深入到相关研究内容,知识图谱中还反映了一些客观“知识”,如《道德经》《庄子》《周易》《妙真经》《黄庭经》等道学经典著作中表露出的文化内涵,主要包括有与无、动与静、人道与天道、道法自然、天人合一、无为而治、绝圣去智等;图谱中还出现了与老子“道”学密切相关的古代先贤与文人墨客,如张良、刘安、左思、陶渊明、嵇康、李白、张旭、吴道子、苏轼、李清照、郑燮、严复等,表明相关文献研究对古代著名道家信徒的研究关注度较高,并逐渐形成一种研究道学文化的新生长点。

“古学今用”派的研究对象主要是参与现代社会生产活动的主体,如企业、政府、高校组织以及个人,因而这一学派往往会聚焦现实社会问题,强调理论对于生产实践的指导作用,与社会学、管理学、政治学、教育学等联系较为紧密。该流派的代表学者包括葛荣晋、张尚仁、宫哲兵、高厚礼等,研究主题则主要聚焦在#3政治管理学。此外,与“思想创发”派学者相比,该流派的学者们也会涉及道学思想,因此这两个流派的学者多有交叉,如胡孚琛、葛荣晋、高厚礼等学者在两个社区列表中均出现。但不同的是,“古学今用”派通常会在整理阐述上述老子道学朴素思想的基础上,提出一些更为丰富具体的现代思想去指导现代实践活动,如师法自然现代管理思想、以人为本现代管理思想、现代军事伦理思想、自然无为的现代教育思想、去伪教育思想等。

“學科交叉”派的研究范畴最广,相关学者主要以“道”学思想或学说理论作为研究其他学科或领域课题的理论基础,研究主题主要聚焦于#5医药养生学和#6自然生态学,且从研究文献的题目和关键词中可以看出涉及的学科非常多元,不仅涵盖了人文社会科学,还包括生物学、医药学、天文学、地理学、量子力学等,典型的研究内容如“道”学在中医学的应用、基于“道”的生态文明发展思考、道学思想对量子物理领域的启发等。这类学者通常并不是老子“道”学的专业研究人员,而是选择将其作为一种研究视角或理论基础应用在自己的科研领域,因而相关学者的数量也是最多的。此外,该流派的研究文献发表时间普遍较晚,但数量增长却非常迅速,随着新文科的提出,跨学科研究已成为主流趋势,“学科交叉”派将逐渐发展成为老子道学研究的又一主力。老庄道家文化研究陷入衰减期已有4年之久,该流派的相关研究或可为老子“道”学热点前沿研究提供新的思路和方向,从而为引领新一轮研究热潮提供理论支持。

5总结与展望

5.1结论与发现

鲁迅曾说:“中国文化的根基在于道家”。“道”作为中国古代哲学的最高范畴,是老子哲学在中国古代哲学中具有重要地位的最显著的标志。随着时代的发展,道学的范畴不断被扩展,它打破了科学、哲学、宗教三者的界限,将社会科学的各门学科统一起来[54]。本文从知识关联的研究视角出发,融合了文献计量、知识图谱等自然语言处理技术研究老子“道”学研究的多元特征和知识体系,通过对文献数据的多角度关联分析,发现了老子“道”学及研究的演化趋势、主要流派与重点内容。

研究结果表明,自1933年《诸子学案绪言》发表以来,老子“道”学相关研究历经5个阶段,目前已进入研究内容广泛、流派众多但仍局限在传统文科视域的衰退期,论文发表数量较前几年也有所减少,因此急需从多种研究视角出发,对老子“道”学的相关研究进行系统的梳理,并注入新的动力。从研究学术互动关联角度来看,相关研究主要分为两大部分,即对于“道”学思想内涵、文化精神的纵深解读和对道家思想在多领域的应用延伸探索,并兼顾了研究的深度与广度。从研究流派来看,人文领域学者之间的交互较少,并呈现出百家争鸣的学科特征。通过对文献关键词随时间演化的主题关联挖掘,将近百年来的主要研究内容进一步细分为学说及版本研究、人文精神及文艺审美学、政治管理学、哲学、医药养生学、自然生态学、行文风格及翻译研究七大主题,各主题的兴起时间有所差异,如“学说及版本研究”“哲学”两大主题的研究起源较早,而“自然生态学”及“行文风格与翻译研究”出现时间较晚。从语义知识关联的角度出发,各主题内容彼此存在一定的关联性,研究通过对学术论文的开放域知识抽取实现了语义知识网络的构建,并通过可视化查询发现核心实体的潜在关联特征和一些重要的思想学说、观点论述等客观知识。基于上述3种关联模式,研究将特征融合构建了能够反映老子“道”学研究知识体系的知识图谱,并根据社区检测算法划分了四大研究流派,即思想创发派、文化守正派、古学今用派和学科交叉派。知识图谱作为一种有效组织大规模语义信息的形式,是文献知识组织、关联与体系可视化的重要工具,并能够利用相关图算法挖掘潜在的研究主题和研究热点,从而为引领新一轮研究热潮提供了数据层面的支持。研究构建的老子“道”学研究知识图谱为道学研究者提供知识查询服务与关联知识发现依据的同时,其实现方案也为数字人文领域学者提供了新的视角。

5.2不足与展望

本研究认为,一方面,老子“道”学作为我国优秀的传统文化历经几千年的发展,研究者对其核心思想内涵的阐释与文化精神的解读已较为全面和深刻,但“道”学研究领域主题和内涵非常丰富多元,涉及对生态学、医药学、伦理学、管理学等多个学科的延展。在新文科背景下,当前研究已有跨学科融合之势,但多数研究还不够聚焦和深入,未来可考虑从“相关性”的研究思维出发,探索与老子“道”学相关联的学科领域、主题事件和思想文化,并加强对内在关联逻辑的探讨;另一方面,随着大数据、人工智能等新技术的兴起,更多的数字技术可以被应用于老子“道”学及其相关传统文化的研究,如利用虚拟现实、增强现实等技术完成对老子相关文化遗产的“数字记忆”;利用深度学习、云计算等手段完成相关古籍的翻译、自动识别与可视化等。

本文的工作也存在一些不足。如对于学术互动关联特征的分析中仅考虑了作者之间的合作关系,由于机构数据大量缺失,对于该领域研究的重要机构合作情况暂时未能予以考虑。对于语义知识关联特征的分析,由于开放域知识抽取生成了大量冗余的数据,导致召回率过低,图谱中有实际价值的语义知识显得过于稀疏。未来的研究中,一方面可考虑标注更良构的数据并改变标注策略,以进一步提升三元组识别的准召率;另一方面,可在开放域抽取的基础上选取频次较高且有实际语义的关系作为预定义Schema,将其转换为限定域的知识抽取任务,以进一步提升抽取效果。此外,由于学术文献多是研究者思想的凝练而非客观知识的描述,从这类深度加工的信息载体中提取结构化知识仍然是一个挑战。如何对老子“道”学研究文献本身的核心观点或思想进行有效的结构化表示,从而更加全面、深入地构建起老子“道”学研究知识体系,将是今后研究的主要目标与核心。

參考文献

[1]习近平.决胜全面建成小康社会夺取新时代中国特色社会主义伟大胜利——在中国共产党第十九次全国代表大会上的报告[J].理论学习,2017,(12):4-25.

[2]习近平.坚定文化自信,推动社会主义文化繁荣兴盛[J].中华诗词,2017,(12):1-2.

[3]习近平.坚定文化自信,建设社会主义文化强国[J].实践:思想理论版,2019,(7):5-8.

[4]习近平谈治国理政(第二卷)[M].北京:外文出版社,2017:349.

[5]“庄子文化”课群教学的实践研究[J].教育科学论坛,2021,(7):39.

[6]董京泉.老子的和谐与自然无为思想[N].光明日报,2011-12-26.

[7]李黎鹤,李远国.原始道教论:对新石器晚期文化遗址的分析与认知[J].中国本土宗教研究,2019:163-202.

[8]詹石窗,张雷.重新认识道教与民间信仰在当代社会中的作用[J].中国本土宗教研究,2020:3-9.

[9]詹石窗,褚国锋.改革开放四十年来的道学研究[J].中国宗教,2018,(10):12-15.

[10]王文东.新时代德性伦理“一体五位”论——统合哲学诠释学和经学解释学视域建构德性伦理的一种可能思路[J].西北师大学报:社会科学版,2020,57(5):97-110.

[11]汪桂平.新中国成立70年来的道教研究(一)[J].中国宗教,2019,(10):24-27.

[12]汪桂平.新中国成立70年来的道教研究(二)[J].中国宗教,2019,(11):34-37.

[13]李丰楙.马来西亚华人社会中节俗信仰的“教、节一体化”刍议[J].道教学刊,2020,(1):31-52.

[14]冯友兰.略论道学的特点、名称和性质[J].社会科学战线,1982,(3):35-45.

[15]王晓光.“数字人文”的产生、发展与前沿[G]//全国高校社会科学科研管理研究会组.方法创新与哲学社会科学发展.武汉:武汉大学出版社,2010:207-221.

[16]查清华.以数字人文、人工智能推进新文科建设[N].中国社会科学报,2020-12-21,(6).

[17]马费成,李志元.新文科背景下我国图书情报学科的发展前景[J].中国图书馆学报,2020,46(6):4-15.

[18]朱晓峰,蒋旭牧,张卫.领域知识组织研究的历史演化与未来展望[J].情报资料工作,2021,42(5):23-31.

[19]夏亚平.王船山“道”学体系研究[D].长沙:湖南大学,2017.

[20]胡孚琛.道学及其八大支柱[J].世界宗教研究,1999,(3):25-33,150.

[21]吴成国.老子道学智慧及其现代价值[J].文化发展论丛,2014,(1):92-109.

[22]佘振苏.复杂系统学新框架:融合量子与道的知识体系[M].北京:科学出版社,2012.

[23]翟宏堃,李强,魏晓薇.2009—2018年国际心理健康素养领域研究主题及其演化路径[J].西南民族大学学报:人文社会科学版,2021,42(3):217-223.

[24]王金丽,樊勇,张辉.区块链文献主题发现及演化研究[J].计算机工程与应用,2020,56(20):1-8.

[25]黄龙.基于深度学习和神经网络的共享经济领域本体自动化构建[D].呼和浩特:内蒙古大学,2020.

[26]林鑫,李晓瑛,郭进京,等.喹诺酮类药品不良反应领域本体构建探讨[J].数字图书馆论坛,2020,(4):39-46.

[27]刘丰军,林晓峰,林正奎,等.互动视角下网络百科知识协同模型构建与实证研究[J].现代情报,2020,40(12):64-73.

[28]贾力维,吕晨,付纪松,等.互联网背景下网络教学中碎片化知识的整合与知识体系的构建[J].数码世界,2020,(12):186-187.

[29]Singhal A.Introducing the Knowledge Graph:Things,Not Strings[J].Official Google Blog,2012.

[30]吕华揆,洪亮,马费成.金融股权知识图谱构建与应用[J].数据分析与知识发现,2020,4(5):27-37.

[31]Zhao C,Jiang J,Guan Y,et al.EMR-based Medical Knowledge Representation and Inference Via Markov Random Fields and Distributed Representation Learning[J].Artificial Intelligence in Medicine,2018,87:49-59.

[32]欧阳剑,梁珠芳,任树怀.大规模中国历代存世典籍知识图谱构建研究[J].图书情报工作,2021,65(5):126-135.

[33]周莉娜,洪亮,高子阳.唐诗知识图谱的构建及其智能知识服务设计[J].图书情报工作,2019,63(2):24-33.

[34]Pan J Z,Vetere G,Gomez-Perez J M,et al.Exploiting Linked Data and Knowledge Graphs in Large Organisations[M].Springer International Publishing,2017.

[35]Mihalcea R,Tarau P.Textrank:Bringing Order Into Texts[C]//Proceedings of the 2004 Conference on Empirical Methods in Natural Language Processing.Association for Computational Linguistics,2004:404-411.

[36]白静.老庄的“虚静”思想管窥[J].牡丹江大学学报,2017,26(5):103-105.

[37]陈丽丽.“自然”观念的繁衍与深化——论老庄思想对中华美学精神的影响[J].中国文学批评,2018,(4):53-62,156.

[38]张林祥.作为一种理想治理之道的无为而治——基于儒道法比较的视角[J].甘肃理论学刊,2020,(6):63-69.

[39]冯文全,陈一帆.《道德经》德育思想的当代价值[J].中学政治教学参考,2019,(12):66-68.

[40]梁巧霞.在“不言之教”中彰显教师人格魅力[J].智库时代,2019,(49):247-248.

[41]李素军.老庄天道观下的全主体性生存构建[J].社科纵横,2019,34(8):77-80.

[42]郑毅.论牟宗三对张载天道观的诠释[J].唐都学刊,2019,35(3):60-64.

[43]白宗让.从“五位一体”论《黄帝内经》养生之道[J].中医药文化,2020,15(6):83-94.

[44]张少巍,吕玉娥.从《黄帝内经》再论“治节”之“节”[J].山西中医药大学学报,2020,21(6):393-396.

[45]丁虎.从荀子与道家自然观之同异看现代人的生态文明[J].贵阳市委党校学报,2017,(2):58-62.

[46]赵博,白倩.先秦道家和谐思想对公众参与生态文明建设的启示[J].安徽文学:下半月,2017,(6):101-103.

[47]李锋,刘睿.论老子比喻方法及其哲学意义[J].中国道教,2004,(1):33-36.

[48]李生龙.《老子》的修辞特点[J].湖南师范大学社会科学学报,1986,(1):113-115.

[49]冯卓琼.试论译者主体性[D].杭州:浙江大學,2006.

[50]苗玲玲.译可译,无常译——谈《道德经》翻译中的译者主体性[J]学术研究.2002,(8):134-137.

[51]Lan Z Z,Chen M D,Goodman S,et al.ALBERT:A Lite BERT for Self-supervised Learning of Language Representations[J].arXiv Preprint arXiv:1909.11942v3.

[52]Niklaus C,Cetto M,Freitas A,et al.A Survey on Open Information Extraction[C]//27th International Conference on Computational Linguistics(COLING 2018),2018.

[53]Good B H,Montjoye Y D,Clauset A.Performance of Modularity Maximization in Practical Contexts[J].Phys Rev E Stat Nonlin Soft Matter Phys,2009,81(2):046-106.

[54]胡孚琛.21世纪科学革命的思考——再论道学文化的新科学观[J].社会科学战线,2010,(7):210-217.

(责任编辑:郭沫含)

猜你喜欢

数字人文知识体系知识图谱
CS2013指导下的程序设计课程实践教学实施方案设计与翻转实验教学实践
构建知识体系的专题课程教学改革实践和探索
智能信息处理实验课程建设
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
数学支架式教学模式的探索