APP下载

基于文本挖掘的《论语》和《道德经》对比

2023-08-22严冰悦任浩栋

文学教育·中旬版 2023年8期
关键词:文本挖掘道德经论语

严冰悦 任浩栋

内容摘要:为解决数字人文视域下不同典籍思想分析与对比问题,本文基于字频分析模型对儒家典籍《论语》和道家典籍《道德经》进行文本挖掘,以可视化图形方式呈现其结果。结果显示:《论语》思想体系中最核心的概念为“道”“仁”“礼”“学”,《道德经》思想体系中最核心的概念为“道”“德”“仁”,其中“道”“仁”是两部典籍共有的核心概念。最后,基于文本挖掘结果对两部典籍的思想进行了分析与对比。

关键词:文本挖掘 《论语》 《道德经》

我国国学典籍浩如烟海,千百年来不绝如缕、薪火相传,蕴藏着无穷的宝贵财富。然而,其文本是今人极少使用的文言文,故其内容对绝大多数人来说晦涩难懂,须深耕于此的专业人员方能正确解读。这种方式虽然可靠性高,但效率较为低下,亟需相关计算机技术的引入以助力解读效率的提高。由此,将国学典籍数字化,利用文本挖掘等技术自动提取出有价值的信息,可为人工分析国学典籍的内容与思想提供极大的帮助。

目前针对文本挖掘等计算机技术在国学典籍解读方面的应用研究有不少,例如钮亮通过结构主义和关键词方法,简化分析《论语》中的核心观念结构[1];李斌、王璐、陈小荷等利用自动分析技术,辅以人工标注和校对,对《左传》中的人物和地点进行定量分析[2]。但尚缺乏数字人文视域下不同典籍内容与思想的对比分析。本文利用Python语言,基于字频分析模型对儒家典籍《论语》和道家典籍《道德经》进行文本挖掘,以可视化图形方式呈现其结果,为后期人工精读提供重要信息。一方面能够直观了解这两部典籍的核心思想元素,从而提高典籍解读的效率;另一方面可以非常便捷地对比两部典籍思想的异同,以深入探究儒、道两家思想蕴含的内在联系。

一.文本挖掘方法

本文采用的文本挖掘方法基于字频分析模型,具体流程如下:

(1)对原始文本进行预处理,删除标点、文言文中常见虚词以及无实际意义的高频词;

(2)从头至尾遍历预处理后的文本,统计每个字出现的频次,选取频次最高的10个字用于之后的可视化呈现;

(3)再次遍历文本,依次以每个字为中心,其前、后各10个字为半径作一邻域,将邻域内其它字与中心字的关联度加一;

(4)将上述频次最高的10个字及其关联情况以可视化图形方式呈现。

上述过程均通过Python语言编程自动实现。

下面在《论语》中选取两章为例加以说明,原文如下:

子曰:“学而不思则罔,思而不学则殆。”子曰:“知之者不如好之者,好之者不如乐之者。”

预处理(删除标点、虚词及无意义高频词)后为:

学不思罔思不学殆知不如好好不如乐

先统计各字出现的频次,分别如下:学:2次;不:4次;思:2次;罔:1次;殆:1次;知:1次;如:2次;好:2次;乐:1次。“不”字出现频次最高,说明这两章频繁使用否定句式来强调作者想表达的意思,这是先秦典籍中很重要的一种表现形式,值得今人关注和重视。

再统计各字的关联情况(因字数较少,半径取2),其中较高的有“学—思”2次,说明“学”和“思”是一组重要的概念,作者在寥寥数语里反复提及它们。

将上述方法应用于《论语》和《道德经》这两部典籍,对其全文进行文本挖掘,结果显示:《论语》思想体系中最核心的概念(关键字)为“道”“仁”“礼”“学”,道—仁、道—礼、仁—礼、道—学的关联度较高;《道德經》思想体系中最核心的概念(关键字)为“道”“德”“仁”,道—德、道—仁的关联度较高。其中“道”“仁”两字是《论语》和《道德经》共有的关键字。

二.《论语》核心概念(关键字)分析

“道”:通过文本挖掘,发现“道”字在《论语》中出现了100余次,足见其重要性。“道”在《论语》中作为名词时内涵颇丰,有着多种不同的含义,主要有:(1)规矩、处事的原则,如“三年无改于父之道,可谓孝矣。”(《论语·学而》),“射不主皮,为力不同科,古之道也。”(《论语·八佾》)等;(2)公正、合理,《论语》里经常出现的“邦有道”“邦无道”“天下有道”“天下无道”等;(3)目标、理想,“隐居以达其志,行义以达其道。”(《论语·季氏》);(4)思想、学说、主张,如“道不同,不相为谋。”(《论语·卫灵公》),“参乎!我道一以贯之”。(《论语·里仁》),“非不说子之道,力不足也。”(《论语·雍也》)等[3]。其中最重要的,出现在“志于道,据于德,依于仁,游于艺。”(《论语·述而》)孔子视“道”为人生的最高追求、一种终极信仰,在《论语》中的其它许多篇章也能看到这一点。例如“朝闻道,夕死可矣!”(《论语·里仁》),“君子谋道不谋食……君子忧道不忧贫”(《论语·卫灵公》)等[3]。《易经·系辞》上说:“形而上者谓之道,形而下者谓之器。”作为最高追求的“道”是抽象无形、形而上的,必须通过相应具体可见、形而下的事物来体现,后者就是本文通过文本挖掘发现的与“道”关联度最高的“仁”和“礼”。

“仁”:文本挖掘的结果显示,“仁”字在《论语》中也出现了100余次,说明“仁”是孔子思想的核心概念之一。如前所述,“志于道,据于德,依于仁,游于艺。”想要接近最高目标“道”,就要依据“仁”来进行。在孔子看来,“仁”是最高道德范畴,“道”是最高政治理想。先成君子之仁,而后方可行“大道”于天下。“仁”的认知与实践是为“道”的理想服务的。那“仁”具体是什么呢?“樊迟问仁。子曰:‘爱人。”(《论语·颜渊》)“仁者爱人”或者说“仁爱”是孔子儒家思想中最重要的特征之一。“子曰:‘弟子入则孝,出则弟,谨而信,泛爱众,而亲仁。”(《论语·学而》)把对父母的爱(孝)扩大到对兄弟姊妹的爱(悌),进而扩展到爱众(所有人)。这是一种由近及远、推己及人的差等之爱,不同于墨家的“兼爱”,更符合人们真诚的感情需要。

“礼”:“礼”字作为《论语》中的高频字,足以体现出孔子对于“礼”的推崇。春秋末期,人心不古,礼坏乐崩。“不知礼,无以立也。”(《论语·尧曰》)孔子推崇礼,希望每个人都能按照礼的规范言谈举止、立身处世,从而实现国家层面的“以礼治国”。

文本挖掘的结果显示,“仁”和“礼”有着较高的关联度。在孔子对“仁”的论述中,最具代表性的是“克己复礼为仁。一日克己复礼,天下归仁焉。”(《论语·颜渊》)他认为能约束自己来践行礼,那就是仁了。只要一天能这样,天下尽归入我心之仁了[4]。由此可见,“仁”是对君子的内在要求,而“礼”则是“仁”的外在表现。只有实实在在地践行“礼”,才能在内心境界上达到“仁”。在孔子的思想中,“礼”是国家维护统治与个人实现价值的重要工具,具有极大的实际意义。《礼记·大学》上说:“物格而后知至,知至而后意诚,意诚而后心正,心正而后身修,身修而后家齐,家齐而后国治,国治而后天下平。”前面的格物、致知、诚意、正心、修身是“克己”,由“克己”而“复礼”,进而逐步实现后面的齐家、治国、平天下,将儒家的“仁爱”由近及远、由己及人推广开来。

“学”:“学”字作为《论语》中的又一高频字,且《论语》中将《学而》作为首篇,足以说明“学”在《论语》中的重要意义。通观《论语》不难发现,孔子的儒家思想十分重视学习,“学”的内涵亦极为深广。从学习的内容上来说,“子以四教:文、行、忠、信。”(《论语·述而》)即文献、德行、忠诚、守信;孔门四科为德行、言语、政事、文学;“志于道,据于德,依于仁,游于艺。”(《论语·述而》)艺即六艺,中国古代儒家要求学生掌握的六种基本才能——礼、乐、射、御、书、数。从学习的方法上来说,“学而时习之”(《论语·学而》),学习须时时温习、练习;“敏而好学,不耻下问,是以谓之文也。”(《论语·公冶长》),学习要有求学好问的态度;“学而不思则罔,思而不学则殆。”(《论语·为政》),学习须深入思考,这样才是真正意义上的“学”。“古之学者为己,今之学者为人。”(《论语·宪问》)“为己”是自己体认,提升内在境界;而“为人”是使他人知,追慕外在名利。孔子推崇的自然是前者,学习的最终目的是行道。“学”和“道”也有着较高的关联度。“君子学以致其道。”(《论语·子张》)只有通过学习,才能成就君子之道。“学”是依次达到“礼”“仁”“道”的关键途径。

三.《道德经》核心概念(关键字)分析

“道”:文本挖掘的结果显示,“道”字在《道德经》中出现了约80次,可见其重要性。“道生一,一生二,二生三,三生万物。”(《道德经·第四十二章》)老子认为,世间的最高法则就是“道”,它是世间万物的根本来源。

“德”:“德”字在《道德经》中出现的频次也很高,并和“道”字有着较高的关联度。“道生之,德畜之,物形之,器成之。是以万物莫不尊道而贵德。”(《道德经·第五十一章》)“道”生成万物,是万物生化的根源。但“道”是抽象无形的,必须通过作用于万物来显現,这就是“德”。“德”养育万物,是万物发展的源泉,万物由此发展出各自独特的存在。

“仁”:“仁”字在《道德经》中出现的频次少于“道”“德”两字,但其与后者的关联度较高。“故失道而后德,失德而后仁。”(《道德经·第三十八章》)老子认为,“仁”是从“德”中生的,而“德”又是从“道”中生的,“仁”是位于“道”“德”之后、排名第三位的伦理规范范畴,三者之间有着紧密的关系。“天地不仁,以万物为刍狗,圣人不仁,以百姓为刍狗。”(《道德经·第五章》)天地无所偏爱,任凭万物自然生长;圣人效法天地亦无所偏爱,任凭百姓自己发展[5]。天地只是个自然的、物理的存在,没有人类那样的感情,所以对待万物也就没有如前所述儒家那样的“仁爱”(差等之爱),而是一种平等无私、一视同仁、超越世俗的态度。老子追求的是比“仁”更高的“大仁”,而“大仁”恰恰就要“不仁”。对任何现象不作任何干涉,让万物自然生长、自由发展,这样才符合毫无私意、任运自在的自然之“道”。与之相反的,是“大道废,有仁义;智慧出,有大伪;六亲不和,有孝慈;国家昏乱,有忠臣。”(《道德经·第十八章》)尽管意愿上希望遵循“道”,但在行为过程中加入了“仁爱”、“公平”等主观刻意的价值概念,对于整体而言未必是合理的。不从“道”的角度出发的“仁义”,违背了自然之“道”,往往会招致社会的更加无序化。

四.《论语》《道德经》思想对比

综合上述分析,将《论语》和《道德经》的思想对比如下:

(1)“道”字在两部典籍中出现的频次都很高,两者都将其视为最核心的概念之一。不同的是:儒家的孔子视“道”为人生的最高追求、一种终极信仰;而道家的老子将其视为世间最高法则与万物根本来源。尽管对“道”的理解有所不同:儒、道两家都将“道”置于无上的地位,一种超越世俗、形而上的存在。孔子和老子对于“道”的共识,反映出两位伟人的内心中都存在着一种坚定的信念——“致道”。在他们面对春秋乱世的现实而无奈时,这种信念仍能源源不断地为他们提供强大的精神力量。

(2)“道”是抽象无形、形而上的,必须通过相应具体可见、形而下的事物来体现,这是儒、道两家的共识。不同的是:儒家的孔子找到的是“仁”和“礼”,前者是对君子的内在要求,后者则是前者的外在表现。只有实实在在地践行“礼”,才能在内心境界上达到“仁”;道家的老子找到的是“德”,它是万物发展出各自独特存在的源泉。

(3)除了“道”字,“仁”字也是两部典籍共有的关键字。但儒、道两家对“仁”的理解与追求不尽相同:儒家基于人们真诚感情的需要,崇尚由近及远、推己及人的“仁爱”(差等之爱);道家追求的是比“仁”更高的“大仁”,而“大仁”恰恰就要“不仁”(不干涉、任自由)。

本文利用Python语言,基于字频分析模型对儒家典籍《论语》和道家典籍《道德经》进行文本挖掘,以可视化图形方式呈现其结果,进而对两部典籍的思想进行了分析与对比。今后可将字频分析模型及相关方法应用于墨家、法家、兵家等其它思想流派的代表性典籍,横向对比各家思想的异同,纵向分析各家发展不同阶段的思想演变。

参考文献

[1]钮亮.《论语》的观念结构:一个数字人文的视角[J].图书馆论坛,2021,41(02):67-76.

[2]李斌,王璐,陈小荷,等.数字人文视域下的古文献文本标注与可视化研究——以《左传》知识库为例[J].大学图书馆学报,2020,38(05):72-80+90.

[3]杨伯峻.论语译注(典藏版)[M].北京:中华书局,2015.

[4]钱穆.论语新解[M].北京:生活·读书·新知三联书店,2018:275.

[5]陈鼓应.老子今注今译[M].北京:商务印书馆,2016:96.

注:宁波工程学院理学院的蔡文舟、汤子怡也参与了本文的撰写。

基金项目:国家级大学生创新创业训练计划项目(202211058013)

猜你喜欢

文本挖掘道德经论语
What Does ChatGPT Say:The DAO from Algorithmic Intelligence to Linguistic Intelligence
天天背《论语》,你知道它是怎么来的吗?
如何读懂《论语》?
《道德经》的“中和”思想探究
慧眼识璞玉,妙手炼浑金
《道德经》“鸡犬之声相闻”与《桃花源记》“鸡犬相闻”
半部《论语》治天下
《易说道德经》