APP下载

数字人文视域下中国文论核心范畴研究

2022-11-20邓心强

关键词:文论范畴人文

邓心强

(中国矿业大学 人文学院,江苏 徐州 221116)

大数据时代利用互联网、信息技术、数据库获取信息、挖掘分析信息这一套思维和方法将成为人文学科研究的一种新范式。国内已经出现了一些数字人文教学的早期尝试,如汕头大学文学院开设了“数字人文”方向,武汉大学王涛教授开设了“数字工具与世界史研究”课程,台湾清华大学中国文学系祝平次开展了“数字工具与文史研究”“本体结构与文史研究”课程及35场工作坊[1]。这些都走在国内前沿,极大地带动了数字人文的人才培养和学术研究。

何谓“数字”?它“从工具层面讲是软件和算法、技术和工具,从数字层面讲是基础设施和研究范式”[2]1-2。数字已无孔不入地进入到当代社会生活中。数字人文主要依赖数据库、图像识别、数据挖掘、神经网络与机器学习等技术手段。这些手段与传统文学研究相结合,呈现出文献数据(语料)库、版本校勘与文字识别、计算语言(风格)学、叙事程式分析、社会关系网络、地理信息系统以及人工智能创作、分析系统等不同形态的辅助手段或研究成果[3]75。当前,数字人文的引入“可将文学研究纳人一个更宏观的视野,提高研究结论的精准性、稳定性及可验证性,促生新的研究理念、方法与范式”[4]26。和传统研究相比,数字人文的优势很明显,它“超越检索利用大数据和专门的技术、工具,无论是文本编码、语义分析、空间分析、地图制作,还是时间表、网络分析、可视化,皆有相应的软件、工具、平台,展开专门的量化研究”[5]35。对于持续了数十年的文论范畴研究而言,数字人文无异于是一剂新的催生剂。

一、数字人文的视角及其与范畴研究的关联

人文计算在国外发展有数十年的历史。随着互联网的崛起和新兴技术的更新换代,基于人文计算而形成的数字人文研究,近五年来在国内迅速兴起,并波及到图书情报、文史哲、艺术学等诸多领域,俨然成为当前一大学术热点。多名学者对其发展史、阶段特征、教育现状等有深入的总结[6][7]托马斯·库恩认为,新的范式会带来革命性影响,极大地推动科技和学术创新。数字人文便是当前广泛应用于人文科学的一种全新研究范式,从解决学术问题看,又是一种新的研究方法。当前众多学人将其引入到古典文学、现当代文学乃至文学评论中来,取得了显赫的成就,带给我们很多新的思路和启迪。

(一)数字人文的“文学”观照

国内此前已有多位学者引入数字人文从事文学研究,别开生面。北京大学李铎教授完成了《全唐诗分析系统》和《全宋诗分析系统》,为约31万首唐宋诗歌创立数据模型,对诗歌的平仄、用韵自动标注,再对文本展开分析。杜晓勤教授研发了《中国古典诗文声律分析系统》,通过系统自动标注古典诗歌及其韵文。王丽丽就数字人文方法研究的挑战与机遇对堪萨斯大学格雷厄姆教授展开访谈,介绍了美国数字人文切入文学研究的路径与成就,指出数字人文开辟了研读经典作品的崭新方法[8]。董洪川深入探讨了数字人文视域下外国文学研究范式的巨大转换及给该学科带来了三大启迪,并系统分析了超文本远读、定量辅助定性研究等新的研究方法[9]。王兆鹏与郑永晓等学者在《借器之势,出道之新》一文中,重点就古典文学应用于数字人文的前景进行了深入讨论,尤其结合安史之乱分析了系列数据库、平台建设及其功能,以及如何运用数据挖掘技术分析和阐释古代文学[10],均给人耳目一新之感。邱伟云借助数字人文技术分析了131位中唐诗人共一万四千多份唐诗中的空间方位词[11]。这是数字人文研究唐诗的典范,带来迥异的思路和结论。刘京臣发表《大数据时代的古典文学研究》[12]认为古典文学信息化的重点应当由数据检索向数据分析、数据挖掘转型,指出针对疑难文字的OCR技术、利于版本校勘的图像检索,将是今后数字人文研究文学值得期待的方向。刘石全面分析了数字人文视野下古代文学文本分析的六大主要问题[4]26,充分展现了数据平台、技术平台、研究平台“三位一体”模式之优长。

《现代中文学刊》2019年推出《“数字人文”与中国现代文学研究三人谈》,深入探讨了以数字人文方法介入现代文学研究的种种思路与方法。赵薇谈到了数字人文在现代文学研究中的计量方法[3]。严程分析了大数据在当前人文学科研究的多种路径,高度肯定了数字技术手段对信息处理的成效,指出文学研究也能为新技术的应用拓展新的空间[13]。王贺提出了“超越检索”而以多元的数字方法切入现代文学研究的七个方面,皆详细而有启发性。此外,王贺还就数字人文切入现代文学研究如何实际操作,结合众多案例分析了“可视化”研究,探索视觉形式作为知识生产和建构的可能性[5]36。

此外,但汉松指出“让机器阅读成为对传统阅读的一种激发和挑战,以建构具有独特的数字化思维但又植根于传统文学批评观念和认知模式的新型文学批评”[14]。郭金龙就数字人文研究中文本挖掘技术的运用,如何用来研究文学分析作者的归属、作品的人物关系、情感以及风格等[15]。郑永晓使用GIS(地理信息系统)同时对文学史上朝代或流派之个案进行精确、缜密的分析,定制时空资料后生成分析结果,推动了古典文学研究的跨越式发展[16]。李泉剖析数字人文与比较文学在学科生成、学科构架、学科理念和学科前景四个方面的相似性,结合比较文学学科发展问题比照、反思数字人文学科理论建构中存在的问题及解决对策[17]。李泉还对“数字文学”的理论框架进展了整体构想,从创作、传播、教授和总体研究四个维度论及“数字”与“文学”的联姻与结合[18]。2021年以来,关于数字人文切入文学各方向的研究成果还在不断涌现,具有很强的新颖度和原创性,为学者打开了崭新的窗户,开启了很多思路。

(二)国内范畴研究之范式与成就

学界引入数字人文从事“文学”研究已非个别案例,在文学多个分支展开,并取得了一定学术成就,积累了不少宝贵的经验。笔者长期从事古代文论核心元范畴研究[19],一直在思考如何引入数字人文到文论范畴研究中,从而突破现有的研究格局,以促进学术创新。范畴研究归属于古代文学理论与批评,是文学的重要分支,引入数字人文对它展开研究,学理上是可行的。研究领域的不同,所采用的方法会有所不同。据当前科技发展趋势来看,今后更多的学科、领域均离不开数字化、数据库,不同程度地借助于数字相关的软件或工具,否则研究出新实属不易。这体现了人工智能时代各学科与新兴技术的血缘关联。

自20世纪90年代开始,核心范畴研究长期受到学界的关注和青睐。学者们多角度多侧面地展开研究,取得了一定的学术成就。先是蔡忠翔、邓光东等前辈联合众多学者在百花洲文艺出版社出版了兴、和、情、志、理、意境、雄浑等系列范畴,一个范畴一本专著,已陆续推出数十辑,在国内产生了较大反响,其中意境、和等多种专著日后再版。其后,成复旺主编了《中国美学范畴辞典》(1995)、王振复主编了《中国美学范畴史》(2006)、杨星映等著《中国古代文论元范畴论析》(2015)、汪涌豪著《中国文学批评范畴十五讲》(2010),从理论高度上剖析范畴的流变与交织,研究文论体系的建构与特征,得到学界的好评[20]。进入21世纪,陈玉强、郭守运、程晶晶、邓心强等大批中青年学者在范畴领地上继续耕耘,先后有《中国审美心境范畴论》《中国美学“狂怪”范畴研究》《“远”范畴的审美空间》等范畴研究新成果问世。21世纪以来,系列成果或聚焦阶段或从美学角度切入,学术局面被打开,极大地推进了范畴研究的进程。但范畴研究一直在传统范式内进行,主要运用史料就范畴单词释义,从哲学渊源、文论转化、内涵演变、外延拓展、弥漫交织、创作关联、审美蕴含等维度展开,形成了其相对固化的研究模式,至今未见有新的学术突破。

(三)方法、工具的变革与学术创新的契机

而数字人文作为一种新型研究范式,将为当前文论范畴研究带来新的生机。“数字人文会给人文学科研究带来新的学术思维、学术理念、学术方法、学术视野及学术形态。数据的海量聚合影响了人文学者观察、思考问题的思路,催生了人文学科研究的新方法,更新了人文学科研究的研究范式。”[21]而这是传统依靠史料、学者靠研读文论来研究范畴所无法达到的。五十多年前,德国理论家韩秉珠(Byung-Chul Han)在新著《在蜂群中:数字前景》(2017)首页中写道:“这个新的媒体正在重新编程(re-programming)我们,而我们却不能理解正在发生的范式大转变。正是这个媒体在我们意识还朦胧的时候,改变我们的行为、感知、感觉、思考以及群体生活的方式。”[22]足见数字媒体及相关技术的威力与魅力。数字人文以新的技术带来研究路径与手段的变革,在人文学科研究中具有广阔的发展前景,就文论核心范畴研究而言,它促使国内学者转换思路,拥抱技术,通过数字与平台将使核心范畴研究获得新的突破。

二、数字人文切入核心范畴研究的范式转变

数字人文是以计算机运算所提供的工具如超文本、超媒体、图像、文献检索、数据挖掘、统计等,使用数字化的资料或数字原生资料,结合传统文史哲等学科开展的综合性研究[10]79。它依托新兴技术对既有人文学科进行研究,是新文科建设过程中文、理相结合的典范,具有鲜明的跨界性与交叉性。“当前,有5种数字技术常被数字人文引入,一是量化分析,二是文本分析,三是(GIS)空间分析,四是社会网络分析,五是知识组织技术。这些技术可灵活组配,支持丰富的数字人文研究。”[23]10这些方法均基于互联网和数据库而来,不需贪多求全,应据研究对象灵活而选择性地采用。

(一)从定性研究到定量辅助定性研究

古代美学和文论中,很多核心元范畴最初萌芽于先秦两汉时期,主要存在于先秦典籍中,在政治和哲学层面上使用。汉魏时期伴随着人的觉醒和文艺的全面发展,才逐渐过渡到文论领域中来,其内涵与外延发生了多元变化。在历代文论家的理论总结下,不断地被赋予新的内涵。传统搜集和检索古籍获得范畴的早期使用情况,比较零碎且工作量浩大,所收集的样本也很难齐整和全面。主要建构在定性分析基础上,对早期范畴的使用情况及具体内涵予以阐释。由于研究者资料掌握、学术背景、思维方式的不同,在定性分析中概括、归纳、提炼方面有所差别。

二十多年来,已有资源库中先秦典籍也较丰富、完备,在大数据时代可被充分利用起来建立结构化数据库,以量化方式辅助定性分析,则可以考察任何一个古典文论元范畴——如气、象、味、韵、势、和、志等——均能通过数据库将典籍中出现此范畴相关语句(使用情况)分类提取,能迅速通过聚合、比照到其早期含义。而采用“定量辅助定性研究,将社会科学的定量研究方法与人文科学的定性研究方法结合起来,对文学文本的既有信息进行检索、提炼和呈现,并从多层面、多维度生成二次信息,提出新的问题,得出新的结论”[9]176。与定性研究先有理论假设再寻找证据进行推理论证不同,定量分析是对大量基础数据进行统计分析基础上进行的,得出的认识较为客观,避免了定性分析过多地主观色彩,它更具科学精神,在当前社会科学领域广泛使用,并被广大人文科学学者所借鉴、移用。“定量化和计算化是大数据环境下人文学科数字人文研究的主要实现的思路与特征。”[21]66在输入相关词汇或要求后,数字工具和平台据建模要素迅速提取该范畴的词频、特征,并制成量表,通过数字、图表来全网络地呈现该关键词在先秦典籍中的使用,从中管窥元范畴如何从本义走向引申义,并逐渐泛化及向文论渗透和过渡的过程。相比带有理论假设的定性分析,辅以定量分析的数字人文研究介入“象”范畴研究,将有助于深入挖掘历代“象”的隐性模式,发现定性方法根本无法发现的问题或得出具有创新性的研究结论[7]195。

(二)从线性“细读”到超文本“远读”

数字人文作为一种全新的研究范式,几乎成为人文社科研究史上的分水岭。它以数字构成、数字传播的方式迥异于畅行了数千年之久的传统纸媒阅读和研究。此前研究文论的核心范畴,主要靠对文本线性的“细读”来进行,认真研读某一种典籍或某些史料(限于人力),对范畴进行理论总结、探究范畴的内涵演进与外延拓展、范畴集群的形成及交织弥漫等,均靠研究者的文本分析和逻辑推导,从中提炼和归纳问题,并依据独立思考来撰写和研究。“研究者往往关注单一文学文本中少见而非泛在的写作模式,深蕴而非浅显的信息,更多地聚焦文学文本的差异性而非普遍性。”[9]177即线性细读模式下,独特的发现、文本的差异、范畴蕴含的不同往往更容易被关注,而大数据时代的超文本有着独特的信息生产和组合方式,“远读”跨越一般到普遍,从诸多古代典籍和文论著作中将该范畴的使用聚类成为数据,关注的是海量文献基础上的“共性”,大规模文学样本数据之上的“规律”,它能克服研究者的个体认知和阅读局限,而这恰恰是人工智能时代平台信息计算的优势所在。“远读模式所关注的文学文本的数据是散点的,而不是聚焦的,它的视觉效果是马赛克式的,非远观而不能窥其全景。”[9]177-178显然,针对大规模超文本的“远读”将极大地改变核心范畴的现有研究范式。

(三)从“文本阐释”走向“文本挖掘”

此前研究文论核心范畴是研究者基于文献研读和理解并结合大量语境进行的理论诠释,从而使范畴发展过程中丰富、多元而变动的内涵呈现出来。总体上,是受现代西方学科话语体系和实证方法的影响,通过历史还原、文献考释、文本释义使原本在古代文论著作中模糊使用的范畴变得清晰和具体起来。在古典文论和美学中,任何一个核心范畴都经历了上千年的发展演进历程,在文学、艺术乃至文化的长河中浸染过,采用文本阐释都能将之化为一部概念史的大书,至今出版的《归趣难求——中国古代文论“趣”范畴研究》《中国美学“狂怪”范畴研究》等,每本上百页、一词数十万字,均是史料基础上文本阐释的结晶。

而基于现代数字传播和大数据技术形成的文本挖掘,相比研究者的文本阐释具有无比强大的功能。在建立了不同文本的语料库后,以统计分析的方式就典籍中某个词汇、意象的使用与特质,就某个朝代或阶段文学创作体现该范畴的创作实践等,以数据聚类或打包的方式清晰地展现出来。文本挖掘(Text mining)不仅是数字人文的核心概念,也是一种主要的操作方法。它“是指为了发现知识,从文本数据中抽取隐含的、以前未知的、潜在有用的模式的过程。它是一个分析文本数据,抽取文本信息,进而发现文本知识的过程。这里的知识包括各种模式、模型、规则或趋势等”[24]。“文本挖掘最常用的技术,包括词频统计、特征提取、结构分析、文本摘要、文本分类、主题模型、关联分析等。”[2]6这里所谓词频统计、结构分析,实则与量化分析相关联。所谓模型、趋势,是在海量数据基础上共建起来的。传统研究文论范畴的模式,是较微观和动态地考察其内涵变迁、如何衍生子范畴并形成范畴群落,而文本挖掘则在提取大量数据后分析范畴发展与创作实践之间的常见模型,及核心范畴与其他范畴交叉、渗透的几种主要趋势,乃至范畴被文论家理论归纳和总结的类型,都可通过文本挖掘来获得。

三、数字人文切入核心范畴研究的展望和反思

日新月异的技术正改变着人们的生活方式,也注定会影响学术研究的思路与格局。将数字人文引入文学研究,才是近年来的事情,在一批敏锐学者的尝试下,炙手可热,遂逐渐成为学术前沿。而将之切入文论核心范畴之研究,则更属新鲜了。作为一项“前无古人”的探索,我们并未有多少经验可借鉴,但作为一种主流趋势,我们对数字人文深入文学学科展开各领域、各方向、各话题的研究前景,是一致看好的。尽管数字人文自产生以来,一致面对着不同的声音和争鸣,但它的实践领域正在逐步扩大,生命势头强劲,以之切入文论核心范畴研究,有众多层面值得我们审视和反思。

(一)多种数据库的输入、数据平台的建设与推广

大量专题数据库的建设,是从事数字人文研究的前提。数据库越丰富、越全面、越准确,将极大地提高研究的成效。古代文学理论与批评学科,像古代文学一样也是一个老学科,二者在传统社会并辔齐行,然而文论领域学者对技术的敏锐度不及古代文学界,对数字人文的使用也迟缓很多,所建资源科相比古代文学史,也要逊色很多。古代文论作为有百余年历史的老学科,在郭绍虞、朱东润、罗根泽、王运熙等诸多前辈的努力下,编选的各类资料异常丰富,无论是历代主要文史典籍还是古代文论论著原文,很多已经以电子形式存在并被读者在研究中不断检索和利用,如《中国历代文论选》(四卷本)、《中国古典文学理论批评专著选辑》(数十种)、《中国古典戏曲论著集成》[25]、《中国古代文艺理论专题资料丛刊》(全四册)等,但这些都需要有意识地整合成结构化的专题数据库,才能真正走上“数字人文”研究的康庄大道,让文论插上“数字”的翅膀。

我们认为,鉴于古代文学和文论在学术上有血缘关联,当前古代文学方面的数据有些可充分利用,如北京大学《全唐诗分析系统》《全宋诗分析系统》、中南民族大学《唐宋文学编年地图平台》等,这可有效避免古文论研究人手不够、团队力量不强、条件不具备等种种弊病,实现文论数据库与文学数据库的共享及汇通。况且以大数据方式研究文论核心范畴,离不开对文学创作的积累和观照,很多范畴的产生与创作实践有着密切的关联[26][27]。此外,在文论界已深入研究范畴四十余年的今天,还有两类数据有待建设:一是四十年各类范畴、关键词研究的论文和著作目录集成;二是四十年与文论范畴有关的重要立项成果。这将便于今人做范畴研究有新颖度,以及文献综述时通过数据提取和分类来研究范畴的成就与趋势。再者,对各类数据库和平台,学术界要加大宣传与推广,在高校办数字人文专业和设置相关课程时,多进行宣传,在不断实践中调整数据模型的建构。刘芮在分析欧美数字人文教育后,指出当前我国人文科学缺乏数字技术等课程设置。在优化课程过程中,要将数据与技术思维融入教学中去[28]。徐孝娟等人也梳理、比照了国外数字人文专业课程开设后,对我国数字人文课程设置和人才培养提出了诸多建设性意见,认为数字方法、技术的教学是重点[29]。这都是引入数字人文到核心范畴研究中急需补课的地方。

(二)提升技术素养,跨越数字人文研究之困境

2018年刘炜、叶鹰认为数字人文的本质是方法与工具的变革,是一个“方法论的共同体”,研究人员既要熟知人文科学及其各分支学科的研究方法和一般规律,又要具备数据科学的应用能力[30]。固然数字的技术、工具和媒介为人文学科的研究带来新鲜血液,将极大地推动不同领域的学术创新,然而围绕数字展开的技术、平台,需要专门从事计算机技能的研究人员研发,“我国数字人文研究因文本与语言的特殊性,要求基础技术、数据库和专业软件的研发必须匹配中文语境,由此便构成了汉字的多义性与机器分析的单一化、已知与未知、已行与未行之间错综交织的技术开发困境”[31]。而解决此种问题尚需要多学科人员联合攻关。学者指出:“人文学科与信息科学的研究者之间最大的问题是‘互盲’。一方面,多数人文学者缺乏必要的数字技术基础,不可能参与到探索底层数据库、系统数据流、跨平台数据及其体系结构,还有应用编程接口(APD)、移动视觉搜索(MVS)等相关技术和问题。”[2]3在数据库建成后,从事核心范畴研究的学者对数字人文的操作技术要熟练,这需要学者参加相关培训或课程学习,增强数字意识,培养数字敏感,熟悉文本挖掘、可视化分析、地理网络信息系统的相关技术运用。在新文科建设时期,从事范畴研究的学者尤其需要有跨学科素养。

(三)“人文精神”之反思

数字人文研究并非新事物,但它的确是新范式、新方法,对人文学科研究有着巨大的魅力和冲击力。研究人员在提升技术素养的同时,也要寻求人文和数字的平衡。人文精神和工具理性的差异及其博弈,已为学界熟知。张耀铭指出过度依赖技术容易陷入伦理困境:“对数据的过度依赖,对算法的过度崇拜,造成数字人文研究人文属性被辗轧而变得异常平庸化。重图像、重制作、重编码、重量化,轻文字、轻阐释、轻洞察、轻思想,似乎已经成为数字人文研究的一股潮流。这需要高度警惕,也需要批判反思。数字人文不是在技术祭坛上牺牲人文,而是数字与人文的融合发展。在两者之间的融合发展中,技术只是工具和方法,人文才是灵魂和根本。”[2]3一针见血地指出了数字人文引入人文学科已经和可能存在的种种问题,当文论研究者倚重网络技术和新软件、平台,忽视了自身理论素养的提升,忽视了研究过程中人文精神的发扬,则极易踏入技术的陷阱、掉进数字的牢笼而“乐不思蜀”。众多学者都对数字技术化有可能侵蚀人文学科固有的人文精神表示担忧[6],尤其是数字人文介入文论范畴研究后,学者沉迷于数字分析,而搁置理性思辨和批评质疑能力之提升,使分析在冷冰冰的数字中进行而丧失了人文学科应有的温度,对人的关怀及价值的肯定。“人文学科本身的问题意识、思辨模式、人文关怀、价值体系等影响着数字人文研究中的资源选择、知识单元的标引、研究问题的提出、模型的构建,尤其影响数字人文计算结果的解释和新知识的发现,以及学术界对数字人文成果的最终评价。”[23]9由此看出,数字和技术固然重要,但操作它们的人更为重要。在数字人文切入文论范畴研究中,对古典范畴体现出的古人的审美趣味、价值观念、思维方式要有独特的体认和深刻的揭橥,忌讳沉湎于数字、填表中失去了人文关怀。

随着新兴技术的不断渗透与使用,以及数字人文向多领域的转移,研究经验不断积累,人们主动、自觉运用数字人文展开文学研究的意识将更加强烈。近年来学界对逸、神、象、远、真、含蓄、雄浑等文论核心范畴的研究在如火如荼地展开,但基本上在传统基于文献而阐释的老路子上行走。以数字人文研究文论核心范畴,无疑在当前古代文论研究中具有先锋性和前瞻性。由于经验的缺乏、思考不尽圆融,这种探究尚在路上,需要与其他学科进行交叉研究,要在提升研究人员技术素养、建立和使用多种结构化数据库、平衡数据和提升人文精神等方面多着力。

猜你喜欢

文论范畴人文
世纪情怀 历史叙事 学术温度——乔建中二胡文论述评
美在山水,魂在人文
最朴素的人文
中国美学“气韵”范畴之“韵”探颐
语文阅读教育中的三对重要范畴辨正
20世纪中国古代文论的地位、意义及创造性转化
20世纪中国古代文论的地位、意义及创造性转化
解构视野中的后现代文论——以哈琴的后现代主义诗学为例
Poet, Poems and the art of Poetry in Samuel Taylor Coleridge’s Biographia Literaria
人文社科