APP下载

作为“计算批评”的“远读”※
——以网络小说“升级文”中的节奏与情绪为例

2020-10-10

中国现代文学研究丛刊 2020年8期
关键词:莱蒂研究者节奏

内容提要:依靠当代技术的强大能力,文学研究者在内的人文学者已经可以使用数字技术完成对超大规模文本的解读。作为“数字人文起始点”的“远读”,是以牺牲细节为代价,实现对宏观体系和长期结构的把握。不过在文学领域,“远读”仍不是一个成熟的理论,少有具体而微的运用,且从诞生之初就不断遭受背离“人文之道”的质疑。本文将以类型化、模式化的男频“升级文”为对象,在“远读”概念的基础上提出并实践一种具有操作性的文本远读方法,同时探讨这一定量与计算方法的适合对象、使用难点及其可能与限度。

一 “远读”:从“人文计算”到“计算批评”

“远读”(distant reading)的概念由斯坦福大学英语和比较文学讲席教授弗朗哥·莫莱蒂(Franco Moretti)在2000年首次提出。后来被视为“数字人文起始点”的“远读”并非诞生在一个定量与计算的语境中,出发点是比较文学研究者建构世界文学的焦虑,背后的问题意识是内在于文学研究之中的。在《对世界文学的猜想》①一文中,莫莱蒂坦陈自己讨论世界文学时所面临的困境:“除了英、法文学,其他全然是外行”——对别国文学中什么是经典,全凭各民族的文学专家说了算;就算在专业领域,“我实际上只是研究其中的部分经典作品”,无可奈何地忽略了那些“伟大的未读作品”(Great Unread)——他指的是被文学史遗忘的绝大多数作品。

世界文学的宏大体系加上有待重新发现的未读作品,这看起来是永远无法解决的难题,甚至于尝试的努力都显得过于野心勃勃了——人肯定是读不完这么多作品的。莫莱蒂为此设想的一种方法就是“远读”。虽然目标是明确的,他要克服文本细读范围过于狭窄的弊病以及其中根深蒂固的经典崇拜,过程中要付出的代价也很清楚,他戏称为与魔鬼的契约:不直接阅读文本,以牺牲细节的丰富性为代价,获取一种对系统的整体理解。但他此时并没有找到具体的路径,“远读”还只是一次大胆的猜想。直到2009年发表《风格公司:对7000个标题的反思(英国小说,1740—1850)》,莫莱蒂才第一次使用定量和计算的方法初步实践了他关于“远读”的设想。在2010年,莫莱蒂更进一步与马修·乔克思(Matthew Jockers)共同创建了文学实验室,以科学实验的方式来开展文学研究。②

莫莱蒂被欧美学界视为“数字人文”的代表人物,“远读”被认为是“数字人文”最重要的“原初场景”(primal scene)③,就在于其中被解读出了一种根本性的范式改变——尽管莫莱蒂本人从未承认。“数字人文”领域的研究者普遍将“人文计算”(humanities computing)作为“数字人文”的前身,在这一“人文计算”时期,学者借助计算机超强的计算能力来解决人文领域的固有问题。“数字人文”最热切的拥护者也会承认,此时,“计算方法……是作为人文研究的辅助工具而存在的”④。莫莱蒂激进的“远读”概念与颇具传奇性的文学实验室,因潜藏着一种对文学研究中文本细读的经典方法的颠覆性挑战,而被急切开拓新天地的后来者赋予了超出其本身承载能力的方法论革命的意义,在缺乏对“远读”概念充分讨论的情况下,便匆忙宣布以此作为基石的“数字人文”的新时代到来了。

莫莱蒂对此异常清醒,在2016年的访谈中他提道:“数字人文研究的成果要低于预期……数字人文研究自称是一大新的研究领域,而且我觉得到目前为止,我还没有拿出什么证据来证明这一点。我不想说得太过,不想说就完全没有证据,因为这很复杂。证据可以是各种形式的,可以是对概念的完善,也可以是确证的事实。”⑤莫莱蒂所忧虑的,不只是概念和方法未能完善,更是在十年左右的研究之后,实际成果的缺失——“为什么这么多人才投入了大量精力、借助了各种工具还难以取得重大成果。”⑥在向来紧跟国际学术潮流的中国学界,如果没有建立在对“数字人文”方法论反思基础上的本土化实践,刚刚兴起的“数字人文”研究恐怕也不会有更好的结果。

反思不妨从命名开始。莫莱蒂如今认为“‘数字人文’这一术语没有‘意义’,‘计算批评’更准确些”⑦。这背后是对“数字人文”这一命名中暗示(或者说几乎是明示)的用数字技术改造人文研究领域的雄心的压抑,而把计算方法的位置放回到了一个必要的但仍是辅助的位置。作为他投身这一领域多年之后的定论,也是他对自身研究充分反思后的结果,这一结论尤其值得还沉浸在发现新方法的热情中的中国学界注意。由向帆教授首先提醒我们的一个事实也可以作为例证⑧。被不少研究者奉为社会网络分析和可视化方法在文学领域运用代表作的《网络理论,情节分析》,莫莱蒂出乎意料地先后提供了两个版本。一个版本是在2013年出版的《远读》(Distant Reading)⑨一书中,但在文学实验室网站上公布的是多了《后记:理论、可视化的概念》这一章节的另一版本。在多出的后记中,莫莱蒂直言自己走进了死胡同,他通过计算机技术生成的《哈姆雷特》人物关系图虽然呈现了更多的信息纬度,却让人看不懂,也观察不到什么新的现象。

尽管,我们可以像有些研究者那样期待,懂得编程的青年学者会比缺乏算法支持的莫莱蒂更有“数字智慧”,会走向“数字人文”的通途。但问题的关键还是在于,“数字人文”的方法论真的不仅仅是一种实证主义的方法而有范式革命的意义吗?在西方,方法论问题的提出是近现代思想学术转型的一个重要标志。正如张沛教授指出的,人文科学自身方法论的建立,已经是经过了从1620年代培根的《新工具》到1720年代维柯的《新科学》的认识论转型。“17世纪20年代,培根在《新工具》中提出:经院哲学的演绎法不足以发现真知,发现真知只能通过新的方法,这就是建立在实验基础上的归纳法。”⑩培根之后的人文研究,从笛卡尔到斯宾诺莎再到康德,都不同程度地使用了数学方法。牛顿的《自然哲学的数学原理》的成功进一步加强了人文学者对数学方法的信心,此后数学—物理学方法充当了包括人文学科在内的一切科学的方法论模型。然而,随着研究不断深入,人们发现人文科学需要有自己的方法。“意大利学者维柯在《新科学》一书中提出:人类社会文化是人类自身的创造物,认识人类自身必须通过语言回顾考察理念的历史。”[11]维柯的“新科学”为19世纪的历史主义方法的到来做好了准备,在一定程度上甚至预示了20世纪以语言学和解释学为主轴的方法论转向。现今人文研究的“人文之道”正是建立在对把数学—物理学方法作为“探求真理的指导原则”的反思之上的。

年轻的“数字人文”研究领域现在还没有能力和实绩去与这一人文传统对话,更谈不上在与历史主义乃至海德格尔的阐释学的竞争中论证自身足够作为一种具有方法论革命的“新科学”。但不强调范式革命的意义,并不代表“数字人文”就失去价值,更不代表人文科学就要全然排斥实证主义的方法。莫莱蒂的文学实验室之后,斯坦福大学人文领域的十余位学者共同组建了一个名为Humanities + Design的研究实验室,在立足人文科学自身方法的同时,保持人文领域对数字时代的开放性,尝试一种数据驱动和算法支持的人文研究。而具体到文学研究领域,莫莱蒂提倡的“计算批评”仍是对这一倾向更准确的命名。

“计算批评”或“计算研究”首先是始终在“历史末端”保持着开放性的文学批评和研究传统,面对数字时代的一次自我调适和进化。文学研究者在对人文研究的主体性有清醒认识的基础上,运用数字环境中前所未有的文学大数据和超级计算能力,进行数据和计算支持的文学批评和研究。这一“新工具”仍将在理论的前提下工作,并为理论之中可以量化的部分在超大规模的文本里(如果不是穷尽全部文本的话)寻求“证据”,然后回过来进一步完善既有的理论。

人文学者为何要拥有“计算批评”的思维并掌握“计算批评”的能力,就在于这一验证过程中,现有理论特别是其中依靠归纳方法而得以成立的部分的假设本质会充分暴露出来。“计算批评”的核心就在于对“证据”的强调。在印刷时代之前,博学之士可以追求“一事不知,儒者之耻”,学者也是有可能穷尽历代典籍(困难主要在于收集而非阅读)来做研究、下论断。现代印刷文明到来后,研究者已经不可能穷尽自己的研究对象了,只能选取有代表性(即使代表性常常存疑)的标本或把目光完全集中在少量经典上,甚至逐渐发展到了连经典也读不完的地步。在数字时代来临后,这一研究者有限的精力与几乎无穷的文本之间的矛盾更加突出。虽然缺乏全局的视野,但研究者又不得不对总体做判断,因为对局部的理解总是离不开对整体的理解。同时,在个人目力所及和专业范围越来越狭窄的现实中,学者要么放弃对大问题和大结构发言,要么被迫在证据不足的情况下说话。作为“计算批评”的“远读”,正是当下缓解这一矛盾最有效的方法。

二 一次文学实验:基于网络文学的文本远读方法

既有的基于“远读”概念的文学研究很少,且普遍都遭遇过两个陷阱。其一是用“远读”之法行“细读”之事,对已往研究路径的依赖一时难以摆脱。这一问题的核心就在于仍然把研究的对象限定在单一的经典文本之中。如莫莱蒂本人在《网络理论,情节分析》一文中对《哈姆雷特》的建立在社会网络分析上的情节研究最终无功而返,就因为对于少量的经典文本,从各方面来说,机器仍远没有人特别是顶尖的研究者读得好,尤其缺少一种好的文学研究应当有的灵动。其二是用大量关联度极低乃至没有明确相关性的文本作为研究对象。这一模式虽然在文本规模和信息维度上大大超过了过去比较文学的研究,但若缺乏历史演变及系统模式上的关联,仍不过是陈寅恪所批评的“古今中外,人龙天鬼,无一不可取以相与比较。荷马可比屈原,孔子可比歌德,穿凿附会,怪诞百出,莫可追诎,更无所谓研究之可言矣”。[12]在新领域刚开辟出来时,这类研究有试错的意义,也是一种新技术与新方法的操练。但研究的深入需要大量实质性成果的出现,然而整个数字人文领域现在都面对着成果缺失的尴尬,这里面最现实的困难是材料的缺乏。

就文学领域而言,远读所需的文本,一是规模要大到超出研究者个体的阅读能力,否则文本细读的方法就完全足够了;二是文本之间仍然要有明确的相关性,这是生发问题意识的内在要求。满足这两个条件之后,还有一个特别现实的困难:这样大规模的文本数字化的成本太高——除非它们本身就是诞生在数字环境之中的。因此,海外的研究者虽然普遍认可“远读”概念与大众文化有与生俱来的亲缘关系,但基本没有条件开展与此相关的研究。面对一开始就是以数字化形式存在的网络文学,中国的网络文学研究者有了得天独厚的机会。作为一种激进设想的“远读”概念,也真正有了落实为具有实践性的文本远读的方法的可能。在网络文学领域,文学研究者可以通过穷尽某一类型或某一主题之下的所有文本,来为自己的判断和理论寻求最有力的证据支持。

在文本远读的视野中,经典是不存在的,取而代之的概念是档案/数据。一个文本并不会比另一个文本更重要,机器将对所有文本一视同仁——尽管研究者可以为不同等级的文本赋予不同的比重,并在分析中重新发现经典的价值乃至重新定义经典的概念。但在机器阅读的过程之中,鲁迅的杂文也不会比任何一位不知名的杂文作者得到多一点的关注。文本远读能为文学研究带来的新东西,正是以此为代价获得的一种从各个角度观照整体、结构、系统的能力,这也是细读的方法所缺乏的能力。在过去,这类问题只能依靠最具天才和毅力的研究者经年分析之后的一朝综合。如今,这种综合的价值并没有被削弱,但有了进一步提升的可能,它的权威也需要得到数据的全方位支持。

文本远读是由理论驱动、数据支持的。文本远读在过程之中是排斥细读的,但文本细读是它得以运作的前提。没有对研究对象的充分细读,就不能提出好的理论假设。没有一个好的理论假设,文本远读绝不可能得出一个有用的结论。在这里,可以说,问题比答案更重要。从一个好的理论假设中引出的真问题,无论最终数据是否支持,它一旦经由验证的过程,就已经得到了解答。数据支持固然好,倘若不支持,其实更好,新的发现和突破就潜藏在对细读结论的否定中。因此,文本远读是困难的,门槛不仅在于技术,更在于研究者要有提出好的理论假设和研究框架的能力。

一个适合驱动文本远读的理论假设,还应当是可以被量化的。计算机的能力是强大的,但同样也是愚蠢的。如果理论不能被量化,就无法被转换成机器可以理解的机器语言,文本远读自然也就无法开始。文学研究和批评中哪些部分的理论或判断是可以被量化的?甚至说一直是内在要求着在量化中得到检验的?这或许会成为文学研究者在使用文本远读方法时首先要思考的问题。就网络文学而言,可以也应当被量化的仍是关于整体和结构的部分,比如网络文学类型学、网络文学的叙事模式研究。在可以被量化的领域中,今后,研究者必须要在数据的支持下才有下论断的权力——当研究者断言一种普遍性存在的时候,众所周知和基本如此已经完全不够用了,普遍性需要在每一个特殊中验证它的普遍存在。

量化后的理论假设被放到选定的数据材料中去验证的过程,就本质和原理而言,与工科和社会科学的实验过程没有两样。在一场文学的实验中,实验目的、实验原理、实验工具、实验过程和实验结论,都需要和化学、生物的实验一样严谨,唯有如此,文学研究者才可以期待它的效用。接下来,我就将以网络文学中的男频“升级文”为对象设计一次文学实验。实验目的是研究最流行的男频“升级文”从2005—2019年的升级节奏的变化,并探究节奏变化背后的“情绪结构”及其变动,由此一窥“升级文”让亿万当代读者如痴如醉的奥秘所在。

本次实验所选取的文本量不大,只以15年间起点中文网每年的年度月票榜第一名为对象。自2005年起点中文网建立月票榜至今的15年中,只有2007年的年度月票总冠军为历史官场小说(月关,《回到明朝当王爷》)而被排除在外,其余年份的头名均为典型的玄幻或修仙类型的“升级文”,这一现象正是本次实验问题意识的起点。特别是,作者在多年的阅读经验中也明确体会到,这些小说的升级节奏中充满了理性化的定量与计算的痕迹。14部小说的总字数已超过5000万,但仍不到这些年出现的“升级文”的万分之一。虽然它们已经是读者千挑万选出的代表作品,然而就实验的代表性而言,每年应该至少要选取一百部流行的“升级文”才是一个比较让人满意的数量。可惜,限于作者实验条件的不足,特别是文本和实验助手的缺乏,本次实验注定仍只是一次操练,或者说是研究计划和系列实验的第一步。

实验所采取的方法为关键词分布与关系。首先通过计算机搜索和标记出同时出现在同一段文字中的关联关键词——小说主角姓名和升级体系中的每一等级,再辅之以人工的核对,最终定位出小说主角每一次升级时所处的文本位置和每一次升级所间隔的文本空间,并以可视化的方式呈现主角的升级节奏。因为实验的方法并不困难且文本量相对传统的数字人文研究仍是较大,所以实验使用的工具是专为网络小说数据分析而开发的“一叶故事荟”[13]平台,而非学界更为熟悉的斯坦福大学或台湾大学开发的数字人文研究工具和平台。

三 “升级文”的修辞术:小说节奏与读者情绪

从2005年到2019年,每一年最受欢迎的男频小说类型都是“升级文”。“升级文”在最深处打动了绝大多数的男频网文读者,这是一个清晰的事实。但这一类小说何以使大众读者如此沉迷,则是一个有待回答的问题。要回答“何以”的问题,不妨先考察“升级文”的本质属性是什么。“升级文”的本质是一种“爽文”,准确地说,是一类追求让读者的阅读快感最强的小说。从精英的立场来看,这里面毫无疑问有一种对大众读者的讨好乃至谄媚。但更准确地说,这是媒介变革之后,大众自己获得了书写权力后的自娱自乐。

对当代的大众而言,快乐主义是最普遍也是最深固的人生哲学。在快乐主义的人生观中,人的一生的最高利益是得到最大的快乐,而最大的快乐通常并不来自最强烈和最丰富的快乐体验——大众无法得到也很难承受这样的快乐,因为与之相伴的必然是同等程度的痛苦和挫折。最大的快乐只能被等同于最多的快乐,即那种大众承受和理解能力之内的快乐的无限叠加。对当代读者特别是男性读者而言,升级,即获得更大的力量/权力并得到随之而来的种种享乐(即使暂时克制,也是可以预期的),是他们最能接受的快感模式。“升级文”就是让读者代入主角在不断的升级过程中得到此种“人生的最大快乐”。在阅读“升级文”时,读者会有一种稳固的安全感,因为作者预先就承诺过挫折必定被克服且上升的快乐一定会实现,而在这一安全感的基础上,读者就可以安心代入主角,让自己的情绪随小说的节奏起伏了。

虽然成功的“升级文”必定都有一套同样的程式,但仍有微妙又重大的不同,其中最关键处便是升级节奏的快与慢,叙事的其他部分也几乎都由这一节奏主导。最慢的节奏可以慢到并不被视为“爽文”,也没有明确的升级体系,比如《平凡的世界》,孙少平的生活虽然不断在上升,但到全书的结局也不过是个矿工。然而这部被著名网文作家猫腻称为“最伟大的YY小说”[14]的慢节奏,其频率是与时代共振的,正因其上升得慢而显得扎实、丰富,也使那一代自我期望并不高的读者有足够的安全感和代入感。对于当代读者,矿工作为终点无论如何是不够的了,他们有了更大的想象空间,升级的节奏自然也要大大加快。虽然网络小说的总体节奏伴随当代生活的节奏一同加快了,但快节奏总是会以牺牲小说的细节和饱满(也是生活的丰富与充实)为代价,其实特别需要时代氛围的加持。这15年间最流行的“升级文”的升级节奏基本是与时代的情绪同步的,总体而言,有一个慢—快—慢的变化——这是作者细读的模糊感受,最终也得到了数据的支持。在14部小说中,就总体趋势而言,2005—2008年的节奏较慢,2009年之后,节奏大大加快,到2018—2019年,升级节奏再度慢了下来。这背后有技术与受众变化的缘故,但最根本的应当还是社会氛围和大众心理的变动。

不过,真正的意外之喜是,数据揭示出一个笔者从未意识到的事实:最流行的“升级文”根本上只有两种节奏。先谈第一种慢节奏的“升级文”。具体到文本,《亵渎》(烟雨江南,2005)、《兽血沸腾》(静官,2006)、《恶魔法则》(跳舞,2008)和《将夜》(猫腻,2012)以及《大王饶命》(会说话的肘子,2018)、《诡秘之主》(爱潜水的乌贼,2019)六部小说属于此类,升级的阶梯至多不超过二十个,少则只有几个。在这些篇幅普遍在300万字到500万字的小说中,“升级”虽是主线,但没有成为小说的主要内容。在这个意义上,这些小说是“传统”的,可以被归为“史诗”一类,因为它们仍有通过事件和人物去描摹整个世界的野心。“升级”不只是为读者带来爽感,同时成为改换叙事视角和推动叙事发展的动力,也变成了使超长篇小说仍是一个有机体的关键结构。通过“升级”,主角的位置实现了从底层向高层/边缘向中心的移动,环境、人物与事件也随之移步换形,最终完成对世界的全景展现。要尽可能地展现一个时代乃至一个文明的全貌,这的确是需要300万字至500万字才能完成的文学事业。

在这六部小说中,《诡秘之主》的升级节奏是最有代表性的。近450万字的规模容纳了主角的十次“升级”,每次“升级”要间隔大概40万字——几乎就是一部纸质的大长篇小说的篇幅了。且不论小说的完成度是否足够,就结构而言,这类“升级文”就是多部纸质长篇小说的连缀。《诡秘之主》也的确是一路从底层平民写到帝王将相再到宇宙神灵。在“升级”以外,作者同样显示出了遍采百家资源来把每个阶段的人物、生活和事件都描摹好的野心。

《诡秘之主》的升级节奏图

其余八部快节奏的“升级文”则大多有近百个升级的阶梯。尽管作者风格各异:唐家三少(《斗罗大陆》,2009)感情细腻,天蚕土豆(《斗破苍穹》,2010)勇猛精进,辰东(《完美世界》,2014;《圣墟》,2017)大气磅礴,我吃西红柿(《吞噬星空》,2011;《莽荒纪》,2013)节奏精当,忘语(《玄界之门》,2016)擅长写底层奋斗,耳根(《我欲封天》,2015)爽快又不失欢快;但总体而言,这些小说的全部内容都是围绕着主角的“打怪”与“升级”,主菜是同一个,只是各有调味。其中,《斗破苍穹》的升级节奏是最有代表性的,小说在500余万字总计1624章中,“升级”了超过一百次,平均十几章就有一次“升级”。这样不顾一切代价只管勇猛精进的节奏,在中国经济狂飙突进的高速增长期中,于青少年男性读者群体中得到了巨大的共鸣,读者的情绪跟随着主角的“升级”以及“升级”前的小小挫折而起落。由于《斗破苍穹》的升级节奏极其陡峭,为了保证可视化的效果,作者甚至只能截取出升级节奏图的前五分之一来展示。

《斗破苍穹》的升级节奏图

在本次实验的所有“升级文”里,《将夜》在数据和节奏上的表现都是最特别的。首先,2009年到2017年的近十年中,只有《将夜》一部慢节奏的“升级文”获得了年度月票第一名,可谓逆势而上。同时,《将夜》的“升级”节奏也是最“奇葩”的,对想要学写“大红文”的作者而言,可以说是绝对的“反面教材”。在370万字中,主角宁缺总共只有五次明确的“升级”,不但没有升到最高层次且在小说的后半段一次也没有“升级”过。在《将夜》中,调动读者情绪与感情的不是“升级”,而是人类更根本更深沉的悲欢被连通了起来。这样一部可以说是在挑战玄幻小说读者的阅读习惯和期待心理的作品,在快节奏的“升级文”最为流行之时于读者的评选中夺冠,不但是在数据层面确证了这位“中国网络文学大师级作家”[15]的独特性,也侧证了中国网络文学生态的丰富性。

《将夜》的升级节奏图

结 语

就像终结中世纪骑士文学的并非《堂吉诃德》,而是资产阶级的新生活。只要当代生活主要还是“打怪”与“升级”,最流行的当代小说就只能是“升级文”。当然,我们应该追问,最快乐的生活就是不断“升级”抵达“巅峰”吗?孟子的回答是:“君子有三乐,而王天下不与存焉。”[16]也可以进一步追索,人生的最高利益就是拥有最大的快乐吗?不过,这都不是本文能完成的任务了。但我想《将夜》曾经并且以后也会让它的读者产生这样的疑惑,其中的一部分人一定会去追问,什么才是最好的生活。

注释:

猜你喜欢

莱蒂研究者节奏
夜行车
高等教育中的学生成为研究者及其启示
吃饭有个最佳节奏
节奏学习也可以变得很有趣
100件东西
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
《风》:从破碎到绽放的西部之花
研究者调查数据统计
YOUNG·节奏
医生注定是研究者