APP下载

基于词频计量统计的林黛玉性格分析

2019-04-23胡翠婷

现代语文 2019年2期
关键词:林黛玉红楼梦性格

胡翠婷

摘  要:本文从计量语言学的角度,通过对林黛玉诗词词频和动词词频的统计分析,来解读和阐释林黛玉的性格特征,力图呈现出一个立体化和多样化的黛玉形象。结果表明:林黛玉的诗词中与“花”相关的词很多,并且多使用情感消极的词汇,这也印证了林黛玉多愁善感、敏感自卑的性格。考察林黛玉动作动词时,发现在林黛玉的性格中还具有男子化的一面,这和普通的贵族少女迥然不同,也是以往研究所忽略之处。

关键词:《红楼梦》;计量语言学;林黛玉;性格

一、引言

1935年,美国语言学家G.K.Zipf关于语言统计的著作The Psycho-Biology of Language:An Introduction to Dynamic Philology出版[1],标志了一个新的语言学分支学科和一种新的语言研究方法的诞生。G.K.Zipf认为,利用统计方法可以定量研究语言中的各种现象,这样语言学便可以成为一门精确科学。此后计量语言学越来越多地被应用到文学作品的统计分析上。早在1976年和1987年,美国斯坦福大学教授Efron和她的学生就对莎士比亚的著作进行了统计分析的研究[2][3]。对《红楼梦》的计量研究始于瑞典汉学家高本汉(B.Karlgren),1952年,他用统计学方法分析了32个语法与口语词汇的用字习惯,认为全部120回均为曹雪芹所著[4]。1980年,华裔学者陈炳藻在美国威斯康星大学召开的“首届国际《红楼梦》研讨会”上,发表了《从词汇上的统计论〈红楼梦〉的作者的问题》一文,他通过统计学方法考察《红楼梦》前后用字(词)的相关程度,认为后40回也出自曹雪芹之手[5]。由此引发了使用计量统计分析方法来判定《紅楼梦》作者的热潮。目前学术界围绕《红楼梦》所做的计量研究主要集中在词汇特征上,基于词频统计和向量分析,考察《红楼梦》在用字用词方面的特点,而对人物性格的计量研究分析却十分少见。

就林黛玉这一人物形象而言,学术界的研究主要集中在以下方面:1.对人物形象性格特征的剖析。如:岑泽丽[6]和董亚萍[7]均从人物语言入手分析林黛玉的性格特点;张利玲则重新审视了林黛玉立体化的性格[8]。2.对人物形象文化价值的探讨。如:徐乐吟、陆德海针对林黛玉的《五美吟》,分析了林黛玉的内心世界和对生命与生存价值的思考[9];吕启祥深刻地展示了林黛玉这个形象所包含的文化底蕴和价值观念[10];李希凡认为林黛玉具有敏感的诗人气质和动人心魄的艺术力量[11];李云婷则从“伤春”入手,探析黛玉伤春情怀的表现和独特的文化内蕴[12]。3.对人物悲剧命运的解读。如:张新艳从人物诗词入手,认为林黛玉的诗词带有强烈的悲悯色彩[13];秦桂敏认为林黛玉是一个悲剧人物并对其悲剧命运进行探究[14];王琨指出林黛玉的悲剧命运与其个人性格是分不开的[15];周薇从美学的角度,论述了林黛玉身上的艺术魅力和时代赋予的悲剧性格[16]。4.对相关意象的深入阐释。如:吴林采取文本细读的方法,探讨林黛玉与绛珠草意象、竹意象、桃花意象等相关意象的关系[17];杨真真通过梳理桃花的文学意象及其对林黛玉形象的观照,论述了桃文化的渊源及其对中国古典文学的影响[18]。上述研究基本上都是在文本细读的基础上进行的理论阐释,不免带有作者的主观倾向。同时可以看出,从文本计量这一客观角度对人物性格进行解析的研究是相对匮乏的。有鉴于此,本文从计量语言学的角度出发,采用定量统计与定性分析相结合的方法,通过对林黛玉诗词词频和动词词频的统计分析,来解读和阐释林黛玉的性格特征。

二、诗词词频统计分析

古人云“情动于中而形于言”,以诗言志便是“情动于中”的表现。诗意叙事一直贯穿于《红楼梦》始终,同时也体现在对人物形象的塑造上。林黛玉是一个诗人,她的生命与诗词紧紧联系在一起,诗词也充分展现了她的性格和情感。

(一)诗词词频的统计分析

经统计,整部《红楼梦》中,林黛玉的完整诗词作品多达23首。我们采用哈尔滨工业大学社会计算与信息检索研究中心研发的语言技术平台(LTP)工具对其进行预处理,主要包括自动分词和词性标注,同时进行人工校正,得到黛玉诗词中的词频分布数据。利用NiucoData词云统计工具绘出词云图,如图1所示:

我们知道,词频统计技术默认出现频率越高的词权重越大。一般而言,词语出现的次数越多,被赋予的权值也越大,就会占据词云图的中心位置。从图1可以看出,出现次数最多的词是“桃花”,说明“桃花”在林黛玉的诗词中具有最重要的意义。如第23回中描写黛玉葬花,葬的便是桃花,她不忍心落花随水渠流到腌臜之所,遂以花冢葬之。此处的桃花意象,隐喻着黛玉一生中最美好的青春时光;但美丽的东西终究不能长久,桃花凋谢、随风逐走则暗示着她人生前景的黯淡苍凉,预示了其最终的悲惨结局。杨真真就认为桃花是林黛玉命运的象征,与黛玉的形象有很强的观照性[18]。最典型的便是《桃花行》,黛玉连用七个桃花,句句自怜,联联自谶,体现出对命途多舛的无奈、对人生悲凉的感伤。这也是林黛玉无法掌控自己命运的真实写照。值得注意的是,桃花意象不仅在林黛玉的诗词中频繁出现,在其他女子的诗作中也屡次提及。可以说,它也是大观园众女子命运的象征,与文本揭示青春的毁灭、美的毁灭的创作主旨十分契合。

同时可以看出,围绕“桃花”中心出现的词,有“葬花”“寂寞”“憔悴”“烦忧”等,再往外围扩展,有“泪眼”“萧条”“伤神”“悲歌”“沉吟”等。这些词语无不透露出悲怆凄楚之感,对体现人物性格、烘托人物情感起到了重要作用。

我们还注意到,林黛玉诗词词频中涉及到“花”的词语和搭配有很多,大致可归为以下三类:

一是花之种类,如“桃花”“稻花”“梅花”等,尤其是“桃花”,使用频次高达7次。在一定程度上说,文本将花的自然属性与社会属性融合无间,成为人格化的具象,寄托着诗人的理想、情趣和追求。梅花傲霜斗雪,是黛玉清高孤傲性格的象征;稻花清芬淡雅,是黛玉诗意人生的写照;桃花飘零沦落,是黛玉悲剧命运的预兆。

二是花之形态,这主要表现在黛玉诗词聚焦于“落花”和“秋花”的抒写。“秋花”即秋天之花,出现在第45回秋窗风雨夕,写林黛玉卧病潇湘馆,在秋夕之时,目睹秋花惨淡秋草枯黄,再加上秋风秋雨袭来,不禁联想到个人身世,悲凉之感油然而生。诗人用一系列萧瑟冷清的秋景,传达出一种对未来命运的隐约预感。“落花”意象主要出现在第27回《葬花词》中,如“花谢花飞花满天”“忍踏落花来复去”“试看春残花渐落”“花落人亡两不知”等。此处的“落花”描写,以花喻人,象征着“红消香断”、青春易老的人生况味,预示着“花落人亡”的悲剧结局。可以说,无论是落花还是秋花,都是将花的命运与人的命运扭结在一起来写,形象地传达出黛玉对生命的无限焦虑。

三是花之品性,这主要集中于“花魂”“花媚”两个词语。花媚体现了花之娇美和姿态,同时也象征着包括黛玉在内的大观园众女儿的青春之美、女性之美。花魂一词出自第76回黛玉和湘云的联诗,湘云出“寒塘渡鹤影”,黛玉对“冷月葬花魂”。花魂体现了花之气节和品性,象征着黛玉的品质高洁、孤高自许,即“质本洁来还洁去”,而“冷月葬花魂”则预示着黛玉这一花之精魂、诗之精魂的香消玉殒。

(二)诗词词性的统计分析

1.词性总体统计

词性标注是自然语言处理中的一个重要环节。我们知道,词性用来描述一个词在上下文中的作用,而词性标注就是识别这些词的词性,以确定其在上下文中的作用。我们对林黛玉诗词中用词的词性进行了统计,如图2所示。从中可以看出,名词(n)、动词(v)的数量最多,分别占了32%、31%;其次是形容词(a)、副词(d),分别占了8%、7%;再次是代词(r)、介词(p);拟声词(o)数量最少。这显然与古典诗词的文体规范与语体风格有关。众所周知,词性可以反映作者的写作习惯和语体风格,下面分别对黛玉诗词中的形容词、代词、副词、时间词进行具体考察和分析。

2.形容词的统计分析

我们使用Cytoscape软件对林黛玉诗词中的形容词进行了可视化处理,其分布如图3所示。同时,我们还参考了大连理工大学信息检索研究室整理标注的情感词汇本体,依据情感词汇本体对形容词情感极性的标注原则,对黛玉诗词中的形容词标注了情感极性,其中0代表中性,1代表正向,-1代表负向,如图4所示。

从图3可以看出,黛玉诗词中形容词的使用较为广泛、丰富。同时,从图4的统计可以发现,除少数颜色词外,形容词的情感极性为负向的占了56.5%,如“憔悴”“萧条”“寂寥”“凄凉”“渺茫”“冷”“残”“瘦”“老”等,均表现出悲观、消极的情感色彩,富于冷色调。可以说,这些词集中反映了黛玉诗词悲伤哀怨的主导风格,也在一定程度上体现出林黛玉多愁善感的性格。这种性格显然源于她对周围环境的恐惧与不安,所谓“诗以言志,歌以咏怀”,林黛玉的情感变化与心路历程在诗词中都得到了淋漓尽致地展现。

3.副词的统计分析

林黛玉诗词中的副词分布如图5所示:

从图5可以看出,黛玉诗词中的副词使用较多的是“不”“莫”“非”“却”“渐”“尽”“无端”“何须”“默默”等。其中“已”与“未”的使用频次很高,“已”表示已然状态,具有完成意味;“未”表示尚未发生,具有将来的意味。再结合二词所出现的语境来看,它们在一定程度上揭示出林黛玉对过去生活的怅惘以及对未来命运的担忧。黛玉诗词中副词出现频率最高的是“不”,用以表示否定,同样表示否定的副词“莫”“非”也频次较高。这说明黛玉对世界、对人生的看法偏向于否定的一面、忧郁的一面。出现频率较高的还有副词“却”,用以表示转折,也展现出黛玉对于前途未可知性、不确定性的迷茫与焦虑。这些高频率的副词和上文那些高频率的形容词一样,都偏向于消极、灰暗,均从不同角度、不同层面折射出黛玉的世界观、人生观,这既是导致她悲剧命运的重要原因,同时也奠定了人物悲剧的基调。

4.代词的统计分析

林黛玉诗词中的代词分布如图6所示:

在图6中,线条的交叉表示多次使用并且相互关联。从中可以看出,黛玉诗词中出现频率较高的代词有“谁”“何”“何处”“如何”等。其中,“谁”的出现频率最高,其次是“何”。如果再加上“何处”“何人”“何日”“如何”“何如”等,“何”的出现频率应和“谁(谁家)”不相上下。这些词语都是无明确所指的代词,却占据了绝对优势,这应该是作者有意选择的结果。林黛玉背井离乡来到贾府,过着寄人篱下的生活,尤其是父亲去世之后,更是身无所寄、心无所托,不知自己情归何处,更不知未来命运何去何从。这些无明确所指的代词非常准确地反映出黛玉对人生的无法把握、对未来的不可把控,充满了一种迷茫之感与无奈之情。

5.时间词的统计分析

林黛玉诗词中的时间词分布如图7所示:

从图7可以看出,在时间词中,黛玉偏爱使用“今”“今生”“明年”“几时”“一朝”等,其中有些时间词具有一定的预示性。结合与此搭配的上下语境来看,这些时间词既体现出渺茫的希望,更洋溢着无限的悲凉,透露出历尽沧桑的沉郁之气。黛玉年纪虽小,内心却有万般愁苦与千般哀怨,而又无处诉说、无人诉说,只能把这种感受倾泻在诗歌的字里行间。《葬花词》中“一年三百六十日,风刀霜剑严相逼”,形象地展现了黛玉的当下生活状态与生存困境,这样的痛苦煎熬“几时”结束,仍然充满未知数。“今生”已是如此,“明年”又能如何,一切皆在不言中。

根据以上统计和分析,可以看出林黛玉是一个敏感自卑、多愁善感的女子,她對人生极度缺乏安全感,对未来缺乏归属感。这些性格特质都跟黛玉独特的身世和成长的环境有关。黛玉从小就离开父母,在贾府长大成人,贾府的物质生活十分优渥,贾母对她也格外宠爱,宝玉和她更是情投意合,但这些却无法完全弥补她心灵世界的缺憾。可以说,这在那些高频率的形容词、副词、代词、时间词中都得到了不同程度的体现。

三、动词词频统计分析

我们知道,一个人的言行举止能够充分反映此人的品性和涵养。林黛玉作为书中的主要人物,她的形象是立体而饱满的。一般读者都认为林黛玉的性格是多愁善感、清高孤傲,这在上面的统计分析中也得到充分验证。实际上,黛玉的性格绝不止于此,否则,她就不是林黛玉了。下面我们就通过抽取与黛玉相关的动作动词,来挖掘黛玉性格中的另一面。

(一)动作动词的自动抽取算法

这里首先需要设计与林黛玉相关的动作动词的抽取算法。我们将“林黛玉”的同名等义词全部替换为“黛玉”,如“林黛玉”“潇湘妃子”“林潇湘”“林妹妹”“颦儿”“颦丫头”“林姑娘”等,然后采取开窗口的方式,使用Python代码进行自动抽取,具体的抽取算法过程如图8所示:

根据以上抽取算法,初步提取了文本中“黛玉”附近的动作动词,经过人工查验,提取出与林黛玉相关的614个动作动词。接着对这部分动词进行词频统计,如图9所示。其中横轴代表词,纵轴代表词频。可以看出,频次与频序大致是符合齐普夫定律的。图9中高频词较少,低频词较多,说明与林黛玉相关的动作有很多,这从一个侧面反映了她性格中活泼开朗的一面。

(二)数据与分析

根据上述动词,我们绘制了林黛玉动词词云图,如图10所示:

1.与“笑”相关动词的统计分析

经过进一步的提取和统计,我们挑选出一部分能展现黛玉性格的动词,如图11所示:

从图11可以看出,林黛玉爱“笑”,与“笑”有关的动作有“笑道”“含笑”“冷笑”“陪笑”“嗤笑”“微笑”等。其中“笑道”一词使用最多,“冷笑”次之,此外,还有“嗤笑”和“陪笑”。如第19回写宝玉闻到黛玉袖口有股冷香,认为这香的气味奇怪,不是寻常的香饼发出来,“黛玉冷笑道:‘难道我也有什么‘罗汉‘真人给我些香不成?便是得了奇香,也没有亲哥哥亲兄弟弄了花儿、朵儿、霜儿、雪儿替我炮制。我有的是那些俗香罢了。”“冷笑”一词,很能表现黛玉前期的典型性格:孤高自许、目无下尘,率真坦荡、胸无城府,对人对事有些尖利刻薄,不太考虑别人的感受。

“陪笑”一词也发生在林黛玉身上,这可能有点出乎意外。它出现次数不多,却极具代表性。第3回林黛玉进贾府,王夫人在介绍尚未出场的贾宝玉的时候,黛玉的表现是:“因陪笑道:‘舅母说的,可是衔玉所生的这位哥哥……”。黛玉初到贾府,“生怕出一步错,引人耻笑”,此处的“陪笑”一词,很能体现她谨小慎微的心理,同时也是出自客套、寒暄礼仪的需要。之后小说对林黛玉的描写,或正面塑形或侧面评价,展示的多是其清高孤傲的性格特征。不过,第52回写赵姨娘来探望林黛玉,黛玉“陪笑”让坐,“陪笑”一词再度出现。这一动作看似细微,实则体现出林黛玉在成长过程中逐渐世俗化的一面,这里的“世俗化”并非贬义,而是指人物自身不断变得成熟稳重的变化过程。从此处的“陪笑”一词可以看出,黛玉前期的孤高自许、目无下尘的性格发生了一定转变,她在待人接物时其实是懂得人情世故的,也有通情达理的一面。这就描绘出了黛玉性格的流动性、复杂性,为读者呈现出一个立体化和多样化的鲜活形象。

2.肢体动作的统计分析

与此同时,我们还从林黛玉动词的低频词中发现一些较为特殊的用词,如“摔”“甩”“蹬”“拦住”“丢开”“恼道”“啐道”“哭”“哭泣”“放声大哭”等。除此之外,在动词的低频词中还出现了林黛玉这样的肢体动作:“摔帘子”“勾脖子”“甩手帕”“蹬着门槛”,乃至“啐了一口”“撕”“夺”等。这些动作如果发生在泼辣的王熙凤身上,一点也不奇怪。她自幼假充男儿教养,又不曾识字读书,行为粗鲁实属情有可原。但黛玉与“凤辣子”不同,她是温文尔雅的千金小姐,是超尘脱俗的浪漫诗人,却也有如此“出格”的行为举止,似乎超出了读者的想象。其实,这可能是我们在阅读过程中形成了思维定式,一提起林黛玉,就和博学多才、飘逸洒脱联系在一起,却忽略了其性格行为豁达豪爽的另一面。可以说,这样的动作行为还透露出黛玉在体格纤弱、心灵脆弱的同时,也具有刚强和坚毅的一面。这就是曹雪芹塑造人物形象的高明之处、高超之处。

仔细分析,黛玉的这种行为举止也是事出有因。一是黛玉出生的家庭环境。黛玉的家庭环境较为特殊,她是官宦之家的独生女儿,第2回曾提到林如海、贾敏“夫妻无子,故爱如珍宝,且又见他聪明清秀,便也欲使他读书识得几个字,不过假充养子之意,聊解膝下荒凉之叹”。她从小是假充男儿教养,这一点与王熙凤完全一样。再加上她自幼丧母,体弱多病,父亲对她的教育相对宽容乃至纵容,对其行为举止的要求也没有那么严格,这在一定程度上养成了黛玉任性、豪爽的性格,与寻常女兒温柔和顺的品性大不相同。

二是黛玉成长的贾府环境。黛玉的成长的环境也较为特殊。她六岁进入贾府这一诗礼簪缨之族、钟鸣鼎食之家,物质条件的优越自不必提。在贾府中,黛玉倍受外祖母的宠爱乃至溺爱,犹如掌上明珠,和宝玉同是贾母的宝贝心肝儿,无论吃穿用度都是最好的,就算是贾府中的“三春”也不能和她相比。可以说,贾母对黛玉在生活上呵护有加,对其行为举止从不横加干涉,对其性格的培养也不过多干预。贾母的过于疼爱乃至放纵以及大观园较为宽松的成长环境,也在一定程度上养成了黛玉任性、豪爽的性格,从而具有了男儿的气质。

(三)研究对比

根据上文的统计分析,我们将初步的统计结果与其他学者的研究成果进行了简单对比,如表1所示:

表1中,李希凡和张锦池是《红楼梦》较为早期的研究者,王蒙和董晔是当下较新的研究者。对比发现,无论是早期的研究还是当下的研究,对林黛玉性格的认识有很多共同之处,比如叛逆、高傲和忧郁等,而相对忽略了黛玉性格中男儿气质的一面。这是以往研究所忽视之处,也是本文最重要的创新点。

四、结语

本文通过对林黛玉的诗词和动作动词两个方面进行计量语言学分析,力求从客观的角度分析这一人物形象。从诗词的词频统计分析和词性统计分析中,可以看到一个多愁善感、自卑敏感的林黛玉;而从与黛玉行为举止相关动词的统计分析中,又可看到林黛玉身上具有男儿气质,这跟她的家庭环境和深受贾母宠爱有关。把这两个形象叠加、整合在一起,才是全面的林黛玉、真实的林黛玉、鲜活的林黛玉。这也是林黛玉这一人物形象最具魅力、最能吸引读者之处,曹雪芹塑造人物的功力由此可见一斑。

本文也存在不足的地方:一是没有对人物进行对比实验分析。二是选择窗口的大小具有一定主观性,可能会遗漏掉其他与林黛玉相关的重要动作动词。因此,我们的实验统计和分析,仅在一定程度上说明了结论。今后我们会在算法上逐步完善,同时对人物进行对比分析,力求得到更为科学客观的结论。

参考文献:

[1]G.K.Zipf.The Psycho-Biology of Language:An Introduction to Dynamic Philology[M].London:George Routledge & Sons Ltd,1936.

[2]Efron,B. and Thisted,R.Estimating the number of unseen species:How many words did Shakespeare know?[J].Bionmetrika,1976,(3).

[3]Thisted,R.and Efron,B.Did Shakespeare write a newly-discovered poem?[J].Bionmetrika,1987,(3).

[4]Karlgren B.(高本汉).New excursions in Chinese grammar[J].Bulletin of the Museum of Far Eastern Antiquities.1952,(20).

[5]Bing.C.Chan(陳炳藻).The Authorship of the Dream of the Red Chamber:Based upon a Computerized Statistical Study of Its Vocabulary[M].Hong kong: Joint Publishing,1986.

[6]岑泽丽.《红楼梦》中林黛玉的个性化语言研究[J].湖北第二师范学院学报,2014,(9).

[7]董亚萍.浅析林黛玉的幽默[J].红楼梦学刊,2008,(3).

[8]张利玲.林黛玉形象补论[J].红楼梦学刊,2009,(1).

[9]徐乐吟,陆德海.《五美吟》与林黛玉的心灵世界[J].红楼梦学刊,2016,(3).

[10]吕启祥.花的精魂 诗的化身——林黛玉形象的文化蕴含和造型特色[J].红楼梦学刊,1987,(3).

[11]李希凡.林黛玉的诗词与性格——《红楼梦》艺境探微[J].红楼梦学刊,1983,(1).

[12]李云婷.浅析《红楼梦》中林黛玉的伤春情怀[J].文学教育(上),2018,(1).

[13]张新艳.《红楼梦》的人物塑造和文体选择——以林黛玉、薛宝钗诗词为例[J].中州大学学报,2012,(4).

[14]秦桂敏.林黛玉悲剧命运探析[J].文学评论, 2011,(7).

[15]王琨.林黛玉的人格特征分析[J].文学界(理论版), 2012,(4).

[16]周薇.品味林黛玉的美学形象[J].景德镇高专学报, 2012,(1).

[17]吴林.林黛玉与植物意象研究[D].大连:辽宁师范大学硕士学位论文,2006.

[18]杨真真.桃花意象及其对林黛玉形象的观照[J],红楼梦学刊,2009,(2).

[19]张锦池.论林黛玉性格及其爱情悲剧[J].红楼梦学刊, 1980,(2).

[20]王蒙.竹与林黛玉人物形象的多维度建构研究综述[J].红楼梦学刊,2016,(6).

[21]董晔.二十世纪林黛玉研究综述[J].明清小说研究, 2003,(4).

[22]刘海涛.计量语言学导论[M],北京:商务印书馆, 2017.

猜你喜欢

林黛玉红楼梦性格
细品《红楼梦》中的养生茶
假如《红楼梦》也有朋友圈……
续红楼梦
性格描绘词
两个人的爱情和一个家族的“内战”
贵族小姐的精神恋爱
12星座“吃”出性格
喜欢独处与性格孤僻