APP下载

基于语料库的《哈利·波特》系列小说词汇特征分析

2015-05-30刘瑜于小娟

大观 2015年6期
关键词:哈利·波特哈利波特

刘瑜 于小娟

摘要:借助语料库检索工具 WordSmith5.0,通过对比分析自建《哈利.波特》系列小说语料库和BROWN(K-R)文学类语料库在词汇分布、词汇密度方面的特征,试图发现《哈利.波特》系列小说的词汇特征。

关键词:《哈利.波特》;BROWN(K-R)文学语料库;词汇特征

一、研究背景

随着语料库语言学的发展,语料库文体学以现代计算机和统计学的手段对文本进行分析,它强调用定量分析的方法分析文本,利用语料库及语料库工具对文本进行客观地、量化地分析文本。较之基于直觉和印象主义的文体学,语料库文体学能提供更客观的数据,更有说服力。

《哈利.波特》是英国作家J.K.罗琳的魔幻文学系列小说,共7部。该系列小说被翻译成67种语言,所有版本的总销量逾5亿本,名列世界上最畅销小说之列。国内外学者从不同视角对它进行了多元化的剖析。从研究现状来看,以使用文学理论进行的描述性研究为主导,尚缺乏将定量分析技巧与定性分析方法相融合的研究方法。基于此,本文将利用语料库定量研究方法对《哈利.波特》系列小说的文体词汇特征进行分析。

二、研究方法

本文的研究语料为自建的由7部《哈利.波特》系列小说构成的微型语料库共100多万字,同时选取BROWN 语料库中文学类文本,即 BROWN(K-R)(共计约 25 万多词)作为参照语料库。本文利用语料库文本分析软件 Wordsmith Tools5.0对比两库中词长和词汇密度等层面的特征,分析《哈利.波特》系列小说的词汇特征。

三、研究结果与讨论

1.词长分析

本研究发现,只有1-13字母单词在两个语料库中的比率均在0.1%以上,因此,通过对比《哈利.波特》系列小说语料库和BROWN(K-R)文学类语料库中1-13字母单词的比率(如图1所示),可以发现,1-13字母单词在《哈利.波特》系列小说语料库中所占比率均小于在BROWN(K-R)文学类语料库中的比率。由于“词长是决定文本难易程度的一个重要指标。单词越短小,文本越易理解,难度越低,文本的正式程度就越低;反之,单词越长,文本越不易理解,难度越大,文本越正式”[2]。图1进一步表明《哈利.波特》系列小说的阅读难度较大小。

2.词频和词汇密度分析

形符(Tokens)指在词频统计时,一个单词计算为一个形符,即文本中有多少单词就有多少形符。总形符数是语料库容量的最常用的测量单位。表1显示,《哈利.波特》系列小说语料库总形符数为1,096,170,BROWN(K-R)文学类语料库总形符数为256,087,因此这两个语料库在容量上相差近4.28倍。

类符(Types)是一个统计单位,一个文本的类符数就是该文本不同词形的数量,如表1所示,《哈利.波特》系列小说语料库和BROWN(K-R)文学类语料库中的类符数分别为23,146和19,198。

在语料库语言学中,类符/形符比(TTR)通常被用来衡量文本中的词汇密度[3],词汇密度反映的是句中实词所占的比例,因此在一定程度上反映了文本的某种本质特征,即用词的多样性。表1 的统计结果显示,《哈利.波特》系列小说语料库中类符/形符比为 2.11,而 BROWN(K-R)文学类语料库的类符/形符比为 7.56,但由于不同容量的语料库类符/形符比不具可比性,故一般用标准化类符/形符比(STTR)来衡量语料库的词汇密度。

标准化类符/形符比(STTR)是将所得到的若干个类符/形符比进行均值处理后最终得到的数值。《哈利.波特》系列小说语料库和BROWN(K-R)文学类语料库的标准化类符/形符比分别为44.33和44.89。Halliday发现非正式书面语体的词汇密度低,书面语词汇密度高,信息量大;而口语词汇密度低,包含信息量小,但是句子结构灵活多变、复杂。基于以上数据分析可以了解到《哈利.波特》系列小说的词汇普遍短小,词汇密度较低,口语化特征明显,用词更加简易,通俗。

四、结语

通过对比分析自建《哈利.波特》系列小说语料库和BROWN(K-R)文学类语料库在词汇分布、词汇密度方面的词汇特征,发现《哈利.波特》系列小说所用词汇普遍短小,词汇密度较高,口语化特征明显,叙事简洁、平实,可读性强。因此,语言研究者通过语料库手段对文学作品词汇进行量化分析,可以观察到用传统方法无法发现的很多语言事实,从而对语言本身进行更加客观地描写和解释,为研究提供更加科学的数据支撑,从而使结果更具客观性和准确性,继而增加了 解释的说服力。

【参考文献】

[1]陈建生,高博.基于语料库的《诗经》两个英译本的译者风格考察—以“国风”为例[J].天津外国语大学学报,20111(04):36-41

[2]杨秀珍,续娜,刘美瑜.基于语料库的 《暮光之城 》系列小说词汇特点初探[J].长春理工大学学报,2010(02):71-73

[3]王华,甄凤超.透过主题词和关键主题词管窥中国学习者英语口语交际能力中的词语知识[J].外语界,2007(01)

猜你喜欢

哈利·波特哈利波特
读《哈利•波特》有感
我爱读的《哈利·波特》
成为哈利·波特
好脏的哈利
勇敢的哈利·波特
像哈利那样隐身