APP下载

毛泽东话语的词语特征

2017-01-10曾祥喜

关键词:词频毛泽东话语

曾祥喜

摘要:毛泽东话语是中国当代最具有影响力的话语,其话语特征具有毛泽东式的显性特征。以《毛泽东文集》(6-8))为分析对象,通过封闭式的词语数据统计分析出毛泽东话语的词语特征为:词语分布集中;平均词长偏短;词语重复率高。并在此基础上总结出毛泽东话语词语在频率分布及词语选择上的具有个性化的特征。

关键词:毛泽东;话语;词频;词语特征

中图分类号:A41;H13; H15

文献标识码:A DOI:10.3963/j.issn.1671-6477.2016.06.0036

毛泽东话语无疑是中国当代最具代表性的权势话语,其影响,正如钱理群教授所指出的:“毛泽东是真正影响了生活在‘毛泽东时代的每一个中国国民的,而其隐性影响还传到了他们的后代。这就是说,中国国民性实际上已经经过了毛泽东的改造,时至今日,人们在观察大陆中国人的思想观念、思维方式、行为方式,以至言说方式时,都可以发现或显或隐的毛泽东思想的烙印”[1] 。

作为当代中国主流话语——毛泽东话语在中国境内受到的关注并不多,大多数中国学者研究毛泽东的语言主要是着眼于分析他的语言风格或语言艺术。近几年有少数学者开始关注毛泽东的话语研究,如文贵良[2]分析了毛泽东思想及话语如何成为中国现当代具有影响力的权威话语,该文重在描述“史”发展过程,并未涉及到毛泽东话语的特征分析。但在其随后的论著《话语与生存:解读战争年代文学(1937-1948)》[3]中,对毛泽东话语的影响作了非常深入而细致的分析,他认为毛泽东终其一生都在致力于话语建设,在政治话语的形成和实践中,借话语权威的符号化的“毛泽东”而以言行事。王文涛 [4]主要介绍Schwartz①关于“毛主义话语”论述和分析,亦并未对毛泽东话语作进一步的深入分析和研究。而国际上,对毛泽东话语的研究分析一直以来都受到相当重视。这些研究者多从权势话语角度并结合中国的政治和革命展开分析论述,如D. Apter 结合中国社会革命和历史分析描述了毛泽东话语[5],如何从延安时代开始发展成为一种权势话语,而这种话语又如何影响了中国的革命和社会。总体上多是对毛泽东话语的宏观分析,而缺乏一定的微观视野。因此,本文将致力于通过对毛泽东话语文本词语运用微观而细致的统计分析描写毛泽东话语的词语特征。

本文主要分析毛泽东话语的词语特征。以词频分析作为主要内容,通过统计数据描写毛泽东话语的文本词语频率特征。本论文选择高频词作为分析的突破点是基于以下想法:其一,高频词反映出话语最基本的特征。语言最基本的运用单位就是词。而某些词之所以能被高频率地使用,在很大程度上,它们反映出当时社会的热门问题或话语,而这类词主要通过实词如名词、动词、形容词、代词等表现出来。其二,词语分析在文本中更易于定量研究。它摒弃了主观判断所带来的不足,可使研究结果更为客观、科学,从而得出令人信服的结论。本论文的语料来源于《毛泽东文集》(6-8卷)(总字数计485 869)。该文集由人民出版社1996、1999年出版。《毛泽东文集》(6-8)卷是毛泽东建国后(1949年10月1日)的一些文章,该文集编选的文章是《毛泽东选集》以外的重要文稿,该文稿绝大部分根据中央档案馆保存的毛泽东手稿、早期文本和记录稿刊印,保持原貌,只校正文稿中的错字、漏字、衍字以及明显有误的标点,订正错讹的史实,讲话、谈话记录稿只作技术性的整理。在内容上,毛泽东的这些文本涉及政治、经济、军事、外交、文学艺术等领域以及少量私人通信。可以说,它能真实地表现毛泽东话语/文本的特征。本文将《毛泽东文集》(6-8卷)建成一个封闭式语料库,运用的分词软件是湖北大学付正刚先生在湖北大学教授易洪川研究发明的“易五码查字法”(获国家专利)技术基础上开发的自动分词软件,并可对分词进行人工干预。有关“词”的判断以中国社会科学研究院语言研究所编纂的《现代汉语词典》(商务印书馆1997年版)为准,另增添一定数量的固定短语。

一、毛泽东话语的词语频率特征

通过运用自动分词软件的统计分析,可以看出毛泽东话语的词语频率具有以下特征:

其一,词语分布集中。从词语使用频次上来看,毛泽东著作的文本中,高频词词条数量少,但使用频次却非常高,表现出高频词集中的特点,在词语分布上也占据了绝对优势。为了进行比较,下面先统计分析使用次数小于10的低频词使用频率②,具体情况见表1。

从表1中可以看到,使用频次1~9的词语在毛泽东文本中共有10 398个词条,占总词条的80.059%,但它们相对累积频率却仅有7.698%。与高频词语相反,虽然词条数量大,但它们的使用频率上的比重却并不高,明显处于弱势,平均词语出现(它们的使用频次数/此类词条数)仅为2.2157次。

与低频词形成强烈反差的是,其中高频词的使用集中,毛泽东文本中的中、高频词(使用频次10次及以上)的词条共2590个,在词条总数中仅占19.941%,它们使用的频次是276 345,占总使用频次的92.23%,也就是说,毛泽东文本中不到20%的高频词语使用频率超过了90%以上(详情见表2)。如果我们以此为依据来计算这类高频词的相对出现率,其平均出现率则高达106.697次,可见其分布的密集程度。

其二,平均词长偏短。《毛泽东文集》(6-8卷)文本共使用词语299 384条次,使用的词语共12 988条,平均词长为1.6229。据《现代汉语词语频率辞典》的统计[6],现代汉语词语“词条”的平均词长为2.0928,即现代汉语词语大多数大于双音节,也就是说,现代汉语词语的主体是双音节词。毛泽东文本词语词长明显低于现代汉语一般文本的词长,其原因主要是单音节词语的比例比一般文本高。现代汉语单音节词主要集中在基本词汇,也就是说毛泽东文本中的基本词汇使用比例比较高,因而单音节词语多,词长相对就偏短。另外,单音节词在现代汉语口语中应用也非常多。毛泽东文本平均词长偏短的原因也由于其话语风格口语化程度较高,这与毛泽东自《延安文艺座谈会上的讲话》所提倡的文风有密切的关系[7]。由于中国共产党宣传对象为工人农民阶级,其文化水平都不高,因此,毛泽东践行了他提倡的向人民群众学习语言的方针,并一贯保持着这种文风。这种俗白的口语风格造成了毛泽东文本单音节词多、词长短的特点。

其三,词语重复率高。在《毛泽东文集》(6-8卷)文本中,总字数计485 869,共使用词语299 384条次,使用的词语共12 988条,平均每条词语出现23.051次,即重复率超过23次。词语重复率高,使用的词语数量相对就少,这可能与毛泽东话语主题具有明显的倾向性有关,也反映出毛泽东话语的词语选择倾向,也佐证了毛泽东话语的俗白口语化风格。

如果分析将词条每条在总文本中的出现率,即词条数与文本总字数之比,毛泽东文本的词语出现率为0.02673。同样方法,比较其他一些语料库数据(语料时段:1919年-1980年代)[8]如:北京航天航空大学汉语词库,语料库容量为21236784字,96730个词条,词语出现率为0.00455;北京语言大学汉语词库,语料库容量为1800000字,31159个词条,词语出现率为0.01731;北京师范大学汉语词库,语料库容量为1068000字,39601个词条,词语出现率为0.03707。

将毛泽东文本有关数据与这三家语料库的数据进行比较分析,可以看到,毛泽东文本的词语出现率大于前两家,即大于一般普通文本。北京师范大学汉语词库的语料性质为“中小学语文课本语料库”,即文本对象主要是未成年的青少年。由于文本性质的关系,其词语数量相对少或贫乏,词语出现率较高。词语的出现率也从另一个侧面反映出词语是否多样化,即词语出现率越高,多样化程度越低,词汇相对就显得单一。

二、毛泽东话语词语的词类特征

(一)名词与动词是毛泽东话语中的绝对高频词词类

名词与动词是其高频词类。毛泽东话语的中高频词语中,从词类上来分析,词类集中,主要多使用两类词,最多的名词,其次是动词。也就是说,名词和动词数量多且使用频率高,重复使用程度高。其它各类词语使用比例见表3。

(二)毛泽东话语中的相对高频词词类

为了与现代汉语其他文本进行比较,笔者将中国国家语委现代汉语语料库作为一个比较参照,将毛泽东文本的高频词中前50条逐一查询,语料库中词语高频词顺序如下(以毛泽东文本的高频词为范围前50个):

的/了/在/是/和/一/我/这/他/有/不/中/也/就/地/着/上/为/对/人/年/与/说/种/都/个/而/你/要/我们/把/从/来/等/又/到/大/发展/以/它/多/还/没有/两/他们/能/所/很/用/得/

将它与毛泽东文本比较,我们发现,毛泽东特有的高频词(前50)是:问题/人民/好/可以/你们/中国/国家/现在/各/工作/社会主义/美国/同/会/这样/看/等词语,在一般文本中使用频率远不如毛泽东的使用频率高,有的甚至使用频率较低或很低。

将毛泽东文本与语料库文本进行比较,其使用频率有一些不同,具体数据见表3。

以上50词在毛泽东文本中的平均出现率是0.47187,一般文本中平均出现率为0.22271,两者之比为:2.11876:1。同时,通过对毛泽东文本出现率与一般文本出现率的比率进行标准差计算,标准差为2.815332。也就是说,在毛泽东文本中,这些高频词出现率比在一般文本中的出现率高2倍多。

我们假设,毛泽东文本词语出现率在这个范围内都属正常。我们可以把比率为3以内的出现率视为近似,即两者具有一致性。将两者的一致性程度分为五等,即:一致(出现率之比在2以内)、基本一致(出现率之比2~3)、基本不一致(出现率之比3~4)、不一致(出现率之比5~6)、完全不一致(出现率之比7以上)。

就目前笔者所分析的此50个高频词来看,在两类不同文本中高频词一致的词语有:

中/地/我/在/和/的/了/对/他/上/种/年/说/一/

高频词基本一致的有:

都/大/两/多/到/看/能/这/也/会/人/要/是/

高频词基本不一致的依次是:

他们/中国/没有/就/有/这样/还/很/工作

高频词不一致的依次是:

不/个/各/问题/好/国家

高频词完全不一致的依次是:

你们/可以/人民/美国/我们/社会主义/现在/同

从以上的分析看,在两类文本出现率基本一致主要是以下几类:助词“的”、“地”(含简缩名词)、“了”;介词“在”、“对”、“到”(含动词);方位名词“中”(含专名)、“上”;数词“一”、“两”;代词“我”、“他”、“这”;连词“和”;形容词“大”、“多”;量词“种”(含动词);副词“都”、“也”、“要”;判断动词“是”;能愿动词“能”、“会”(含名词);动词“说”、“看”和名词“人”、“年”等。

就笔者调查的结果来看,两类文本的高频词有一致的地方,主要是封闭性词类,主要表现在助词、介词、连词、代词和副词和判断动词等词类上,助词“的”、“地”、“了”,介词“在”、“对”,连词“和”,副词“都”、“也”等。这种一致性反映了汉语词语运用的基本特征,是具有共性的高频词。它们使用频次高,主要原因是与汉语虚词是一种语法手段有关,是语法结构对词语组成句子的要求。

毛泽东话语中相对高频词主要是上述统计中的不一致和完全不一致的词语,分别是以下几类:名词“人民”、“美国”、“社会主义”、“现在”、“问题”、“国家”等;代词“你们”、“我们”、“各”等;能愿动词“可以”;形容词“好”;否定副词“不”;量词“各”和连词“同”。相对高频词中,多体现在开放性词类中,如名词“社会主义”、“人民”、“问题”、“国家”,时间名词“现在”,专用名词“美国”,形容词“好”等。也有些封闭性词类如人称代词“你们”、“我们”,量词“个”,能愿动词“可以”等。这类相对高频词应该说最能体现毛泽东的话语特色,因而值得更多关注和研究。

三、结 语

综上所述,毛泽东话语的词语特征在使用频率上与一本文本具有较大的差异性,词语分布高度集中、重复率较高,且词长较短,这和毛泽东所提倡的口语化话语风格一致,体现出毛泽东践行了他所倡导的“群众语言”风格。在其高频词的具体运用上,毛泽东话语的高频词与一本文本有着共性特征,主要表现在助词、介词、连词、代词和副词和判断动词等封闭性词类上,助词“的”、“地”、“了”,介词“在”、“对”,连词“和”,副词“都”、“也”等,这种一致性反映了汉语句法特征;但在开放性词类中,毛泽东话语的高频词则具有其时代性和话语话题及话语功能上的具有个性化的特征。

注释:

①Schwartz的相关论述主要见于其1955,1960,1965和1968年发表的论著中。

②词语频率计算方法参照Woods, Fletcher & Hughes 的《语言研究中的统计方法》一书(陈小荷、徐娟等译,北京语言文化大学出版社2000年版第16-19页)的方法。

③在这里,兼类词按类分计,因此词条数目总和大于2590。

[参考文献]

[1]钱理群.科学总结20世纪中国经验[M]∥追寻生存之根:我的退思录.桂林:广西师范大学出版社,2005:26.

[2]文贵良.毛泽东作为话语权威的成长[J].书屋,2004(5):43-49.

[3]文贵良.话语与生存:解读战争年代文学(1937-1948)[M].北京:世界图书出版社,2007:1.

[4]王文涛.“毛主义”话语的起源、性质与内涵:简评史华慈的《中国的共产主义运动与毛泽东的崛起》[J].湖南科技大学学报:社会科学版,2005(2):23-26.

[5]Apter, David E. & Saich, Tony. Revolutionary Discourse in Maos Republic[M]. Cambridge & London: Harvard University Press, 1994.

[6]北京语言学院.现代汉语词语频率辞典[M].北京:北京语言学院出版社,1986:1488.

[7]郭 熙.中国社会语言学[M].南京:南京大学出版社,1999:84-87.

[8]汤志祥.当代汉语词语的共时状况及其嬗变[M].上海:复旦大学出版社,2001:14-17.

(责任编辑 文 格)

Abstract:Mao Zedongs discourse is the most influential discourse in contemporary China, and its features is as the dominant characteristic of Maos. This thesis includes the collection of Maos discourse features in the frequency distribution and choice of words with his personalized features through closed type of word statistics to analyze the words characteristics on Mao Zedong Texts (6-8).

Key words:Mao Zedong; discourse; words frequency; words feature

猜你喜欢

词频毛泽东话语
基于词频分析法的社区公园归属感营建要素研究
现代美术批评及其话语表达
抗美援朝,毛泽东立国之战
1949,毛泽东点将
词频,一部隐秘的历史
云存储中支持词频和用户喜好的密文模糊检索
以关键词词频法透视《大学图书馆学报》学术研究特色
“那什么”的话语功能
吴自立“闹事”与毛泽东复信