基于语料库比较规则竞争模型和单词规则模型

2017-09-15赵亮

北京科技大学学报(社会科学版) 2017年4期

赵亮

〔摘要〕在语言习得领域，动词习得一直是备受争议的关键问题之一，尤其是英语动词过去式的习得机制。Yang提出的规则竞争模型（Rules and Competition Model）和Pinker提出的单词规则模型（Words and Rules Model）是其中比较有影响力的理论模型。文章分析了这两个理论模型的基本原理和习得机制，比较其异同点，并通过CHILDES语料库中儿童语言习得的真实语料来验证其解释力。结果显示：规则竞争模型更好地解释了输入频率的作用、动词和过去式的相似性和过度规则化错误；而单词竞争模型在解释不规则动词过去式成因方面表现得更好。

〔关键词〕动词过去式习得；单词规则模型；规则竞争模型；CHILDES语料库

〔中图分类号〕H0〔文献标识码〕A〔文章编号〕1008-2689（2017）04-0032-06

引言

英语动词过去式习得之所以会受到很多理论关注，主要由于它的两个特点：首先，动词的规则变化具有多产性，即使学前儿童也会使用[1]；而不规则变化的动词大概有180个，大多不具有规律性[2]。这一问题代表着英语和其他很多语言中都存在的规则和不规则现象，对这一问题的研究可以更好地解释人类对于语言规则以及语言知识处理的心理机制。

目前，国内外语言学家和心理学家关于儿童动词过去式习得主要有两大理论阵营：先天主义理论和认知科学中的联结主义。先天主义理论的力量来自语言学理论，也就是Chomsky的普遍语法理论。Chomsky认为语言能力是先天的，包括一整套有限的公理化的规则系统和原则系统，运用这些系统就可以衍生出无限的合乎语法的句子。在先天主义理论旗下，关注动词习得，特别是动词过去式习得的理论主要有ChomskyHalle模型[3][4][5]和规则竞争模型[6] [7] [8] [9]等。Rumelhart和McClelland[10]提出的RumelhartMcClelland（RM）模型是认知科学中的联结主义的典型代表，它们认为规则和不规则动词过去式的习得机制是在类推或类似性基础上运作的联想记忆。在ChomskyHalle模型和RM模型的基础上，Pinker[11]提出了单词规则模型。在国内的学者中，黄文红、崔刚[12]和梁丹丹[13]都曾在理论层面讨论这一领域的几种有代表性的观点及焦点问题。

文章首先依次介绍规则竞争模型和单词规则模型的基本原理和习得机制角度，然后借助儿童语言数据交流系统（CHILDES， Child Language Data Exchange System）中的真实语料，分析比较它们的异同点，希望可以进一步认识人类在这个领域的语言规则以及语言知识处理的心理机制。CHILDES是世界上最大的儿童语言语料库，于1985年开始筹建至今，已经促进了与儿童语言研究有关的各种研究活动的开展和信息交流。文章选取了心理和认知科学家Fletcher于2004年上传至CHILDES的语料，记录了他与年龄分别为3岁、5岁和7岁的3组共74名儿童的相互交流。这些实际语料帮助我们认识英语儿童习得动词过去式的过程，并探讨单词规则模型和规则竞争模型的解释力及异同点。

一、规则竞争模型概述

规则竞争模型是变异模型（the Variational model）的一部分，由Yang[6]提出。在变异模型中，普遍语法被认为是先天的语言机制，是人类语言的一般规律，包括原则和参数。在此基础之上，Yang借鉴了Charles Darwin自然主义的研究方法（the naturalistic approach），认为人类语言的发展如同其他有机系统一样，内在因素与外在因素相互影响。儿童习得语言就是一种自然选择（natural selection）过程，一系列可能的人类语法相互竞争，最合适的语法最终达到与母语的实际运用相匹配。Darwin强调个体之间的变化，是个体之间的不同直接导致了整个种族的变化，从而产生了自然选择过程。因此，语言习得过程被看作是一种变异：儿童语言和成人语言之间的差异不在于儿童没有掌握成人语言；这是一个有规则的语言系统发展和转换的阶段，并最终演变为成人语言。这就是变异模型得名的原因。

在英语动词过去式习得领域，Yang[6]提出了“规则竞争模型”，将规则动词与不规则动词放在同一个生成音系学（generative phonology）中来研究。其创新点在于，它在承认规则动词过去式默认规则（a default rule）“ed”的基础上，提出不规则动词的过去式是由一系列的音位系统控制的。也就是说，不规则动词的过去式是由一些特殊的音位系统进行分类成组，儿童习得这些不规则动词的过程是在这些特殊的音位系统与默认的ed规则的竞争中进行的。

变异模型[6]认为，儿童语言习得中系统性错误的存在反映了不同语法形式的共存。规则竞争模型基于变异模型而提出，因此同样认为这些共存的语法形式被赋予不同的语法比重；在语法习得过程中，会因输入语言数据的不同而最终形成不同的语法形式分布。

特定动词x具有两种可能的变化形式：受动词x本身类别影响的不规则变化规则R和默認的所有动词过去式的规则变化，即“ed”规则。具体的语言习得过程就是这两种可能规则之间的竞争。通过具体的语言输入数据，儿童在学习过程中判断特定动词x是适用不规则变化规则R或规则变化。如果x为不规则动词，“ed”规则出现时就导致了动词的过度规则化错误。

动词过去式习得研究的中心问题是：动词过去式规则变化的“ed”规则和不规则变化的R规则是属于同一个大脑语法计算系统，还是分别使用不同的认知模式？受Chomsky & Halle[3]的影响，Yang支持过去式习得中心问题的前一种说法，即规则变化的“ed规则”和不规则变化的R规则属于同一个大脑语法计算系统。

基于生成性音系规则系统，规则竞争模型认为，动词不规则变化也是有规律的，即动词不规则变化是通过应用于一类单词的规则而进行变化的：endprint

{feed， shoot， ...} → R元音缩短

{bring， think， ...} → R-t &韵脚变为a

...

信息理论认为，规则化理论可以对语料进行有效地系统化描述。规则竞争模型认为音系结构的抽象规则化可以很好地节省大脑思维词汇的存储空间。

二、单词规则模型概述

单词规则模型的提出者Pinker是杰出的实验心理学家和语言学家，也是继Chomsky之后坚定的语言先天论的支持者，并基于语言的交际功能来进一步发展先天论的语言观。Pinker[14]提出“语言本能”的观点，认为“语言就如同人类会直立行走一样，是一种与生俱来的本能”。人类语言具有生物学属性，语言本能是一个为了满足交际需求通过自然选择进化的适应性系统。

正因为Pinker认为人类语言具有生物学属性，是生物本能的产物，他采用生物学的研究方法来探索人类语言的进化，致力于通过心理语言学和神经语言学的实证研究，收集各种证据来论证语法基因的存在、语言和大脑神经网络的关系等。他的研究涉及到语言生物属性的各个方面，如生物机制、遗传证据、语法基因、语言损伤、语言模块等。

单词规则模型起源于词汇学派理论[15] [16] [17] [18]。在综合ChomskyHalle模型关于过去式规则形式习得和RM模型关于过去式不规则形式习得理论的基础上，Pinker & Prince[19]提出了两者的混合体，即单词规则模型：动词过去式规则形式是依据一定的规则将动词的词干结构和词缀结构结合在一起生成的。动词过去式不规则形式是大脑记忆的一部分，通过思维词典以成对词组的形式存在。这里的记忆是相互联结的，有点类似于RM模型，不仅词和词是关联的，词和词的组成部分之间也是相关联的。过去式不规则形式联结的建立依赖于输入频率，需要时间和不断练习使之能够更加熟练使用。当儿童从记忆中提取过去式不规则变化形式失败时，默认“ed”变化形式就会被使用。

根据Pinker[20]（23），单词和规则是单词规则模型的两块基石。单词是语音的延伸，因为不能由规则生成而需要记忆；规则指的是形态学规则，用于帮助生成规则过去式或复数形式。过去式不规则形式存储于词库中，是陈述性记忆的一部分。过去式规则形式则依据规则通过特定的程序系统而获得。因此过去式不规则形式具有词汇记忆所特有的心理学、语言学和神经心理学依据，而过去式规则形式则共享大脑的语法处理程序特征。其中，单词元素受阻碍原理（Blocking Principle）影响，阻碍原理具体指：在单词曲折变化中，特殊形式优先于普通形式的使用，也就是说，当两种规则或词汇形式共存时，在进行单词语素或因素变化时，应优先使用较特殊的一种变化形式。当无法从记忆中提取动词的不规则变化形式时，说话者就会倾向于在词干的基础上直接应用规则性变化形式。

三、用语料验证规则竞争模型和

单词规则模型的解释力

（一） Fletcher收集的儿童语言习得语料

儿童语言习得是个渐进的过程。大约2岁时，儿童开始使用动词过去式，到6岁和7岁时，他们可以正确使用动词过去式。文章选取了语言学家Fletcher于2004年收集的语料：他和三组年龄分别为3岁、5岁和7岁的共74名儿童的对话，包括成人的言语输入及儿童的言语表达。根据不同的年龄，语料也相应分为三组，其中，3岁年龄组共25个语料，5岁年龄组共25个语料，7岁年龄组共24个语料。

我们记录下这些语料中出现的所有动词过去式规则及不规则变化，并分别统计了三组语料中不规则动词过去式的正确使用率（CUR，correct usage rate）及过度规则化错误率（见表1）：

正确使用率（CUR） = 正确过去式的总数量过去式的总数量

过度规则化错误率 =

过度规则化错误的数量

过度规则化错误的数量+正确的不规则动词过去式数量

分别计算三组语料中的不规则动词过去式的正确使用率和过度规则化错误率将帮助我们获得整个儿童语言习得过程中的细节特征，如音系是如何构成及习得的重要证据。

表1显示三个年龄段的儿童对动词过去式的使用都基本正確。只是5岁组的儿童的正确使用率略低于3岁和7岁年龄组。Berko[1]认为儿童动词过去式习得历经3个阶段：第一阶段，儿童仅使用少量的动词过去式；第二阶段，相关语言规则的隐性知识逐渐形成，过度规则化错误出现；第三阶段，规则和不规则形式共存。从表1的数据来看，语言习得的过程相对平稳。

（二）用规则竞争模型解释语料

在规则竞争模型中，不规则动词过去式的形成原因是某些音系规则。过度规则化错误等不是简单的记忆错误，而是错误地把特殊音系规则应用到规则动词上。规则竞争模型基于语言习得的变异模型，认为儿童言语中的系统性错误反映了在竞争中共存的语言规则。

Yang[6]把动词分成不同组别，认为同组动词过去式的正确使用率大致相同。根据Yang的分类，我们分析了Fletcher语料中三组儿童对不同组不规则动词过去式的正确使用率，结果见表2、表3和表4。

规则竞争模型强调言语输入频率的重要性：较高的输入率可以改善儿童语言表现，上述表格中不规则动词过去式的整体习得趋势也验证了这一假说。更重要的是，从上述表格来看，在不同年龄组中，同组动词的输入频率不尽相同，但是它们的正确使用率确实大致相同。例如，动词“get”和“take”，前者的输入频率远高于后者，但是作为同组动词，它们的正确使用率基本一致。同样的情况也发生在动词“go”和“come”上。这就是所谓的搭便车效应。

（三）用单词规则模型解释语料

与规则竞争模型不同，Pinker[20]认为，动词过去式不规则形式类似于很久之前就死去的规则化石，是大脑记忆的一部分，儿童只能通过记忆的方式习得不规则动词过去式。这也依赖于输入频率，需要时间和不断练习使之能够更加熟练使用。当儿童从记忆中提取过去式不规则变化形式失败时，默认“ed”变化形式就会被使用。endprint

Pinker[14]认为，不规则动词过去式的正确使用率与词干有关。很多不规则动词过去式以“t”或“d”结尾，这也起源于规则变化“ed”，后来在省力原则作用下促使了不规则形式的产生，并在语言发展历史中保持下来。文章选择了四组拥有同样词干的动词，分析它们在三组语料中的正確使用率，结果见表5。

从表5来看，因为选取的动词有限，且三组儿童的正确使用率都较高，看上去拥有同样词干的动词的正确使用率也相似。比规则竞争模型中的音位系统规则相比，拥有同样词干这一因素明显涉及的单词要少很多，解释力不如前者。

（四）比较单词规则模型和规则竞争模型的解释力

通过上文的论述，我们发现，在语言的生物属性和语法系统运作的问题上，Yang与Pinker的看法基本上是一致的：都认为语言是天生的，每个人都拥有普遍语法；普遍语法是一个离散性的组合系统，这个系统制约着语言的运作。

对于动词过去式的习得，首先，Yang和Pinker都同意：过去式规则形式是通过特定规则形成的；其次，对于过去式不规则形式，他们拥有不同的观点：Yang认为，不规则动词形式是通过音系规则获得的；而Pinker认为180个左右的不规则动词形式是通过单词成对记忆的。

具体来说，两个模型在动词过去式习得领域的异同点如下：

首先，在单词规则模型和规则竞争模型中，过去式的输入频率均具有重要作用。在规则竞争模型中，过去式的言语输入作为语言环境，可以通过加强同类动词的输入频率来提高其正确使用率；在单词规则模型中，加强不规则动词及其过去式之间的联结来提高正确使用率。前者更好地解释了语料分析的结果。

其次，两个模型都关注了动词及其过去式的相似性，但解释不同。在规则竞争模型中，变化的相似性是基于相同的音系生成规则；而在单词规则模型中，相似性是通过动词相同的词干实现的。在这一点上，两个理论模型各有千秋。

第三，不规则动词过去式在大脑中的存在方式也是两个模型的关注点。在规则竞争模型中，不规则形式是通过音系规则生成，其特殊性是特定规则作用的结果；而在单词规则模型中，过去式不规则形式最初是以规则形式存在的，发音过程在省力原则作用下促使了不规则形式的产生，并在语言发展历史中保持下来。后者更好地解释了不规则动词过去式的成因。

第四，过去式过度规则化错误是语言习得研究中不可忽视的现象。在规则竞争模型中，过度规则化是儿童语言发展的一个必不可少的阶段，并能对音系规则形成及运行的揭示有一定启发作用；而在单词规则模型中，过度规则化只是儿童偶然的发音失误。在这一方面，前者更有说服力。

四、结语

通过前文的分析比较，我们认为：规则竞争模型更好地解释了输入频率的作用、动词和过去式的相似性和过度规则化错误；而单词竞争模型在解释不规则动词过去式成因方面表现得更好。

英语动词过去式习得的争论已经持续了几十年，吸引了语言学家、心理学家、神经科学家、计算机专家等的注意。要对现存的理论进行一步验证，还需要更多的数据。文章仅对单词规则模型和规则竞争模型进行理论上的比较分析，并用真实的儿童语言习得语料来验证，希望能更好地说明人类在此方面的语言规则以及语言知识处理的心理机制。

。

〔参考文献〕

[1] Berko， J. The childs learning & English morphology [J]. Word， 1958， 14 （3-4）： 150-177.

[2] Marcus， G. F.， Pinker， S.， Ullman， M.， Hollander， M.， Rosen， T. J. & Xu， F. Overregulations in language acquisition [J]. Monographs of the Society for Research in Child Development， 1992， 57 （4）： 1-165.

[3] Chomsky， N. & Halle， M. The Sound Pattern of English [M]. Cambridge， MA： MIT Press， 1968.

[4] Halle， M. & Mohanan， K. P. Segmental phonology of modern English [J]. Linguistic Inquiry， 1985， 16 （1）： 57-116.

[5] Halle， M. & Marantz， A. Distributed morphology and the pieces of inflection [A]. In Hale， K. & Keyser， S. J. （eds.）. The View From Building20： Essays in Linguistics in Honor of Sylvain Bromberger [C]. Cambridge， MA： MIT Press， 1993： 111-176.

[6] Yang， C. Knowledge and Learning in Natural Language [M]. Oxford： Oxford University Press， 2002.

[7] Yang， C. The Infinite Gift： How Children Learn and Unlearn the Languages of the World [M]. New York： Scribner， 2006.

[8] Yang， C. Three factors in language variation [J]. Lingua， 2010， 120 （5）： 1160-1177.endprint

[9] Yang， C. The Price of Linguistic Productivity： How Children Learn to Break the Rules of Language [M]. Cambridge， MA： MIT Press， 2016.

[10] Rumelhart， D. & McClelland， J. On learning the past tense of English verbs： implicit rules or parallel distributed processing [A]. In McClelland， J.， Rumelhart， D. & PDP Research Group （eds.）. Parallel Distributed Processing： Explorations in the Microstructure of Cognition [C]. Cambridge， Mass： MITPress， 1986： 216-271.

[11] Pinker， S. Rules of language [J]. Science， 1991， 253 （5019）： 530-535.

[12] 黃文红，崔刚. 心理语言学研究中的过去时之争[J].外国语， 2010， 33 （3）： 23-31.

[13] 梁丹丹. 英语过去时习得的认知机制之争[J]. 山东外语教学， 2010， 135 （2）： 31-36.

[14] Pinker. S. The Language Instinct [M]. New York： Morrow， 1994.

[15] Aronoff， M. Word Formation in Generative Grammar [M].Cambridge， MA： MIT Press， 1976.

[16] Bresnan， J. A realistic transformational grammar [A].In Halle， J. B. & Miller， G. （eds.）. Linguistic Theory and Psychological Reality [C]. Cambridge， MA： MIT Press， 1978： 1-59.

[17] Jackendoff， R. S. Morphological and semantic regularities in the lexicon [J]. Language， 1975， 51 （3）： 639-671.

[18] Lieber， R. On the Organization of the Lexicon [D].Unpublished MIT doctoral dissertation， 1980.

[19] Pinker， S. & Prince， A. On language and connectionism： analysis of a parallel distributed processing model of language acquisition [J]. Cognition， 1988， 28： 73-193.

[20] Pinker， S. Words and Rules [M]. New York： Basic Books， 1999.

（责任编辑：高生文）endprint

北京科技大学学报(社会科学版)

2017年4期

基于语料库比较规则竞争模型和单词规则模型

杂志排行

北京科技大学学报(社会科学版)的其它文章