APP下载

动宾语义搭配框架描述要素

2010-08-15

关键词:动宾义项宾语

李 琼 李 志

(华中师范大学国际文化交流学院,湖北武汉430079)

动宾语义搭配框架描述要素

李 琼 李 志

(华中师范大学国际文化交流学院,湖北武汉430079)

动宾语义搭配框架的描述主要包括三大要素——语义角色、语义类别和语义特征。具体地说就是,考察某个动词所能搭配的宾语语义角色有哪些,分别由哪个或哪些语义类别的名词充当,需要的时候应该给名词附加哪些语义特征。

语义角色;语义类别;语义特征

中文信息处理经历了字处理和词处理阶段的发展后,正逐步艰难地向句处理阶段迈进。句处理阶段的主要任务就是让计算机理解或生成一个符合汉语规则的句子,其中自动句法分析是重要步骤。对汉语来说,绝大多数情况下,动词是句子的核心成分,如果把动词跟它周围名词的关系研究清楚了,自动句法分析的工作也就完成了一大半。而在动词和其周围名词的诸多种关系中,动宾关系显然是最重要的,因此,在计算机进行自动句法分析的时候,如果能确定句子中的动词跟它后面哪个名词发生动宾关系,组成动宾结构,整个句子的轮廓也大致清晰了。为达到这个目的,我们必须为计算机提供有关动宾语义搭配的全部知识,建设一部机用的动宾语义搭配电子词典。在这部词典中,我们将为每个动词建立起动宾语义搭配的框架,而不是一一列举能跟某个动词搭配形成动宾关系的所有名词。这样做一是为了节省人力和时间,另一个原因则是为了计算机处理的方便和快速。

动宾语义搭配的实质是一种语义组合关系,动宾语义搭配框架就是用来描述组合成分之间的选择限制,即动词和名词宾语之间的语义选择限制的。詹卫东(2003)认为,“实际上,刻画组合关系的语义知识除了确立不同的语义组合类型外,很重要的任务就是描述组合成分之间的选择限制,而这种选择限制,常常是以聚合类为单位来加以记录的(比如跟动词‘吃’形成‘受事’组合关系的名词应该属于‘食品’类)。”因此我们在描述一个动宾语义搭配的框架时,主要包括三大要素:语义角色、语义类别和语义特征。即考察某个动词所能搭配的宾语语义角色有哪些,分别由哪个或哪些语义类别的名词充当,需要的时候应该给名词附加哪些语义特征。

一、宾语语义角色

这里的语义角色只是针对宾语而言,即跟动词搭配的宾语的语义角色,也就是宾语的语义类型。在汉语语法研究中存在一个明显的事实,那就是,仅仅指出动词后面的名词是宾语还不够清楚,对人特别是对计算机的自然语言理解来说用处不大,因为动词跟宾语之间的语义关系错综复杂,宾语的语义类型丰富多样,迄今为止,语言学家归纳出来的就有“动作施事关系——施事宾语”、“动作受事关系——受事宾语”、“动作结果关系——结果宾语”等好些类;而且随着时间的推移和研究工作的深入开展,今后说不定还会有新的语义关系和宾语类型进入这个“动—宾”框架中。正如当初菲尔摩对一种语言中到底有多少语义格无法确定那样,尽管已经有许多学者对动宾语义关系进行过归纳,但到目前为止,学者们对这种关系的说明仍然存在不少分歧,无法形成统一的看法:(1)各家归纳出的动宾语义关系和宾语语义类型在数量和具体类别上出入很大,多的达14种,少的只有几种,分类的随意性较大;(2)在各家的分类中,有些类别名称相同,其实外延并不同,比如,同样是受事宾语,有人认为不包括“写毛笔”的“毛笔”,有人则认为应该包括;(3)有的说明了分类依据的形式标准,有的却未作说明,即使是提供了形式标准的,从构成成分上看也相当庞杂;(4)给宾语作语义分类时,各家大都只是选择一部分关系明显的宾语归类,真正作穷尽性归类的比较少;(5)有些归类也不免牵强,如“养儿子”的“儿子”是受事宾语,而意思相近的“下崽儿”的“崽儿”却是结果宾语了。

有鉴于此,加之动宾语义搭配框架要说明的是动词和广义名词宾语之间的语义搭配关系,所以我们主要参照孟琮等编著的《汉语动词用法词典》中对名词宾语语义类型的划分,把动词和宾语之间的语义关系分为如下几类:

动作/行为——受事类:受事宾语

行为——对象类:对象宾语

动作——结果类:结果宾语

动作——工具类:工具宾语

动作——方式类:方式宾语

动作/行为——目的类:目的宾语

动作/行为——原因类:原因宾语

动作/行为——处所类:处所宾语

动作——时间类:时间宾语

动作——致使类:致使宾语

动作——施事类:施事宾语

动作——系事类:系事宾语

动作——杂类:杂类宾语

我们对动词所带名词宾语的语义类型划分跟《汉语动词用法词典》有所差异。(1)类别不同。《汉语动词用法词典》总共分了14类,而我们只有13类,没有同源宾语这一类。(2)名称不同。我们把《动词用法词典》的等同宾语改称为系事宾语,这主要是从形式特点上来考虑的,因为带这类宾语的多是表判断义的动词,这样称呼更准确贴切。(3)分类标准不同。《汉语动词用法词典》虽然提出了判断宾语类型的形式特征,却并没有严格按照形式标准给各种宾语归类。比如把“办护照”的“护照”说成是目的宾语,而我们认为“护照”在这里应该是受事宾语,因为“办护照”可以转化为“把护照办(好)”。再比如《汉语动词用法词典》把“优待一辆自行车”的“一辆自行车”归入方式宾语,把“照顾了一幢楼房”的“一幢楼房”却说成是工具宾语,而它们都可以用“用……的方式……”进行变换,前者可以变换为“用一辆自行车的方式优待(劳模)”,后者可以转换为“用(奖励)一幢楼房的方式照顾(军烈属)”,因此本文都称为方式宾语。(4)名称相同,外延不同。《汉语动词用法词典》所称的杂类宾语其外延并不明确,只说是无法归入其它类别的所有宾语都归入这一类,而本文的杂类宾语外延十分确定,主要包括离合词和某些固定短语的宾语。

二、宾语名词语义类别

(一)建立名词语义分类体系的意义

大千世界,万事万物,杂乱纷呈。为了有效地认知客观事物,人们往往会采用各种各样的方法,其中最基本也是最重要的一种方法便是分类法。分类不仅反映了人们认识客观世界的成果,同时还可以作为人们认识事物的一种手段。客观世界的类别反映到语言中来就形成了语义的类别,所以分类又可以作为研究语义、表示某种语义知识的手段。孙宏林(1993)认为,语义分类可以使描述简洁,避免冗余信息,还可以揭示概念之间的蕴含关系,便于知识推理;而且从机内表达的角度来说,编码简单,搜索便捷,占据的存储空间很小。语义分类的这些优点特别是它在机内表达方面的优点受到了计算机专家的青睐,一些实验系统就用简单的分类作为语义知识源。汉语语义分类体系能够并且已经应用到实际的自然语言理解和处理系统中,如应用到机器翻译系统中去解决多义词的义项选择问题,应用到汉语语素义项的自动选择和标注工作中,应用到句法分析器中去解决语义指向、多义排歧的问题等。至于名词语义分类体系在本项研究中的应用,则主要是为了说明某个动词的某种宾语语义角色通常由哪一个或哪几个语义类别的名词充当,继而在确定了名词所属的语义类别后,判断出动词到底跟其后哪个名词发生语义上的动宾搭配关系。

但是,当我们把范围扩大到面向整个语言的词汇时,语义分类就会出现很多困难:许多概念难以分类,有些概念难以归类;分类难以找到统一的标准,因而难以避免交叉重叠现象。因为一个概念不是只跟一个概念发生关系,而是同时和许多其他概念发生关系,而且关系的类型是多种多样的,绝不是简单的一种上下位关系。这就是语义分类方法本身存在的难以克服的弱点或者说缺陷。国内对汉语语义分类体系的研究已有一些成果,但目前尚未有一个汉语分类体系完全令人满意。詹卫东(2000)指出,理想的分类需要满足排他性和完备性,但事实上,目前我们对语义的认识达不到这样的要求,即归入同一个语义类的词,总能找出它们在语义上的差别来,而归入不同语义类的词,也有可能找出它们在语义上的共性来;因此我们并不奢望能构造一个四平八稳的语义分类体系,而是力求所建立的语义分类框架线索明晰,这样在针对每个具体的实词操作时能更方便一些。我们赞同以上观点,建立的名词语义分类体系层次清晰分明,语义层次的深度和每一个层级的宽度都处于一个相对简单的水平,由此导致的不足我们期待在语义特征的提取阶段得到解决。

(二)本文的名词语义分类体系

由于语义分类体系制定者的社会经历、文化修养、知识结构、思想方法以及所处的历史、社会背景存在差异,所从事的职业和研究工作不同,制定语义体系的应用范围和目的不同,因而所建立的语义体系也会不尽相同,分类和归类都会打上个人的印记。我们不好笼统地评价孰优孰劣,而应以该语义体系解决目标问题的效能作为评判标准。如果一个语义分类体系能够很好地解决问题,达到我们事先设定的研究目标,那就是一个好的、合适的、实用的分类体系,反之则不然。因此,本文建立的名词语义分类体系如果能大致说明动词的某种宾语语义角色由哪一类或哪几类名词充当,就算是成功了。

我们将参照北京大学计算语言学研究所和中科院计算技术研究所联合研制《现代汉语语义词典》时建立的汉语实词语义分类体系,借鉴和参考梅家驹等编著的《同义词词林》中的词语分类系统,建立一个层次性、针对性和目的性较强的实用的名词语义分类体系。这个名词语义分类体系的顶层和《现代汉语语义词典》一样,分为具体事物、抽象事物、时间和空间四类,下位层次则有所变动和调整,每类给出若干词语实例。

纵观这个名词语义分类体系,最大的特点便是层次清晰:顶层分为四个大类,第二层分为25个小类,小类下面必要时又再细分。我们之所以建立这样一个名词语义分类体系,主要是为了描述动宾语义搭配框架的方便,即可以在词(动词)对类(名词语义类)的概括水平上描述搭配。如果能够达到这一目的,就说明我们建立的这个语义分类体系合理有效。正如詹卫东(2003)所说,“如果这种看法是对的,实际上有助于我们树立一个语义知识体系的‘实用主义’评价观,即一个‘语义知识体系’的好坏,根本上应该取决于它在某个应用领域中是否够用、好用。”但是,我们也应该看到,给一种语言中的所有名词进行语义分类并不是一件容易的事,不仅类与类之间会出现交叉的现象,而且有些名词实在无法确定应该归属哪一类。如“工人”是一种职业,同时也可以看作是一种身份;“春季”既可以归入“气象性时间”,也可以属于“序化时间”,因为春夏秋冬四季是顺序轮换的;像“制度”这样的词语到底应该属于社会领域还是政治领域,因为社会和政治本身就是息息相关的;还有“规章、协议、合同、条文”等究竟是归入法规类还是创作物类,也有待商榷。类似情况不胜枚举,而且在建立汉语名词语义分类体系的过程中,我们发现最难的是给抽象事物分类,因为抽象事物既看不见,又摸不着,经常会出现模棱两可的情况——似乎可以归入这一类,又似乎应该归入另一类。而如果我们分出来的语义类别太细,语义分类体系过于庞杂,不仅会影响整个语义分类体系宽度和深度的正常比例,同时也会增加人工标注训练集的难度,降低计算机处理语料的效率。这也就是我们为什么在必要的时候宁愿后附语义特征的原因了。还有两点必须强调。(1)语义分类应该以名词的义项为单位,因为同一个词的不同义项可能分属不同的语义类别。如名词“咖啡”有三个义项:①常绿小乔木或灌木,叶子长卵形,先端尖,花白色,有香味,结浆果,深红色……;②咖啡种子制成的粉末;③用咖啡种子的粉末制成的饮料。第一个义项和后两个义项就分别属于不同的名词语义类别,义项①属于1Ac1“树”类,义项②③则属于1Bb9B“饮品”。(2)本文的名词语义分类体系十分注重词语之间的上下义关系,如果上位名词能够跟某个动词产生动宾语义搭配关系,该名词的下位名词也都能跟这个动词产生动宾语义搭配关系。如“参加”一词的第二个义项,后接目的宾语,可由组织类名词充当,组织的下位词语“社团、基金会、爱护动物协会”等也都可做“参加”的目的宾语。

三、语义特征

本文给名词进行语义分类的主要目的是为了详细描述动宾语义搭配框架,考察动词在语义上能跟哪一类或几类名词搭配;而语义分类的颗粒度较大,只能反映词语最基本的语义信息,所以,对某些动词所搭配的名词宾语必须附加语义特征描述作为补充。这也就是说,名词的语义分类体系必须和名词的语义特征描述相结合才能更好地发挥其在动宾语义搭配框架描述中的作用。比如我们要描述动词“吹”第二个义项“吹气演奏”的动宾语义搭配框架,仅仅在语义分类体系层面说明跟“吹”这个义项搭配的名词语义类别是“乐器”类还不够,必须附加[+管乐器]语义特征。换个角度来看,在描述动宾语义搭配框架的过程中,名词语义分类体系和语义特征描写的作用实际上是殊途同归的。如果名词的语义分类体系够细,以至于类与类的词语之间足以反映语义特征的细微差别,那么提取语义特征的工作将显得多余。还是拿动词“吹”的第二个义项来说,如果在名词的语义分类体系中,在乐器类下面再分出管乐器、弦乐器等小类;我们直接在名词的语义分类体系层面就可以比较准确地描述出跟“吹”的这一义项搭配的名词,其语义类别应该属于管乐器类,而不再需要附加语义特征了。因此,林杏光在《中文信息界的语言研究谭要》中说,“多数学者主张将语义分类和语义特征描述这两种方法结合起来,以语义分类为主,用语义特征的描写来补充分类体系的不足。”

本文在描述动宾语义搭配框架的过程中,如果语义角色和语义类别尚不足以说清楚动词所搭配宾语的情况,就添加名词宾语的语义特征作为补充。当然,如果通过前两种框架描述要素就能说清楚,则不必添加语义特征,以免框架出现冗余成分。例如,动词“喝”可带工具宾语,如“喝大杯”;光说工具宾语应该是日常用具类还不够,必须添加器皿这一语义特征。再比如“治疗”可带受事宾语,我们除了要说明宾语所属的语义类别应该是生理以外,还要附加上疾病的语义特征。相反的,如果要描述动词“观察”的动宾语义搭配框架,只需要说明它能带对象宾语,且宾语的语义类别属于事性即可,而不再需要补充语义特征。

然而,语义特征和语义特征分析法都具有一定程度的主观性,因为语义本身就具有相当程度的抽象性和模糊性,再加上语义特征的提取往往因人而异,在操作上缺乏客观统一的标准和科学程序;此外,语言系统的开放性也决定了语义特征数量众多,性质复杂,在实践中根本不可能做到穷尽性描写,因此在研究工作中只能针对特定目的提取出我们所需要的语义特征。那么,采用什么方法才能提取到研究所需的语义特征呢?

本文提取语义特征的目的是为了在描述动宾语义搭配框架时弥补名词语义分类体系的不足,因此当我们的名词语义分类体系已经足以描述动词的宾语搭配能力时,就不需要用到语义特征了,以免描述框架出现冗余信息。反之,我们就运用对立比较法来提取所需的语义特征——以某个动词为考察对象,在它后面填入不同的名词作宾语,结果会出现有的动宾搭配能成立、有些不能成立的情况,比较能成立的动宾搭配中的名词和不能成立的搭配中的名词,看它们在语义上存在哪些不同或对立,借以提取出语义特征。还是拿“躲避”这个动词来说,我们要知道跟它搭配的名词宾语具备什么语义特征,可以先进行如下操作:

(做不光彩的事情时,小三会)躲避熟人——3躲避好人

躲避债务——3躲避荣誉

躲避大风——3躲避空气

通过对比进入“躲避+宾语”这个框架的名词,我们发现之所以会出现左边结构成立、右边结构不成立的情况,正是因为“熟人”、“债务”、“大风”和“好人”、“荣誉”、“空气”在语义上形成了鲜明的反差——前面三个名词都具有[-正面]的语义特征,后面三个名词的语义特征却是[+正面]。

本文介绍了描述动宾语义搭配框架的三大要素,在此基础上,我们就可以为每个动词逐一建立起动宾语义搭配的框架,为建设大规模的电子语义词典奠定了基础,也为自动句法分析和下一步的语义分析铺平了道路。

[1]丁声树,等.现代汉语语法讲话[M].北京:商务印书馆,2002. [2]赵元任.汉语口语语法[M].北京:商务印书馆,1979.

[3]邢福义.汉语里宾语代入现象之观察[J].世界汉语教学,1991 (2).

[4]詹卫东.基于配价的汉语语义词典[J].语言文字应用,2000(1).

[5]詹卫东.面向自然语言处理的大规模语义知识库研究述要[A].中文信息处理若干重要问题[C].北京:科学出版社,2003.

[6]孟琮,等.汉语动词用法词典[M].北京:商务印书馆,2000.

[7]梅家驹.同义词词林[M].上海:上海辞书出版社,1983.

[8]林杏光,等.现代汉语动词大词典[M].北京:北京语言学院出版社,1994.

[9]林杏光.中文信息界的语义研究谭要[J].语言文字应用,1998 (3).

责任编辑 韩玺吾 E2mail:shekeban@163.com

book=162,ebook=162

H146.3

A

1673-1395(2010)01-0046-04

2009210223

李琼(1979—),女,湖北荆州人,讲师,博士,主要从事对外汉语教学与中文信息处理研究。

猜你喜欢

动宾义项宾语
连词that引导的宾语从句
宾语从句及练习
试论对外汉语教学中动宾式离合词的教学
中考试题中的宾语从句
两用成语中的冷义项
“救火”带标记动宾对象式结构语用认知分析
动宾结构中动词虚化的认知阐释
谁来管管“吃”的宾语?
Enhanced Precision
现代汉语“动宾式动词+宾语”的搭配规律研究*