APP下载

面向计算的现代汉语双音词分离及其语法意义与特性研究

2015-04-21薛宏武

中文信息学报 2015年3期
关键词:分离式句法现代汉语

薛宏武

(重庆师范大学文学院,重庆 401331)



面向计算的现代汉语双音词分离及其语法意义与特性研究

薛宏武

(重庆师范大学文学院,重庆 401331)

汉语缺乏严格的形态束缚,在句子里双音词经常由于嵌入相关句法成分而呈现出分离。为了提高自然语言处理中语段分词、词性标注及基于规则的句子语义计算的准确性与有效度等,文章系统考察了现代汉语里典型词与离合词的分离现象,挖掘并刻画出它们各自形成的语法动因、条件、意义以及分离而成的成分的语法特性等,从而对现代汉语中双音词的分离做出了系统多层级的理论思考。文章指出典型词的分离是语用作用的结果,分离结构的意义是主观的;而离合词分离是句法语义作用的产物,意义是客观的。

面向计算;双音词;分离;语法意义与特性;现代汉语

1 引言

汉语缺乏印欧语那样的严格形态束缚,数量占优势的双音词(形式简称为m1m2,m表示语素)经常在句子里由于嵌入相关句法成分而被动态分离,从而呈现出复杂多样的形式变化(变形)与语法单位级别的变化(变性)。这是本体研究与应用研究都必须面对的重要课题。其中有两个密切相关的根本问题表现得更为突出: 一是定性与定量,前者是确定分离后m1与m2的语法身份,包括是否为语法单位、有何语法性质及其句法身份;后者指m1与m2若是作为句法成分的语法单位,那么在句中还涉及到对其计数——即算几个。二是指双音词分离前后,其语法意义或功能有何不同。

目前双音词分离的本体研究,可概括为事实上的不周延及止于外延上的“例”“类”刻画(token & type),表现为将可分离的双音词局限于离合词上(Separable word,下文简称SW),然后分类刻画其组配模式、嵌入成分的类特征、m的类特征及其语法活动的特征等。事实上离合词仅是词与短语之间的一个连续范畴(continuous category)。离合词是不典型的词,因此,离开了对典型双音词(Prototype word,下文简称PW)的分离考察,研究是有缺失的。

计算机语义识别的起点是能对语段做出连续一致的词语切分与词性标注。目前这两方面在效度与准确度上是有问题的。典型的事实表现之一,就是对自由文体(free style)中双音词分离后的m1与m2的处理。由于对双音词分离缺乏一个系统的理论认识,因此在对双音词分离的语段进行词语切分与词性标注时,现有的各种操作是不相一致的。而这又会直接影响到基于规则的句子语义理解。

本文拟从动、静两个语法层级,通过真实文本语料去系统考察PW与SW因嵌入词语而出现分离的动因、条件、m1与m2的语法特征及意义等。以期为中文信息处理中的词语切分、标注及基于规则的句子语义理解作出应有的理论支持。为表达方便与集中,把嵌入成分码化为(x)、y,小括号是选择性(optional)符号,下文亦如此。三音节之上的PW与SW分离,可以根据本文的思路类推。

2 PW的分离形式与意义

在语言活动中不同性质与不同组配模式的PW,常常被嵌入相关句法成分产生动态分离。下面将其语法表达式形式化为式(1)。

D{λ[x、y](m1m2)}→(x)m1ym2

(1)

含义是(x)m1ym2形成的充分条件是λ[x、y]代入m1m2要得到D准允(licensing)。D指动态性(dynamic)语用因素。这种在D作用下,m1m2由于嵌入相关词语而在句子里出现的变形或变性及其所产生的语法意义,是语用组形[1]。在此称之为语用构形(pragmatical configuration)。

2.1 合成词分离

2.1.1 名词分离

请观察:

例1 老葛头说,一块儿当兵的,和我有点表亲关系。(《荒草青青》)

“老葛头”可分析为“葛”嵌入“老头”中形成的定中结构,“葛”是定语,“老头”是中心语;也可分析为“老”前加于“葛头”上,“老”是定语,“葛头”是中心语。着眼于汉语句法系统,只能作前者分析,因为“葛头”在普通话中是不成单位的。*汉语有“葛头”等“姓+头”说法,但语义指姓葛的小头目或小领导,与本文讨论对象不是严格的同一。请观察:

例2 a.北京南路 b.演两个小时戏 c.这么大点儿 d.教他英语

例2的四短语分别由“南”“两个小时”“大”“他”嵌入m1m2形成。其中a是“南”嵌入“北京路”形成的定中短语,“老葛头”与之同一。尽管b、c、d的m1m2与“老头”性质不同,语法级别也不同——是短语与词的差异,但都是通过嵌入手段形成的。b是“演戏”嵌入“两个小时”的扩展式,d是“教英语”嵌入“他”形成的动宾短语扩展式;而c是中心语“大”嵌入其状语“这么点儿”形成的[2]。

例1“老葛头”较之“葛老头”,表达了人际感情上的可爱与亲切等意义。例2a的意义主要是韵律,“北京南路”比“南北京路”要顺口。至于例2b、c与d,是句法语义表达的需求。这方面可参考3.1节的论述。再如:

例3 他的开蒙老师常说: “艺术”“艺术”,有艺还得有术。(《当代野人》)

例3做宾语的小句主语“艺术”是反复强调式,为了保持句子前轻后重的信息分布规则,谓语对其进行了分离,形成并列动词结构“有艺还得有术”,不仅实现了对主语“艺术”的语义强调与评注,而且也维系了句子平衡。

2.1.2 形容词分离

例4 现在看来你不但认了真了,而且认真得一塌又糊涂。(《笑傲江湖》)

形容词“认真”中嵌入“了”变为动宾短语,强调“认”之对象“真”。其形式标记是不能像“认真”一样再带补足语(complement)说成“认了真了得一塌糊涂”而只可说“认真得一塌糊涂”。同样“一塌又糊涂”是强调“一塌糊涂”的消极状态的,句法上“一塌”与“糊涂”做“认真”的合成补足语,语义与语法功能相当于两个“一塌糊涂”。

2.1.3 动词的分离

例5 出路还在改革,非改革不可……真正依靠工人阶级来改,来革。(《人间正道》)

例6 从这二人转开始,他这个小女婿就当上了,后老悔了。(《父亲情深母亲意浓》)

例5的“来改,来革”是“改革”中嵌入停顿(书面逗号)与“来”形成的分离式。句法上分离式构成的句子是个并列复句,语义功能上两个小句都相当于“改革”。分离式的意义是强调说话人对“改革”的意向与信念。例6的“后悔”分离为“后老悔”,已由状中结构的词变成了述宾短语,方位名词“后”在现代汉语里也只能被重新理解(reinterpretate)为动词,如可带体成分“了”“过”(aspectual constituents)说成“后了/过悔”。分离的目的也是强调“悔”的程度之深。

2.2 单纯词分离

双音节的单纯词也可分离,像例3~6一样,分离也必得在句中进行。分离而成的两音节是句子的两个句法成分,意义同样还是表达强调。例如:

例7 误解是: 以为把人逗笑的东西就是幽默,而其实它既不幽也不默。(《人生圆桌》)

“既不幽也不默”做“它”的合成谓语,强调“幽默”(humor)的性质量。“幽”与“默”均是其不可或缺的音节,二者语义语法上都相当于形容词“幽默”。

2.3 派生词分离

一位难眠的妻子听到一点响动,推醒了酣睡的丈夫后有这样一个对话:

例8 a. 好像有老鼠,你看看去。

b. 老什么鼠!快睡吧。

派生词“老鼠”中嵌入责问否定等功能的“什么”被分离为“老什么鼠”,表达了丈夫强烈的不耐烦情绪等,将b与其变换式b1做一比较就会看到这一点:

例8 b1.老鼠什么!快睡吧。

显然b1与b的真值(truth-condition)相等,但没b的情感色彩强。需指出的是b的“老”已不是词缀,而是“老鼠”的自反性提及用法(mention of reflexivity)。即已经变性且升级为动词了,因为例8b句义相当于“别说或提什么老鼠”。即“老”的功能是提及对象“老鼠”;“鼠”则是“使用”(use),是“老”的宾语。因此例8b的句义形式应是或者说深层句义(deep-structure)是:

例8 b2.[老鼠什么老鼠]

不过b2在表征(represent & project)为b时,将前一个“老鼠”之“老”保留而删去了“鼠”,后一个相反。这种表征方式是“老鼠”双音节性造成的,这可从单音词“提及”用法得到说明。如例9b:

例9 a. 爸爸,我的书呢? b. 书什么书?就像你是个学习的。

“书”是单音词,在例9b不管是作为提及用法的第一个“书”还是作为用法的第二个“书”,都只能采取一个形式。可见,例8b在提及上用“老”而用法上用“鼠”,这是为了表达简要经济而按照二者在词中的语素序位次第缺省(ellipse & omit)音节形成的。综合起来看,例8b的“老什么鼠”是述宾性结构,“老”与“鼠”相当于两个词。

总之PW由m1m2分离为(x)m1ym2,造成的变形与变性可概括为扭曲(screw),包括长度、内部的结构或性质等,动因是D。λ[x、y]使得m1m2由概念表达变为(x)m1ym2上的人际表达(interpersonal expression),即表达语用意义。这是像似原则(iconic coding principles)的生动体现: 语言实体若代表的是不寻常独特的事物,那么其语法形式的编码相应的就要复杂与多维度(complex and multidimensional)[3]。

3 SW分离及其与PW分离的不同

3.1 SW分离的动因、条件、意义与句法特征

例10 洗澡→a.洗一次澡∣b.洗十分钟澡∣c.洗热水澡

在静态语法环境“洗澡”就可分离,不仅前后性质不变,而且“洗”与“澡”的结构关系也不变,只是由词升级为短语。嵌入成分语义或指向“洗”,如a与b;或修饰“澡”,如c。真值义上“洗一次/十分钟/热水澡≠洗澡”,即“洗澡”的三个分离体都表达概念。总的看,“洗澡”的嵌入分离成分在句法语义上是必有的(obligatory)。换言之,SW分离动因有两种情况: 一是语义表达需要,如“洗热水澡”较“洗澡”的外延小。二是句法机制调控,理论上“洗澡”在与“一次/十分钟/热水”的组配时存在嵌合与拼合两种句法模式,例如,

例10′ a. 洗一次澡 ∣*洗澡一次 b. 洗十分钟澡 ∣*洗澡十分钟 c. 洗热水澡 ∣*洗澡热水

语义上“一次”“十分钟”是计算动作或行为的“量”的,本身又有陈述性(可直接做谓语),与“洗”的概念联系是天然的,且性质相近,所以它们自然紧邻而且成为一个句法组块儿,是个有效(well-formed)组配。静态环境中带星号的拼合式是不可受的,是违反了共同命运原则(proximity iconicity)[3]。可见“洗澡”分离动因就是句法语义表达的需要。在句子里进一步观察,会看到“澡”还能进行句法活动。不仅可话题化(topicalization),甚至在语境充分下可以把“澡”缺省掉。例如,

例11 一个月他也不洗一次澡。 →a.澡,他一个月也不洗一次。 →b.一个月,他连一次澡也不洗。 →c.他一个月也不洗一次。 →d.一个月,他连一次也不洗。

基于本节分析,把SW分离动因与条件的表达式形式化为如下式(2)。G/S表示句法与语义箭头方向表示话题化或移位,括号内的m2表示可缺省。

↓ |

G/S{λ[x、y](m1m2)} →____(x)m1y(m2)

(2)

3.2 PW分离条件、动因、语法表现及其意义

PW与SW分离上存在着诸多不同,主要表现有以下四点。

1. PW分离必须得在句子里(sentence)进行,静态层级上不能成立。例如,

例12 a.*认了真 |b.*一塌又糊涂 |c.*来改来革 d.*既不幽也不默|e.*老什么鼠 |f.*后老悔

短语a能说,不过已经是个支配性的动词结构,语义语法功能不同于“认真”。而b—e静态层面都不成立。f可说,但其结构、性质及语义已经也不同于“后悔”。顺及指出,2.1.1节“老葛头”能说,是它在现代汉语已经词汇化了(lexicalized)。例3的“有艺还得有术”也可说,但“艺”与“术”所指之和是不等于“艺术”的。而SW在词与句之上都可以分离,如例10、11所示。

2. PW分离后m1与m2在句子里的位置固着(bound),没有语法活动能力。如且不管例4的“认了真”相对于“认真”所发生的结构与性质变化,就“真”而言,是绝不能话题化的,只能固着在“认”后。而SW分离后没有这样的限制,如例10、11所示。

例4′ *现在看来,真你不但认了,而且认真得一塌又糊涂。

3. PW的分离结构(x)m1ym2中,各成分的语法特性也与SW的不同,主要体现为:

(1) x与y的句法特性。与SW((x)m1ym2)比,PW的x或y羡余(redundancy)。把2.1节各例句的x与y删去,典型PW的分离式所在的句子的真值义及其结构都不变。比较例5及其变换式例5′。

例5′出路还在改革,非改革不可……真正依靠工人阶级改革。

它与例5的真值相同。结构上例5的谓语中心是联合动词短语[真正[依靠工人阶级[来改,来革]]];而例5′的是词[真正[依靠工人阶级[改革]]]。二者都是状中式谓语。当然有的嵌入成分羡余性不强,如例6的“老”,是“后悔”倾向SW。

(2) PW分离式的m1与m2的语法特性极不匀质(homogen eous)。静态地看,有的是无义的音节,如“一塌”“幽”“默”等;有的是词缀,如“老鼠”之“老”;有的是不成词语素,如“革”“术”。它们都不能做句法成分。有的是自由成词语素,能做句法成分,但所指或功能都要产生一定的变化: 如“艺”所指与“艺术”不等值,“后老悔”之“后”“悔”的功能不同于“后悔”之中的。它们都可视作动态言语成分,具有超语法单位(super-grammar units)的特性。意义上或m1=m1m2或m2=m1m2,或m1与m2同时等于m1m2句;句法上m1∧m2。即PW动态分离出的m1与m2,语义或语法功能增殖、变性了。

(3) PW的分离成分m1与m2在作为动态句法成分使用时,得同时满足下列两个方面的句法条件,而SW分离成分则不受此条件约束(bind)。

首先,一般有先行句做铺垫且先行句有m1m2,否则,孤立的“(x)m1ym2”可受性都有问题。把例7与例7′做一比较就会看到,如:

例7′*逗笑人的东西既不幽也不默。

语感上例7′ 突兀不自然。例7有先行句“误解是: 以为把人逗笑的东西就是幽默”做铺垫,且“幽默”分布其中,所以“既不幽也不默”小句不仅可受而且还有“幽默”不具有的强调效果。再如把例8的“老什么鼠”句孤立出来,简直是不知所云。值得指出的是例4与例6,“认真”分离为“认了真”时,是没有含有“认真”的先行句做铺垫,这是由“认真”的特征决定的。PW与SW是连续的(continuous),“认真”就处在连续环节上,倾向SW。例6的“后悔”虽不及它倾向SW,但也具有SW的特征。

其次,m1与m2在句中必须彼此照应,且其位序要与它们在PW中的语素位平行。“照应”是指m1与m2必须是彼此紧邻且呼应。如例4′的“真”被置于句首,离“认”太远,缺乏紧邻呼应,故不可受。同样m1离开了m2或者是m2离开了m1,句子可受性都会有问题的,即是二者缺一不可的。例如,

例6′*从这二人转开始,他这个小女婿就当上了,老悔了。

例8′ a. 好像有老鼠,你看看去。 b.*什么鼠!睡吧。

例6′的“老悔”语义上与“后老悔”相当,但二者毕竟不是等值的: 前者的语法中心是“悔”,后者的中心是“后”。例8′的“什么鼠”语义表示“鼠”的类别,不同于“老什么鼠”。

分离形成的m1、m2的“位序要与PW的语素位平行”,是指m1与m2作为句法成分时是不能易位的,一般得与它们在词内时的序位平行一致,如例4的“一塌又糊涂”语感上不宜说成“糊涂又一塌”。

4. PW分离式是主观化的,而SW是真值性的。这体现在PW分离式的形成必需得到句法环境中D的准允。D具体说就是情态(modality),包括认识(epistemic)、道义(denotic)与动力(dynamic)三类。

认识情态是说话人对行为(action)、事件(event)或事态(affair-state)等的确定性所持的信念状况(status attitude)。比如例4的“看来”,例5的“真正”,例6的“了”(即“了2”)*萧国政(1999)从静态句法出发将“了”析离为八种意义,其“强调、偏离、委婉”本质上就是“了2”的认识情态的三方面表现。薛宏武(2012)也认为“了2”有语用软化功能,是认识情态词。,例7的“以为……就是”与“其实”,例8的“什么”。道义情态是说话人按照某种道义责任,实施或制止某种行为;或者就某事件、行为与事态提出自己道义或责任等方面的看法,如例3的“得”,例5的“非……不可”。动力情态是体现与说话人能力、意愿等相关的行为、事态。行为与事态一般是在说话人主观干预与动力施加基础上进行的,如例5的“要”与“来”,分别是体现说话人意愿与指向说话人行为去向的;例8的语气词“吧”的作用是缓解祈愿口气的等,而“什么”则是否定说话人提及的“老鼠”这一行为本身的,语法功能相对于意愿否定词“别”“不”“甭”。

说话人的情绪、意向、态度等情感是体现语句主观性的重要方面[4]。若说话人说出一段话的同时,表明自己立场、态度和感情便是主观性表达,而为了表达主观性而采取的相应结构形式便是主观化(subjectivization)[5]。由此看来,PW分离式“(x)m1ym2”是主观化结构,体现在: 一是它与情态成分是互动的,不仅“(x)m1ym2”的形成要有情态成分,并且它的出现也一定要有情态成分;二是“(x)m1ym2”及其主观意义在汉语表现得相当广泛与突出,如例3的“有艺还得有术”就是对“艺术”的评注与态度;例4的“认了真”就是说话人对“你”的“认真”的看法及对之给予的委婉的定性评论。

那么,PW分离式的主观义形成机制是什么呢?请观察并比较例5的四个小句。

例5出路还在改革i,非改革i不可……真正依靠工人阶级来改ji,来革ki。

第一个小句(clause)对“改革”的强调是通过自然重音与词汇标记实现的: 一方面“改革”是自然焦点,具有[+突出];另一方面又通过“在”的时空定向功能对其焦点身份进行了标记。即该小句的强调义是通过“改革”的双重焦点身份获得的。第二句的强调义是由“改革”的自然焦点身份与道义情态词语“非……不可”的词汇义加合产生的。第三、四小句则并列起来强调“改革”。这两个小句的谓语中心正是由“改革”的两个分离成分充当的,当然这种表达方式是极其依赖两个先行句里“改革”的提示(index),表示为i=ij+ik。唯此,才能明确识解(construe)这两个并列小句的语义与语法功能。基于此,再加上指向说话人行为取向的“来”所具有的意向义、“改”与“革”自然焦点的[+突出]特征以及二者并列带来的语义增殖,才可得出“来改,来革”的完整意义。由此推理,例5的“信息峰”(information peak)就是由“改革”分离而成的两个并列小句“来改,来革”。

“来改,来革”是说话人为了强调对“改革”行为持有的坚定意向而有意将之分离的,其主观义的形成不仅包括如上所述的句法运算,还有一定的语用推理,因为该意义的形成离不开两个先行小句的提示,即有语境因素在内。正因为如此,它才具有两个先行小句所不具有的表达力——主观性。再如例7,“幽”与“默”原本不能在句子里成形与成活的,但它是构成先行句焦点的两个音节,在其提示下,受话人(addressee)才能够把“幽”与“默”同时识解为“幽默”。也正是以此为前提,受话人才能推导出它的意义。这也就解释了PW分离式作为动态言语单位的m1与m2在做句法成分时,必须具有两个条件的内在因素。

4 双音词分离的规则、词切分与标注

基于第2、3节的系统考察,可把PW分离的表达式及其规则系统刻画如下:

Sa.__PW__,……,S。__(x)m1(,)__ym2……

下标Sa是先行句(antecedent clause),S是PW分离形成的句子。空白线表示其上可分布的句法成分,省略符表示可出现的小句。

(1) PW分离一般得有先行句做信息铺垫,且先行句通常要有PW。它是PW分离的语境提示;

(2) PW分离后的音节都是独立的句法成分,且都是动态言语词;性质上,得结合PW及其m1、m2特性进行辨析;

(3) 分离式所在的句子得有情态成分D。D是封闭的系统,包括有认识、物力与道义类词语,祈使及否定句类;

(4) m1与m2做句法成分,序位要跟其词内序位平行一致,并且它们在句内不能移位与缺省。它们是动态言语成分,语义语法功能都等值于PW;

(5) 嵌入成分x与y在真值上是羡余的。

基于这个规则系统,就可对含有PW分离式的语段进行分词并给予其定量、定性标注。当然这跟对规范文本中的规范句子在技术处理上有点不同。例如(只标注讨论对象),

例4现在看来你不但认v了真n了,而且认真得一塌a又糊涂a。

例5非改革(i+j)不可……真正依靠工人阶级来改(i+j)/v,来革(i+j)/v。

例6从这二人转开始,他这个小女婿就当上了,后v老悔n了。

例7以为把人逗笑的东西就是幽默(i+j),而其实它既不幽(i+j)/a也不默(i+j)/a。

例8a.好像有老鼠(i+j),你看看去。 b.老(i+j)/v什么鼠(i+j)/n!快睡吧。

例9a. 爸爸,我的书呢? b. 书v什么书n,就像你是个学习的。

以例4为例,“认真”分离后是两个词,“一塌糊涂”分离后也是两个词。“认”与“真”分别是动词(v)、名词(n);“一塌”在现代汉语只能依据“糊涂”“一塌糊涂”确定为形容词(a)。

SW分离无需PW的五方面规则。只要句法语义上需要,就可进行分离为短语。因此对其进行切分、标注跟对规范句子的处理一致,例如,

例11 一个月他也不洗v一次澡n。 a. 澡n,他一个月也不洗v一次。 b.一个月,他连一次澡n也不洗v。

不管SW还是PW,分离后都短语,只不过PW分离成的短语是动态言语性的。因此对SW、PW进行词语切分是可统一起来的。当然在标注m1、m2性质的依据上不同,SW的m1、m2与其语素性质一致;而PW标注得遵循规则(2)。

5 结语

词语分离不仅是本体语法研究关注的重要现象,更是中文信息处理中词语切分、词性标注以及基于规则的句义计算等无法回避的加工对象。本文结论是,任何音节上≥2的实词语都可在句子里分离,根据动因、条件与意义的不同可分为SW与PW两个类。二者的不同,表现为(x)y、m1、m2的语法特性、句法活动及分离语法意义等方面。采取标记理论概括,SW分离是无标记的句法现象,语义是客观的;PW分离是有标记的语用现象,它在一定程度上是体现汉语语法特性的主观化结构,语义是主观的。本文说明,根植于印欧语的理论与方法至少在处理汉语词语分离的事实上存在着不足,如表达主观义,印欧语在句法上一般按照合乎语法的硬规则去表征,类似汉语的PW分离是不可思议的。究其原因,是印欧语语法单位及其句法活动受着严格的形态束缚,可分离的对象与句位表达极其有限。汉语没有印欧语那样僵死的形态束缚,易于对语法单位发挥作用而使之分离,从而造成其灵活多变的句法表现以及不同“层”“级”上的语法意义。

从本文推论开来,m1m2式的虚词也可做PW分离。如语感上最起码可以提取出“m1什么m2”式,如“所什么以,随什么着,凭什么借”等。当然x与y在类聚个体上有限。

[1] 薛宏武.现代汉语语用组形研究[R].上海: 复旦大学中文系,2009.

[2] 萧国政.汉语语法研究论[M].武汉:华中师范大学出版社, 2001:160-161.

[3] Givón T. Syntax: A Functional typological Introduction [M](vol. II ). Amsterdam/Philadelphia: John Benjamin Publishing Company,1990:968-970.

[4] Finegan E. Subjectivity and Subjectivisation: an Introduction[A]. Subjectivity and Subjectivisation[C], Edited by Dieter Stein and Susan Wright. Cambridge:Cambridge University Press, 1995.

[5] Lyons J. Semantic[M]. Cambridge: Cambridge University Press, 1977:739.

[6] 萧国政.现代汉语句末“了”的意义的析离[C],陆俭明.面临新世纪挑战的现代汉语语法研究. 济南: 山东教育出版社,1999.

[7] 薛宏武.“有着”语义语法功能的形成及其“着”的问题[J].汉语学习,2012,(5):62-72.

A Grammatical Analysis of Disyllable Word Split in Modern Mandarin: A Computational Linguistic Perspective

XUE Hongwu

(College of Arts, Chongqing Normal University, Chongqing 401331, China)

With flexible morphological rules, Chinese is common to be observed for the disyllable word split by intserting some syntactical constituents of a sentence. To facilitate the word segmentation, part-of-speech tagging and semantic computing, the paper systematically discusses two types of the disyllable word split in Mandarin: one for the the Separable word, and the other is for the Prototype word. It examines describes the grammatical movitation of their formation, properties. and meanings, indicating that 1) the Prototype word split is caused by pragmatic factors, with subjective structures and grammatical meanings; yet 2) the Separable word split is caused by the syntactic and semantic expression, with objective structures and meanings.

oriented to computation; disyllable word; clefting; grammatical meanings and properties; Mandarin

薛宏武(1970—),博士,教授,主要研究领域为汉语句法学。E⁃mail:xuehongwu386@sina.com

1003-0077(2015)03-0021-06

2013-04-08 定稿日期: 2013-07-31

国家自然科学基金(61202193);中央专项配套资金青年人才培训与研究支持计划(WXY201F032);重庆师范大学基金(14XYY032)。

TP

A

猜你喜欢

分离式句法现代汉语
基于分离式热管构成的非能动安全壳冷却系统传热性能影响因素研究
浅谈热源厂封闭式煤库挡煤墙结构设计
述谓结构与英语句法配置
现代汉语位移终点标记“往”
“楞”“愣”关系及“楞”在现代汉语中的地位
山西省2019年专升本选拔考试 现代汉语
山西省2018年专升本选拔考试 现代汉语
句法二题
诗词联句句法梳理
荒漠戈壁地区高速公路交叉口类型适用性的分析与探究