APP下载

汉语篇章中零形式的识别与消解

2016-05-04武娟李茹王智强

中文信息学报 2016年3期
关键词:先行语料语义

武娟,李茹,2,王智强

(1. 山西大学 计算机与信息技术学院,山西 太原 030006;2. 山西大学 计算智能与中文信息处理教育部重点实验室,山西 太原 030006)

汉语篇章中零形式的识别与消解

武娟1,李茹1,2,王智强1

(1. 山西大学 计算机与信息技术学院,山西 太原 030006;2. 山西大学 计算智能与中文信息处理教育部重点实验室,山西 太原 030006)

传统的语义角色标注只能为句中显式表达的句法论元分配语义角色,但是忽略了一些隐式的语义成分,即零形式。该文基于汉语框架语义研究了零形式的识别及消解。在识别阶段,首先使用规则方法进行零形式检测,然后运用筛选过滤的策略去除部分错误识别的零形式;在消解阶段,将篇章中显式表达的框架元素填充项作为零形式的候选先行语,提出结合框架元素语义类型与框架关系的消解方法。在构建的164篇中文语料上进行实验,与其他方法相比,该方法能获得更好的结果。

汉语框架网;零形式识别;零形式消解

1 引言

语义角色标注是对句子中谓词所支配的句法成分标注语义角色,是对句子进行浅层语义分析的一种方法。但是,它只能为显式表达的句法论元分配语义角色,而忽略了一些未明确表达的论元,这种未明确表达的论元称为零形式(Null Instantiation,NI)。其中有一部分隐式角色能从篇章中推断出其先行语,而发现隐式语义角色并为其找到先行语有助于进一步理解篇章。

在汉语框架网(Chinese FrameNet)[1]中,这些缺失的语义角色被称为零形式框架元素[2],简称为零形式。按照缺失论元在语义理解上的不同解释类型,零形式被分为有定的零形式(Definite Null Instantiation,DNI)和无定的零形式(Indefinite Null Instantiation,INI)。INI是指缺省元素的自然类型或语义类型能够被理解,不需要找回或者建立一个特定的篇章所指。DNI是指缺失的角色一定是在篇章的上下文中已经被理解,并且在上下文中能找到对应的词语,如例1所示,目标词“发现”激起“发现”框架,该框架包含两个核心框架元素:Cognizer,Phenomenon,其中仅有Phenomenon被“太阳耀斑的数量明显增多,地球的平均气温也稳定上升”填充,而另一个核心框架元素并没有在本句中显式表达,但是可以推断出Cognizer是由前一句中的“科学家”所填充,即标记为DNI。

例1 [为了确定太阳对全球变暖的影响]Purpose,[科学家]Agent对太阳耀斑进行有意行为了[测量]Activity。

测量后发现发现,[太阳耀斑的数量明显增多,地球的平均气温也稳定上升]Phenomenon。[Cognizer DNI]

零形式的识别与消解问题可以形式化描述为: 给定篇章D={S1,S2,…,Sn},其中Sk(k∈[1,n])为语篇D的第k句。Sk中能激起框架的目标词集合为Tk={Tk1,Tk2,…,Tkp},Fk={Fk1,Fk2,…,Fkp}为对应的框架集合。对于某个框架Fki,其核心框架元素集合为Eki={e1,e2,…,em},而框架Fki在Sk中出现的核心框架元素集为Cki,其中Cki⊂Eki,则未被实现的核心框架元素集Eki-Cki即为缺失的核心框架元素集。因此,我们首先需要判断Eki-Cki集合中的元素是否属于零形式;然后确定已识别出的零形式em是否属于有定的零形式;最后为有定的零形式em在篇章中找到其对应的先行语dm。

本文基于框架语义,系统地完成了零形式的识别与消解任务,并为有定的零形式消解任务提出了基于框架元素语义类型和框架关系的消解方法。

2 相关工作

在针对英文的零形式消解研究方面,国际语言学会议ACL在2010年举办了关于“Linking Events and Their Participants in Discourse”的语义评测[3],要求参与者在已标注语义角色的语料上识别出有定的零形式并在上下文中找到其先行语,评测任务分别提供了FrameNet和PropBank两种全文标注的语料,但由于任务过于新颖且难度较大,只有两支参赛队伍提交了结果。

Tonelli等人[4]采用一个曾用于文本蕴涵识别的语义评测系统VENSES,得到与语义角色标注相对应的谓词论元结构,并根据目标词的词性(动词、名词)提出了不同的处理策略: 在测试语料中,若激起有定的零形式所属框架的目标词为动词,则在训练语料中查找与其相似的谓词论元结构,找到后与其对比得出缺失的论元,若未找到,则查找FrameNet中与该目标词同属一个框架的其他词元的谓词论元结构,最后,计算缺失元素与潜在填充项的相似度完成零形式的消解;而对于名词性目标词,根据VENSES分析得到的事件、时间、空间等信息,以及建立在ConceptNet2.0[5]上的意义推理模型,判断某词语是否可以作为DNI的填充项,最终达到的准确率和召回率分别为4.62%和0.86%。在后期的工作中,Tonelli等人[6]认为如果一个候选填充项的中心词在训练语料中多次被标记为框架元素,则该词作为DNI先行语的可能性越高。该工作基于这种思路计算了每个候选填充项与DNI的相关性得分,最终得到8%的F值。

另一支团队Chen等人[7]将此任务看成一种特殊的语义角色标注任务,选取前三句中的代词、名词、名词短语作为先行语候选词,统计FrameNet中相应框架的例句库以及训练语料中某候选词是否被显式标记为该语义角色,若没有,则系统计算候选填充项与缺失角色的分布相似性。尽管实验结果高于VENSES++,F值为5%,但数据稀疏仍然是潜在的限制因素。

雷章章等人[8]采用规则过滤与机器学习相结合的方法,在SemEval2010 task10的语料上实现了有定零形式的识别。Silberer等人[9]将该问题看作一个指代消解任务,将实体链作为候选填充项,结合语义角色标注和共指消解的特征,构建了有监督的机器学习模型,同时他们对语料进行了扩充,从而解决了数据稀疏的问题,最终获得7.1%的F值。Gorinski等人[10]运用SemEval2010 task10的语料,研究了四个不同类型的DNI语义解析器的性能,最终结果F值为12%。Wang等人[11]同样在该评测语料上,统计和规则相结合构建了一个规模最小覆盖范围最大的候选词集合,将有定的零形式缺位填充看成一个分类问题,在传统的特征上引入中心词信息和框架信息,使用最佳的特征组合最终得到了14.65%的F值。Laparra等人[12]总结研究了传统指代消解所使用的特征,并尝试着将其应用到零形式的消解任务中,最终F值达到18%。

Gerber等人[13]研究了在新闻专线文本中常出现的十个名词性目标词,运用NomBank/PropBank标注语料,结合句法、语义和语篇特征,采用实体指代的方法,得到了明显高于其他团队的结果,而这很可能是由于语料是基于限定谓词的,并且每个谓词包含有120条标注实例。

3 相关概念介绍

3.1 汉语框架网

汉语框架网(Chinese FrameNet,CFN)[14]是以Fillmore的框架语义学为理论基础[15],以加州大学伯克利分校的FrameNet[16]为参照,以汉语真实语料为依据的供计算机使用的汉语词汇语义知识库。CFN的分析单元是框架,“框架”(Frame)是与一些激活性语境相一致的结构化的范畴系统,是储存在人类认知经验中的图式化情境。激起框架的词元为目标词。在目标词激起一个框架的同时也激起了一个语义场景,场景中的事件及参与者被称为框架元素(Frame Element)。其中,框架元素又有核心与非核心之分。核心框架元素是一个框架在概念理解上的必有成分,它们在不同的框架中类型和数量不同,显示出框架的个性。非核心框架元素表达时间、空间、环境条件、原因、目的等外围语义成分。

3.2 零形式框架元素及其类型

并非所有的核心框架元素能同时被实现,有些框架的核心框架元素是互相排斥的,如例2、例3所示,目标词“像”和“酷似”都激起了“类似”框架,该框架包含四个核心框架元素Entity1、Entity2、Entities和Dimension,其中Entity1、Entity2都与Entities互相排斥,即形成了Excludes关系。同时,Entity1和Entity2构成了Requires关系,若Entity1在前,则Entity1出现时要求Entity2也出现,否则认为是论元缺失,但是Entity2出现的时候不一定要求Entity1也必须出现。

CoreSet关系描述的是其中一个或者多个核心框架元素需要显式表达,这种关系比较复杂,可能在某种情况下,其中的一个核心框架元素缺失时不认为是零形式,而对于另外一个则必须标记为零形式,这因框架的不同而不相同,如例4所示,“知道”激起的“知道”框架,包含三个核心框架元素Cognizer、Content、Topic,其中表达相似语义内容的元素Content和Topic具有CoreSet关系,因此,Content的显式出现使得Topic的缺失不被标记为零形式。

例2 [我们的经济]Entity1就像类似[一棵经过长期干旱后的健康植物]Entity2。[DimensionINI]

例3 [兄弟二人相貌]Entities酷似类似。[DimensionINI]

例4 [根据经验]Evidence,[我]Cognizer知道知道[他会迟到]Content。

另外,如例2、例3所示,实体有相似点的方面Dimension没有明确表达,但能够被理解,这种情况被标记为INI。

3.3 框架之间的关系

框架关系是指语义场景之间的关系,FrameNet详细定义了继承、使用、总分、透视、先后、因果、起始和参照这八种框架关系,通过定义这些框架之间的关系形成了框架的网状结构。以继承关系来说,它使得一个比较普通的框架具体化为一个比较特定的框架。并且它们的框架元素之间也具有相应的关系,每个继承来的框架元素包含了被继承框架元素的所有语义特点,也可能增加其他的特点,例如,“付款”框架,继承自“给予”框架,其中,“付款”的框架元素“买方(Buyer)”继承于“给予.捐赠者(Donor)”,“卖方(Seller)”继承于“给予.接受者(Recipient)”,“货币(Seller)”继承于“给予.转移体(Theme)”等。

这些框架之间以及框架元素之间的关系是本文进行有定的零形式消解的一个重要依据。

4 零形式的识别与消解建模

零形式的识别与消解研究目的是找出篇章中的隐式角色及其先行语,从而有助于篇章理解,本文将该任务分为零形式的识别、零形式的分类和有定的零形式消解三个子任务,并根据各子任务的不同分别建模。

4.1 零形式的识别

缺失的核心框架元素并不一定就是零形式,而核心框架元素之间存在着3.2节中所介绍的三种关系CoreSet、Excludes和Requires,只有充分考虑了这些关系才能够判断缺失的核心框架元素是否属于零形式。

对于该任务,本文根据零形式的多样性特点进行了两级识别。

1) 首先,本文基于文献[8]提出的检测规则进行零形式的识别,其中,对于具有CoreSet关系的核心框架元素,只要其中一个框架元素在句中显式出现,则其他核心框架元素的缺失不被标记为零形式。但是,若CoreSet关系中的核心框架元素在句中都未显示表达,则将它们都标记为零形式,这样可能就会引入一些错误识别的零形式。

2) 本文在第一级识别的基础上进行了第二级识别,即统计每个词元在训练语料中的框架语义角色标注模式*框架语义角色标注模式是指标注的框架元素,其中也包括被标记为零形式的框架元素。,对上一步检测到的零形式进行筛选。以词元“发射”为例,表1则是其从训练语料中抽取的框架标注模式。在此基础上,可以有效地去除一些错误识别的零形式。

表1 词元“发射”在训练语料中的标注模式

4.2 零形式的分类模型

并非所有的零形式都能在篇章中找到对应的先行语,因此,在进行零形式消解之前,需要对子任务一中识别出的零形式,确定哪些能找到先行语,即哪些属于DNI。

本文使用最大熵分类模型实现了零形式分类,实验使用的是张乐博士的最大熵工具包[17]。而特征选择的优劣直接影响模型的性能,本文借鉴雷章章等[8]在英文语料上所使用的特征,并扩展总结出本文实验用到的特征,如表2所示。

表2 零形式分类的特征描述

4.3 有定的零形式消解模型

有定的零形式消解旨在为识别出的有定的零形式从篇章上下文中找到其对应的先行语。其中,如何确定候选先行语的范围及候选先行语是首要的问题。然后,本文使用最大熵模型构建先行语查找模型。

4.3.1 确定先行语候选集

在语篇中可能作为零形式框架元素先行语的词即为候选词。由于语料已进行细粒度的标注,我们认为,零形式的先行语在篇章中已填充过其他显式表达的框架元素,因此,本文将一定窗口内所有语句中所有框架元素的填充项作为当前零形式先行语的候选集。通过在不同窗口大小的对比实验,选定最佳的窗口作为候选词的选择范围。

4.3.2 特征选择

本文深入分析了框架元素的语义类型及框架之间的关系,为该任务设置了如表3所示的特征集。

表3 有定的零形式消解的特征描述

其中,特征F8是指框架元素的语义类型,表4给出了部分框架元素的语义类型。本文认为零形式先行语的语义类型与候选词的语义类型应该是趋近相同的。如例1中的有定的零形式框架元素Cognizer,可知其语义类型为Sentient,而其先行语的语义类型应该也为Sentient,由于候选词“科学家”曾填充框架元素Agent,其语义类型为Sentient,因此为Cognizer找到了先行语“科学家”。

表4 部分框架元素的语义类型示例

另外,根据FrameNet中框架之间以及框架元素之间的关系(已在3.3节中介绍),本文提取了特征F9,即表示从框架f1到f2之间的框架关系路径。

例5 [五十年代]Time,[我国]Agent+Place曾发起行为开始[把麻雀作为四害来消灭的运动]Activity。

然后,[在麻雀被大量捕杀之后的几年里]Time,却出现事件了[严重的虫灾]Event。[PlaceDNI]

以例5为例,第一句中的目标词“发起”激起“行为开始”框架,“五十年代”和“把麻雀作为四害来消灭的运动”分别填充该框架中的Time和Activity框架元素,而“我国”表达了Agent和Place两个语义角色,即出现了框架元素融合现象[2]。第二句中的目标词“出现”激起了“事件”框架,其中核心框架元素Place未显式表达。在FrameNet关系网中,框架“行为开始”继承自“过程开始”框架,而框架“过程开始”又继承于“事件”框架,这种继承关系也存在于框架的部分框架元素之间,即表示为:

根据这些继承关系,为有定的零形式框架元素Place找到了对应的先行语,即为前一句中框架元素Place的填充项“我国”。

5 实验及结果分析

5.1 实验语料

实验语料来源于山西大学语义计算与汉语框架网研究中心,包括57篇《人民日报》语料及107篇阅读理解的文章,涉及科技、历史、医保等14个领域。本文使用中国科学院计算技术研究所的ICTCLAS进行分词及词性标注,使用斯坦福大学的语法解析工具Stanford Parser得到短语类型。由于目前汉语自动语义角色标注的性能偏低,我们进行了人工语义角色标注。实验数据的统计结果如表5所示。

表5 实验数据的统计结果

本文采取交叉验证策略,将语料分为五等份,每次取其中四份做训练集,剩余一份做测试集,取五次结果的平均值作为最终结果。

5.2 评价指标

本文使用准确率P(Precision)、召回率R(Recall)和F值对实验结果进行评价。假设Cp是实验模型预测出的个数,Cc是实验模型预测正确的个数,Ca是测试集中正确答案的个数,则我们将准确率、召回率和F值定义如下:

5.3 零形式的识别实验及结果分析

本文提出的两级识别方法在语料集上的实验结果如表6所示,可以看出本文改进的识别方法达到了78.84%的F值。作为对比,本文使用文献[8]的规则方法在本文语料上进行了实验,其F值为69.34%,显然低于本文方法的实验结果。

表6 零形式识别的实验结果

经过分析,影响实验结果的一个重要因素就是核心框架元素之间存在的CoreSet关系,以例6来说明。

例6 [他]Suspect[因为入室盗窃]Offense而被逮捕逮捕。[ChargesINI][AuthoritiesINI]

在“逮捕”框架中,

Core: {Authorities,Charges,Offense,Suspect}

CoreSet: {Charges,Offense}

例6中,核心框架元素Suspect和Offense显式表达,而核心框架元素Charges与Offense存在CoreSet关系,本文使用的方法在实验中未将Charges的缺失标记为零形式,这种情况就会影响实验结果。

5.4 零形式的分类实验及结果分析

对于检测到的零形式,本文使用最大熵模型对零形式的解释类型(DNI,INI)进行了分类,分类结果如表7所示,其中本文方法的结果要高于使用文献[8]所用特征的结果,验证了本文提取特征的有效性。

但是分类结果仍不高,究其原因,一是由于子任务一中零形式识别结果的限制,另外,由于零形式框架元素所属的框架、词元或语境不同,对零形式的解释类型就都可能不同,以例7、例8来说,对于框架元素Place,都未在句中显式表达,但由于其所属词元不同,所处语境不同,则解释类型也不同,即分别为INI和DNI。

表7 零形式分类的实验结果

例7 [任何不属于空气成分的物质大量进入空气之后]Time,[空气污染]Event就发生事件了。[PlaceINI]

例8 然而,[在麻雀被大量捕杀之后的几年里]Time,却出现事件了[严重的虫灾]Event,使农业生产受到巨大的损失。[PlaceDNI]

5.5 有定零形式的消解实验及结果分析

为了选择出最有效的特征组合以及最佳的候选词范围,本文首先在正确的有定零形式基础上进行了大量实验,表8中给出了窗口大小分别为2,3,4的实验结果,其中F1~7表示使用表3中的前七个特征,F1~9表示使用表3中的所有特征。

表8 在正确的有定零形式上的实验结果

由表8可知,在前七个特征基础上加入框架元素的语义类型特征(F8)时,消解结果有一定的提高,但是由于部分框架元素没有被分配语义类型,因此限制了提升的幅度。在加入框架关系特征(F9)时,结果提升,说明了框架关系的重要性。

当同时加入语义类型与框架关系特征时,实验结果显著提高,并且窗口大小为3时,F值达到30.05%。

5.6 零形式消解实验及结果分析

最后,本文在自动识别零形式、自动零形式分类的基础上,设置窗口大小为3,使用特征F1~9进行了消解实验,结果如表9所示。本文结合语义类型与框架关系的方法达到了21.84的F值,但是与表8结果对比,F值降低了约9%,这是由于零形式自动识别以及零形式的分类中的错误导致。

为了与其他方法进行比较,本文使用文献[11]提出的方法在本文的语料上进行了实验,显然本文方法的实验结果更高,但是由于我们的语料中没有标注中心词信息,因此该对比实验所用特征不包含中心词特征。而目前针对英文零形式消解最好的方法,即文献[12]提出的方法,其充分运用了共指模型,但是由于我们的语料未标注共指信息,因此本文没有使用该方法在我们的语料上进行实验对比。

表9 自动识别的有定的零形式消解实验结果

零形式消解的结果不是很高,本文认为其中一个影响因素是设置窗口大小为3,即所选候选词范围设定在3句以内,但本文统计出DNI先行语在3句以外的概率为5.2%,下面给出了类似的情况:

另外,实验训练语料较少也是影响实验结果的一个因素。

6 结束语

零形式的识别与消解是指找到未显式表达的语义成分并在篇章中为其找到先行语。本文将该任务分成三个子任务: 零形式的识别、零形式的分类及有定零形式的消解。对于零形式的识别任务,本文首先使用已有规则方法进行第一级检测,然后使用提出的筛选方法进行第二级识别。对于有定的零形式消解任务,本文将篇章中显式表达的框架元素填充项作为有定零形式的先行语候选集,并结合框架元素的语义类型与框架关系进行先行语查找,最终,实验结果验证了该消解方法的可行性。

零形式的识别与分类是有定的零形式消解的基础,因此提高零形式的识别与分类性能至关重要。此外,下一步将在扩大语料规模的同时,结合HowNet、WordNet等资源获取语义类型及其上下位关系,提出更高效的先行语查找方法。

[1] 刘开瑛. 汉语框架语义网构建及其应用技术研究[J].中文信息学报,2011,25(6): 46-52.

[2] 俞士汶,黄居仁. 计算语言学前瞻[M]. 北京: 商务印书馆,2005: 21-74.

[3] Josef Ruppenhofer,Caroline Sporleder,Roser Morante,Collin Baker,Martha Palmer. SemEval-2010 Task 10: Linking Events and Their Participants in Discourse[C]//Proceedings of the SemEval-2010. Uppsala,Sweden: 15-16 July 2010: 45-50.

[4] Sara Tonelli,Rodolfo Delmonte. VENSES++: Adapting a Deep Semantic Processing System to the Identification of Null Instantiations[C]//Proceedings of SemEval-2010. Uppsala,Sweden: 15-16 July 2010: 296-299.

[5] Hugo Liu,Push Singh. Conceptnet: a practical commonsense reasoning tool-kit[J]. BT technology journal,2004,22(4): 211-226.

[6] Sara Tonelli,Rodolfo Delmonte. Desperately seeking implicit arguments in text[C]//Proceedings of the ACL 2011 workshop on relational models of semantics. 2011: 54-62.

[7] Desai Chen,Nathan Schneider,Dipanjan Das,Noah A. Smith. 2010. SEMAFOR: Frame Argument Resolution with Log-Linear Models[C]//Proceedings of SemEval-2010. Uppsala,Sweden: 15-16 July 2010: 264-267.

[8] 雷章章,王宁,李茹,等. FrameNet中有定的零形式识别[J]. 中文信息学报,2013,27(3): 107-112.

[9] Carina Silberer,Anette Frank. Casting implicit role linking as an anaphora resolution task[C]//Proceedings of the First Joint Conference on Lexical and Computational Semantics-Volume 1: Proceedings of the main conference and the shared task,and Volume 2: Proceedings of the Sixth International Workshop on Semantic Evaluation. 2012: 1-10.

[10] Philip Gorinski,Josef Ruppenhofer,Caroline Sporleder. Towards weakly supervised resolution of null instantiations[C]//Proceedings of the 10th International Conference on Computational Semantics (IWCS 2013) -Long Papers. 2013: 119-130.

[11] Ning Wang,Ru Li,Zhangzhang Lei,Zhiqiang Wang,Jingpan Jin. Document Oriented Gap Filling of Definite Null Instantiation in FrameNet[C]//Proceedings of Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data,2013,8202: 85-96.

[12] Egoitz Laparra,German Rigau. Sources of evidence for implicit argument resolution[C]//Proceedings of the 10th International Conference on Computational Semantics (IWCS 2013)-Long Papers. 2013: 155-166.

[13] Matthew Gerber,Joyce Y Chai. Beyond nombank: a study of implicit arguments for nominal predicates[C]//Proceedings of the 48th Annual Meeting of the Association for Computational Linguistics. 2010: 1583-1592.

[14] 李茹. 汉语句子框架语义结构分析技术研究[D]. 山西大学博士学位论文,2012.

[15] Charles J Fillmore. Frame semantics. Linguistics in the morning calm[M]. Seoul,Korea: Hanshin Publishing Company,1982: 111-137.

[16] Collin F Baker,Charles J Fillmore,John B Lowe. The berkeley framenet project[C]//Proceedings of COLING/ACL. 1998.

[17] Zhang Le. Maximum entropy modeling toolkit for python and C++: [OL]http://homepages.inf.ed.ac.uk/lzhang10/maxent_toolkit.html

Null Instantiation Identification and Resolution in Chinese Discourse

WU Juan1,LI Ru1,2,WANG Zhiqiang1

(1. School of Computer & Information Technology,Shanxi University,Taiyuan,Shanxi 030006,China;2.Key Laboratory of Ministry of Education for Computation Intelligence &Chinese Information Processing,Shanxi University,Taiyuan,Shanxi 030006,China)

Semantic Role Labeling is traditionally concerned with searching the fillers of those explicit roles appearing within sentence boundaries, ignoring some implicit arguments called null instantiation. This paper addressed the issue of automatic null instantiation identification based on Chinese FrameNet. We first apply the rule-based approach to detect null instantiation, which is followed by a post filtering to remove errors. Then, to deal with the arguments, we present an approach to combining semantic types of frame elements and frame-to-frame relations. We conduct experiments on 164 Chinese discourses, and compared with some other method, our method can get a better result.

Chinese FrameNet; null instantiation identification; null instantiation resolution

武娟(1991—),硕士研究生,主要研究领域为中文信息处理。E⁃mail:wujuan_0922@163.com李茹(1965—),通信作者,博士,教授,博士生导师,主要研究领域为自然语言处理。E⁃mail:liru@sxu.edu.cn王智强(1987—),博士研究生,主要研究领域为社会媒体数据挖掘、自然语言处理。E⁃mail:zhiq.wang@163.com

2014-02-03 定稿日期: 2014-06-05

国家自然科学基金(61373082);山西省科技基础条件平台建设项目(2014091004-0103);山西省回国留学人员科研资助项目(2013-015);国家863计划项目(2015AA015407)

1003-0077(2016)03-0009-07

TP391

A

猜你喜欢

先行语料语义
绿色低碳 节能先行
基于归一化点向互信息的低资源平行语料过滤方法*
语言与语义
从“先行先试”到“先行示范”
黔货出山 遵义先行
黔货出山 遵义先行
批评话语分析中态度意向的邻近化语义构建
“社会”一词的语义流动与新陈代谢
“吃+NP”的语义生成机制研究
《苗防备览》中的湘西语料