APP下载

人工智能驱动的“PDRT+CCG”视域下的预设研究

2020-11-26邹崇理武瑞丰

关键词:句法指针语句

邹崇理, 武瑞丰

(湘潭大学 碧泉书院, 湖南 湘潭 411105)

0 引言:人工智能对自然语言预设的研究需求

当今人工智能(AI)的发展,图像方面的进步非常快,但是识别图像只是智能的一部分,人的智能中最高端的特征是语言。AI领域认为:让计算机理解自然语言是人工智能皇冠上的明珠。新一代人工智能取得突破的更高目标就是让机器理解人类的自然语言,这涉及到语义和语义背后的知识。要真正理解自然语言、攻克人工智能的难关,需要AI自然语言处理领域的工作,需要对语言进行语义分析,需要采用数学或逻辑的方式来表征语义背后的人类知识。清华大学教授、北京智源首席科学家孙茂松认为:“从文本中挖掘知识库,文本中有大量的知识,对知识进行形式化,……变成类似谓词逻辑表达式,相当于变成某种公式,这时就可以往知识库里补充。如果这条道走通了,这个问题就会得到相当程度的解决。”(1)《孙茂松:深度学习的红利我们享受得差不多了!》,2019年11月20日,https:www.sohu.coma354990464_99979179,2020年1月5日。

自然语言处理近年的发展,跟图像识别的进展类似,依赖的方法都是基于统计的深度学习。深度学习最显著的特点就是背靠大数据,机器凭借海量的数据进行自主训练。自然语言处理中比如语音识别和机器翻译,都是靠大数据驱动,即便如此,机器翻译系统也没有完全理解语言。如英语句“The box was in the pen”,“box”是盒子,“pen”有两个意思:一个是“钢笔”,另一个是“围栏”。大数据驱动的机器翻译系统如谷歌、百度、微软的机器翻译系统都会把上句翻译成“盒子在钢笔里”。因为机器依据的是“钢笔”出现频度很高而“围栏”出现频度很低的统计,机器不知道介词“in”语义背后的知识:一个体积小的东西才能放到一个体积大的东西里边。机器不知道盒子比钢笔大,不能放到钢笔里,而盒子比围栏小,可以放到围栏里。再比如,若一个句子包含生活常识,机器翻译系统更会被搞得稀里糊涂。公交车上的到站提醒“前门快到了,请从后门下车”,这个句子对计算机系统来说是难以理解的,机器不知道句中的“前门”是个地名,而“后门”却是下车的通道。

怎样构建训练人工智能翻译系统所需要的知识库,这需要计算机科学、逻辑学、语言学和认知科学等诸多领域的研究者通力合作,对人类知识的载体——自然语言的语义进行数学和逻辑的分析处理。我们认为,自然语言语义的一个部分——预设是自然语言承载知识的重要环节,上文涉及的两个例子都跟语言的预设有关联。本文在当今AI理解处理自然语言的迫切需求的激励下,尝试采用国际上新产生的语言逻辑工具——投射的话语表述理论PDRT和组合范畴语法CCG对自然语言的预设现象进行分析处理,为AI理解自然语言而构建大知识库的工作做些理论上的探索。

1 预设是什么

1.1 预设的逻辑起源

预设,也称为前提、先设。预设是语义学、逻辑学、语用学等学科研究中的一个重要概念。预设的概念最初来源于逻辑学,可以追溯到古希腊时代。最早研究预设的是哲学家和逻辑学家。其中,最有影响的三位哲学家是弗雷格、罗素和斯特劳森。

弗雷格是第一个把预设作为概念进行探讨的。他在《意义和指称》(“On Sense and Reference”)中提出:任何一个语句所包含的简单或者复杂的专有名词都得具有指称对象,否则这个语句就没有真假值(2)A.P.马蒂尼奇:《语言哲学》,牟博、杨音莱等译,北京:商务印书馆,2006年,第388-389页。。如弗雷格以下的经典例子能说明这一点。

(1)Kepler died in misery.(开普勒死于贫困)

(2)Kepler existed.(开普勒存在)

在弗雷格看来,如果(1)要有真假值,那么就一定语义预设了(2),即开普勒的存在。根据弗雷格的观点,一个句子的任何部分如果没有指称对象,那么这个句子的真值无法判定,就会出现真值间隙。

罗素在《论指称》(“On Denoting”)中反对真值间隙,坚持二值论(3)B.Russell,“On Denoting”,Mind,Vol.14,No.56,1905.。在他看来,一个语句要么为真,要么为假。如“法国国王是个秃子”可以翻译为三个命题的并列,即“存在一个人是法国国王”、“如果存在一个y是法国国王,那么y就是x”和“x是秃子”。我们可以形式化地表述为:∃x[F(x)∧∀y[F(y)→y=x]∧C(x)]。因为此公式为合取式,则可知,不存在法国国王,合取支为假,整个公式为假。罗素认为预设是命题逻辑语义的一部分,如果预设为真,整个命题为真,反之亦然。

在很长一段时间里,罗素的观点一直占有统治性的地位,直到1950年代,受到斯特劳森的挑战。斯特劳森认为罗素混淆了语句的意义和陈述的概念(4)P.F.Strawson,“On Referring”,Mind,Vol.59,No.235,1950.。一个语句不同于在具体的语境中应用这个句子做出的陈述,一个语句可以有意义,但没有真假,只有语句的陈述才有真假之分。使用语句进行陈述需要结合一定的语境,这就开启了一种新的预设概念。例如,“法国的国王是秃子”,这句话本身无所谓真假,只有结合一定语境才能判断真假。法国在君主制的时候,说出这句话有真值,而在当今,说出这句话就无真假可言。

1.2 预设的逻辑定义

从逻辑语义角度看,学界大都把预设当作句子与句子之间的一种真值关系。无论句子是真还是假,预设都为真。如果命题S′是命题S的预设,当且仅当,S逻辑地蕴涵着S′,且S的否定式S也逻辑地蕴涵着S′,即S⟹S′,且S⟹S′,则S′是S的预设。当S′为假,则S非真非假。例如“开普勒存在”是“开普勒死于贫困”的预设,当且仅当,“开普勒死于贫困”蕴涵“开普勒存在”,同时,“开普勒并非死于贫困”也蕴涵“开普勒存在”。若“开普勒存在”为假,即“开普勒”不存在,则谈论“开普勒是否死于贫困”就没有意义而无所谓真假。

然而,预设是动态的,并不是仅仅与真假相关的语义现象,对它的分析还可从语用的角度来进行。对于语用的分析,较有影响的有三类:将预设视为命题态度、话语被理解所需要满足的条件和交际双方所共有的知识或背景信息。最早提出“语用预设”概念的是斯托内克尔。他曾指出:预设是一种态度,一种接受某物为真的态度;说话人和听话人如果要想正常地会话,那么就需要遵守合作原则,预设正是交际双方遵守合作原则的产物(5)M.K.Munitz,P.K.Unger,eds.,Semantics and Philosophy,New York:New York University Press,1974,pp.197-213.。还有学者把预设视为交际双方都理解、接受的背景知识即共知性,指出语用预设的共知性是交际双方能够顺利交际的基础(6)陈晶晶:《预设投射问题探析》,中国人民大学博士学位论文,2014年,第16页。。如,A问B:“小李的孩子上学了吗?”这句话前提就是A和B都知道小李的所指以及小李有孩子。

1.3 预设触发语导致的预设分类

预设是一种特殊的已知信息,它跟话语中的某些词条或句子结构紧密关联,也就是说这些词条和句子结构可以称作“预设触发语”。

卡图南(L.Karttunen)曾收集了31种触发预设的语言表达式(7)L.Karttunen,“Presuppositions of Compound Sentences”,Linguistic Inquiry,Vol.4,No.2,1973.,索姆斯(S.Soames)则列举了8类(8)S.Soames,“How Presupposition are Inherited:A Solution to the Projection Problem”,Linguistic Inquiry,Vol.13,No.3,1982.,而列文森(Stephen C.Levinson)在《语用学》中共涉及了13种触发语(9)Stephen C.Levinson,Pragmatics,Cambridge:Cambridge University Press,1983,pp.179-185.。在此,我们按照奴提雅(N.J.Venhuizen)的观点(10)N.J.Venhuizen,Projection in discourse:A data-driven formal semantic analysis,PhD Dissertation,University of Groningen,2015,pp.12-14.,把预设触发语大致分为“存在触发语”、“基本命题触发语”和“先决条件触发语”三类。相应地,把预设分为三大类。

第一类:存在触发语通常是说指称表达式预设某个实体的存在,主要包括限定摹状词、专名、所有格或带修饰成分的名词短语(包括代词)。如:

(1)那个发现行星轨道为椭圆的人悲惨地死去。(限定摹状词)

预设:存在发现行星轨道的人。

(2)英国首相感染了新冠肺炎。(专名)

预设:存在英国首相。

(3)他的妻子没在家。(所有格)

预设:他有妻子。

(4)证明月球绕地球公转的不是中国人。(带修饰成分的名词短语)

预设:有人证明了月球绕地球公转。

我国老一辈逻辑学家周礼全先生指出:“单独名称又可分为简单的单独名称和复杂的单独名称。前者就是通常所说的专名,如‘开普勒’;后者相当于罗素所说的摹状词,如‘那个发现行星运行轨道的人’。”(11)周礼全主编:《逻辑——正确思维和有效交际的理论》,北京:人民出版社,1994年,第453-454。

第二类:基本命题触发语所触发的是其嵌入或隐含的小句,主要包括事实动词、分裂句、时间修饰语、疑问句、带重读成分的隐含分裂句。

A.事实动词表示既成事实,如“知道、后悔、意识到、抱歉的是、高兴的是、骄傲的是”等等。这样的动词触发预设其嵌入的小句,也就是说动词所涉及的事实内容。如:

(5)约翰知道玛丽喜欢他。

预设:玛丽喜欢约翰。

B.分裂句就是强调句,目的是为了突出某一结构的信息。分裂句所触发预设就是和强调的焦点相关的预设。如:

(6)是约翰杀了玛丽。

预设:有人杀了玛丽。

C.时间修饰语在这里指的是“在……之前、在……之后、在……期间”等,它们所触发的是时间状语从句的内容。如:

(7)在长沙旅游期间,我们受到了朋友的热情款待。

预设:我们曾在长沙旅游。

第三类:先决条件触发语是以某种方式对其上下文施加先决条件或要求的表达式,主要包括蕴涵动词、体动词、重复标志。

A.蕴含动词指的是蕴含其他事件的动词,其所触发的预设得根据动词蕴含意义。如:

(8)我在路上偶遇了一个老朋友。

预设:我没曾想会在路上碰到他。

B.体动词表示动作的开始、结束、继续等,其触发的预设是动词意义的先前状态。如:

(9)课后继续讨论这个话题。

预设:已经讨论这个话题了。

C.重复标志表示某个动作或状态重复的词语,包括“再一次、又、第n次(n>1)”等,它们表示重复内容的预设。如:

(10)这是我第三次来广西了。

预设:我来过广西两次。

本文限于篇幅,作为应用新逻辑工具解决预设问题的起步,先处理第一类预设现象。

2 处理预设的逻辑语义学工具

自从弗雷格把预设作为逻辑概念进行讨论以来,出现了许多研究预设的逻辑语义学工具,本文主要涉及投射的话语表征PDRT和组合范畴语法CCG。

2.1 话语表征理论DRT对预设的处理——PDRT

范德杉特(R. van der Sandt)的理论认为,预设投射(12)这里所谓预设投射粗浅地理解为:把一个语句的预设信息吸收到该语句的语义表征中。等同于回指消解,预设和回指表现出相似的行为(13)R.van der Sandt,“Presupposition Projection as Anaphora Resolution”,Journal of Semantics,Vol.9,No.4,1992.。然而,与回指不同的是,在没有合适先行词的情况下,预设可以恰当地出现。在这些情况下,一个新的DRS是在一个可及的话语层面上被创造出来的,这个过程被称为“纳入”。范德杉特采用DRT框架来实现对预设的处理。如:

(1)Somebody did not notice the pilot.

预设信息被纳入的DRS

上例句的预设触发语是“the pilot”,涉及的预设信息是“存在y:pilot(y)”,在可及的整体DRS中这个预设信息被纳入其中,但R.van der Sandt在采用DRT处理预设时产生的一个问题是:在预设投射纳入后,纳入的预设信息和断言信息是没有区分的。例如,在(1)的DRS中,纳入的预设信息“存在y:pilot(y)”被添加到整体的DRS中,因此获得与“person”引入的断言信息相同的状态。Krahmer认为,纳入的预设应该保持其预设性,它们不同于断言的信息(14)Emiel Krahmer,Presuppostion and Anaphora,Standford:CSLI Publications,1998,pp.13-19.。为解决这一问题,Krahmer引入了预设信息的标记,使得预设在更高的语篇层次上被纳入,允许其有不同于断言信息的解释。这里需要一个单一的表示框架,允许对断言的信息和预设的信息进行区别。于是产生了投射的DRT(Projective Discourse Representation Theory),即DRT的扩展——PDRT(15)N.J.Venhuizen,et al.,“Parsimonious Semantic Representation with Projection Pointer”,Proceedings of the 10th International Conference on Computational Semantics,Potsdam,2013,pp.252-263.。在PDRT中,给所有PDRS中的话语所指和PDRS条件添加指针,显示它们的投射纳入位置。这意味着预设的信息可以从纳入它的PDRS中清楚地识别出来。

在PDRT中,断言信息和预设信息的差异在于它们指向不同的PDRS语境。断言信息的指针就是引入断言的PDRS标签。预设信息的指针是另一可及的PDRS标签,也可以是自由变量。如(2)所示,我们使用正整数表示标签(约束指针),而f表示自由指针。

(2)a.A boy smiles.

b.The boy smiles.

c.It is not the case that the boy smiles.

所有的话语指称和DRS条件都跟一个指针相关联,指针是一个倒箭头指向的对象。(2a)显示,没有投射的预设信息,则有关的话语指称和DRS条件都指向引入这些信息的PDRS(标记为“1”的PDRS)。另一方面,在(2b)和(2c)中,限定摹状词“the boy”触发了关于话语指称存在的预设,这里预设信息的指针为自由变元(这里是“f”)。自由指针代表最外层的PDRS的标签,在(2b)和(2c)中,自由指针代表的都是标记为“1”的PDRS。

大多数预设理论主张预设信息由词汇驱动。即是说,特定的词汇项将产生预设,特定的词条称为“预设触发语”。因此,预设的信息将体现在投射触发语的词条语义上。根据逻辑的组合原则,从作为预设触发语的词条语义出发,一步步推演出涉及预设的语句的语义。于是有学者采用λ-演算的工具对PDRT进行组合处理(16)Reinhard Muskens,“Combining Montague semantics and discourse representation”,Linguistics and Philosophy,Vol.19,No.2,1996;Johan Bos,“Implementing the Binding and Accommodation Theory for Anaphora Resolution and Presupposition Projection”,Computational Linguistics,Vol.29, No.2,2003.。PDRT中的组合性是通过以类型化的λ-项的形式为每个词条提供语义来实现的。为了组合这些语义,PDRT提出PDRS的合并操作,通过合并将两个PDRS合并为一个。我们对断言的和预设的DRS使用不同的合并形式,以显示它们不同的组合特性。在PDRT中,涉及预设投射信息的PDRS合并与涉及断言信息的PDRS合并其操作标识是不同的:用“+”表示两个断言PDRS的合并;用“*”表示涉及预设PDRS的合并。

两个PDRS之间的断言合并可以通过各自话语所指和PDRS条件的并集来定义。合并后的整体PDRS的标签必须与合并前第二个PDRS的标签一致。断言合并操作的定义如下所示:

定义断言合并

这里对合并的结果进行了指针的重命名,把第一个PDRS中的话语所指集合Di和PDRS条件集合Ci中的指针i替换成第二个PDRS中的话语所指集合和PDRS条件集合中的指针j,分别得Di[j/i]和Ci[j/i],再把它们分别同第二个PDRS中的Dj和Cj进行并集运算,最后完成合并获得新的整体PDRS。语句系列“A man sings. A woman dances.”的PDRS合并如下:

这里标签(约束指针)为1的PDRS,其话语所指集合D1={1←x},其条件集合C1={1←man(x),1←sing(x)},对此进行指针重命名后得标签为2的PDRS:D2={2←x},C2={2←man(x),2←sing(x)},再跟原本标签为2的PDRS的话语所指集合和条件集合分别进行并集运算,这样就得到合并操作后的整体PDRS。

另一方面,预设的信息在合并操作时则不受合并后的整体PDRS其他信息的影响,而是保留预设信息的指针,指针指向其纳入PDRS语境的标签或是自由变元。因此,涉及预设的合并只需将预设信息中的话语所指及其条件添加到整体PDRS中。这就产生了以下定义:

定义涉及预设的合并

出于理解的直观性,我们以“John loves his child”的PDRT的分析为例(17)下面的PDRS方框中最下层行表明标签所代表的PDRS之间的可及关系。如“2≤1”表明PDRS2中话语所指被指被PDRS1所约束。:

此例是说John和his child都是预设触发语,其在PDRS1和PDRS2中预设信息的指针合并后在整体PDRS中被保留下来。

2.2 组合范畴语法CCG对预设的处理——格罗宁根意义库GMB

组合范畴语法,简称CCG。其特征大致有:第一,CCG对自然语言的句法语义分析面向的是大规模的真实文本,CCG处理的就是自然语言的个案个例。第二,CCG认为自然语言只有表层结构这样的句法层面,这也是所谓单层结构的思想。句法表层的每个成分都有各自的语义作用,自然语言逻辑语义的分析推演自始至终基于句法表层的构造,而不像乔姆斯基的GB理论假定自然语言具有一个便于语迹移动的深层结构,也不似蒙太格语法那样假定自然语言具有用于量化嵌入规则的带逻辑变项的底层结构。第三,CCG的词汇主义原则是:“我们假定,所有的结构都是由词汇管辖的,并且词汇中心语具有明显的语义形式”(18)Mark Steedman,Combinatory Categorial Grammar,Philadelphia,PA:The SOMESUCH Press,2017,pp.143-144.。自然语言表达式所有的句法结构都被作为其构造成分的词条所控制,换言之,词条的范畴指派凝缩了句法结构的运算推演过程。同样一个词条在不同的个案个例句中可能被指派不同的范畴。第四,CCG强调句法和语义的对应原则,即句法和语义的透明原则。CCG所谓透明性原则指出,每个句法范畴对应一个唯一的语义类型。尤其是,语句范畴S对应逻辑公式的类型t,这确保生成的语句翻译成一个逻辑公式。

组合范畴语法怎样处理预设?这需要借鉴PDRT分析预设的技术手段,譬如前文提及的“指针”概念,尤其需要关注涉及PDRT的两个合并操作的规则运用的情况。CCG自身一些重要的经验主义特征——个案个例的方法,如词例和规则例的思想会对PDRT产生影响。即CCG对PDRT的吸纳是一种“取长补短”的互动。如:CCG对连词或起连词作用的逗号进行个案个例的特殊处理,牵涉到PDRT的合并规则,CCG可能产生许多具体的规则例。

CCG的并列规则的一般模式<Φn>为:

X:f conj:b X:g ⟹ΦnX:λ…b(f…)(g…) (conj是范畴(XX)X的缩写)

具体来说:

当Φ0时,bxy≡bxy

当Φ1时,bfg≡λx.b(fx)(gx)

当Φ2时,bfg≡λx.λy.b(fxy)(gxy)

当Φ3时,bfg≡λx.λy.λz.b(fxyz)(gzyz)

当Φ4时,bfg≡λx.λy.λz.λw.b(fxyzw)(gxyzw)

对自然语言中包含预设的并列句如“张三有女儿并且张三的女儿出嫁了”、“李四曾经抽烟并且现在戒烟了”之类的分析,基于PDRT作为语义表征的CCG可以把自己的并列规则模式变成涉及PDRS合并的规则例:

S:PDRS K1conj:* S:PDRS K2⟹ S:PDRS K1*PDRS K2

而不涉及预设的通常并列句,其并列规则例可以是:

S:PDRS K1conj:+ S:PDRS K2⟹ S:PDRS K1+PDRS K2

格罗宁根意义库GMB就是在CCG框架内采用PDRT的技术手段分析自然语言的产物(19)格罗宁根意义库GMB以数据驱动语义分析为基础,旨在标注各种各样的语言现象。它不仅结合了各种层次的语言标注,而且提供了一个“深”层的形式意义表征,它把多个层面的标注合成到一个单一的语言形式,而且将这个单一的语言形式整合到一个单一的表征框架中,即PDRT所提供的结构。GMB这样的资源库的构建需要几个阶段,包括为收集语义标注数据,选择和开发用于自动分析数据的NLP工具,以及选择正确的方法来存储和评估标注。。

GMB语料库中对英语句的分析,其对预设的语义表征采用PDRT的方式。GMB的亮点是在语句的分析推演中增加了范畴的运算,即在CCG框架内生成语句。生成是一种句法和语义的并行推演——既有各类表达式句法范畴的运算,又有与之对应的PDRS语义表征的组合。即把CCG原有的作为语义表征的λ-项换成了PDRT中的PDRS。GMB的重要特征是句法与语义接口的透明性,句法与语义的并行推演,这一特征是对CCG基本特征的继承。也就是说,GMB坚持逻辑语义学工具的传统——句法和语义对应的组合原则。

在GMB语义库中,涉及预设的英语句“the cow moos”的CCG+PDRT推演图示如下:

上推演图的最后结果中的预设信息为:存在是“cow”的个体。

3 尝试采用PDRT+CCG的工具分析预设现象

对语言学界熟知的语义疑难句“王冕死了父亲”,大都认为:该句中的“死”通常作为不及物动词(一元谓词),为什么出现了两个论元(王冕和父亲)?其次,“王冕”和“父亲”的关系到底是什么?显然不是施事与受事的关系。有学者将“父亲”称为“领主属宾语”,该句的主语和宾语存在明显的“领有隶属”关系,而没有直接的语义关系。类似的表达还有:

张三烂了一筐梨。

这个学校倒了一堵墙。

孙从众的《从语义—句法界面看“王冕死了父亲”的生成方式》(20)孙从众:《从语义—句法界面看“王冕死了父亲”的生成方式》,《宁波广播电视大学学报》2016年第4期。一文认为该句式的形成结合了语义的糅合和谓语动词的移位,移位动因是“死”的语义增值……句式结构中“死”的背后附加了一种“损失”之意,或者说“死”与“损失”两种意义相糅合,最终导致句法结构发生了相应的改变——移位(21)对这类语言现象,主流的研究观点主要从三个角度进行尝试:第一种是从生成语法出发,到后来在句法—语用交接面完善(张三被打断了一条腿⟹张三的一条腿被打断了⟹张三打断了一条腿);第二种是利用认知语言学的构式语法来解释;第三种则是从历时的角度出发,从历史语料寻找演变的原因。。

本文的解决思路是:把“死”仍当作不及物动词,预设存在一个被领属的个体,而“王冕”则是这个领属者。表征领属者的逻辑表达PDRS跟“死”的PDRS组合,回头来再跟“父亲”的PDRS组合,最后的结果是“父亲”找到领属者,同时“死”也找到了论元。组成句子“王冕死了父亲”的词条信息及其推演如下:

2.死了 SNP:λx.(b2〈∅,{b2←死了′(x)}〉)

3.父亲 SNP:λx2.(b3〈∅,{b3←父亲′(x2)}〉)

句子的推演如下图所示:

推演最后结果表明:预设的触发语是专名“王冕”。b2的语境显示:预设存在一个父亲的个体,而且是王冕所领有的个体。在这个预设下,句子表达的意思是“王冕父亲的个体死了”。这样解决了该句所谓“领属”和“移位”问题,而该句关于语义糅合的问题留待今后的工作。

本文引言中提到AI发展需要构建知识库遇到的语义难题,这里尝试采用PDRT+CCG的语言逻辑工具,对含多个预设的例句“The box was in the pen”进行分析。该语句的词条信息为:

该语句详细的推演步骤如下:

最后获得的PDRS作为例句的语义表征,包含的三个预设信息是:b2〈{b2←x1},{b2←box(x1)}〉、b6〈{b6←x5},{b6←pen(x5)}〉和b3〈∅,{b3←larger-than(x5,x1)}〉。b2表明:存在一个是盒子的个体;b6说的是:存在一个是围栏的个体;b3意味着:作为围栏的个体比作为盒子的个体体积大。名词短语 “the box”和“the pen”所表示的预设是由词汇意义或者结构所引发的,而预设b3“larger-than(x5, x1)”是句子“The box was in the pen”得以恰当表达的适宜性条件,是说话人主观认定当然成立的命题,或者是说话人认为交际双方共有的交际信息或听话人能够自然推断出来的信息。b3的预设信息正好是本文引言中提到的关于新一代AI需要解决的问题:语言表达式be-in预设“一个较小的东西放到一个较大东西里边”的常识。

在当今AI构建知识库的另一例句“前门快到了,请从后门下车”中,构成该语句的词汇的句法范畴和语义范畴为:

5.[请从…下车](23)从非连续的范畴逻辑视角看,该句系列第二句中的动词被分析成非连续词条:请从…下车。该句系列的两个子句都是祈使句,推演最后的结果是语句函项的类型。(SNP)(S(SNP)):λY.λx5.(Y@λx6.(b4〈{b4←e2,b4←t1},{b4←[请从…下车]′(e2),b4←Time(e2,t1),b4←t1=now,b4←Agent(e2,x5),b4←Patient(e2,x6)}〉))

此句详细的推演步骤见下页文尾。

这个例子包含的两个预设是:存在是“前门”并且作为“车站名”的个体x1,存在是“后门”并且作为“下车通道”的个体x4,即“前门”和“后门”对应的预设信息涉及“车站名”和“下车通道”。这个包含生活常识的句子对于机器翻译来说是无法识别的,因为它涉及到了说话人和听话人的知识背景。再如,语句“你真好”包含至少两层意思:对一个人的赞扬或者讽刺。但对于英汉机器翻译系统来说,并不能识别语句所包含的赞扬或讽刺,而只能机械地翻译成“You are really kind”。这些表明,当涉及文化背景、认知、心理、时间、地点等语用因素时,机器翻译系统就显得力不从心。因此,构建人工智能的翻译系统所需要的知识库显得尤为重要,这就需要计算机科学、逻辑学、语言学和认知科学等研究领域共同合作。本文采用“PDRT+CCG”的数理逻辑工具表征这些涉及预设的知识信息,期待有助于人工智能关于自然语言理解的工作。

4 结语

AI的发展必然会给社会带来根本性的变化,也会为语言、逻辑的发展提供新的契机。当今的语言研究者要想使得计算机“理解”自然语言,就需要对自然语言进行句法和语义的形式化分析,使自然语言成为一种可计算、可推演的处理对象。这不仅需要涉及词汇、语义、语法、语用等方面的理论语言学研究,而且还需要语料库语言学、计算语言学等方面的实验语言学研究。也就是说,既需要基于文本大数据的研究,又需要面向自然语言处理的资源库的建设。近两年国家层面的哲学社会科学重大项目清单中经常出现“新一代人工智能的哲学思考”、“新一代人工智能发展的自然语言理解研究”、“大数据背景下的人工智能及其逻辑的哲学反思”及“新一代人工智能驱动的逻辑学研究”等题目。这里的关键词有“人工智能”、“哲学思考或反思”和“自然语言理解或逻辑学研究”。本文关注的题材是类似的,即语言逻辑研究什么?怎样研究?我们可以从人工智能的需求找到答案,AI需要理解处理自然语言语义及其背后的知识,这就是语言逻辑研究的对象。AI要求采用数学或逻辑的形式化方式表征自然语言的语义,我们的语言逻辑研究就采用新的逻辑工具PDRT+CCG来分析自然语言的语义。我们注意到自然语言语义及其背后的知识跟语句的预设相关,因此,本文的论题就此确定。自然语言的真实文本是浩淼无边的大海,本文的研究具有起航的意义。预设的信息是否可以完全地在被预设语句的语义中讨论,以及更多的预设现象如何表征等问题,留待今后的工作。

猜你喜欢

句法指针语句
述谓结构与英语句法配置
垂悬指针检测与防御方法*
重点:语句衔接
句法二题
诗词联句句法梳理
为什么表的指针都按照顺时针方向转动
我喜欢
浅析C语言指针
信息结构与句法异位
作文语句实录