APP下载

汉语时间词的两个核心要素及其理论价值

2010-09-08姚双云

关键词:语素现代汉语方言

姚双云

(华中师范大学语言与语言教育研究中心,湖北武汉430079)

汉语时间词的两个核心要素及其理论价值

姚双云

(华中师范大学语言与语言教育研究中心,湖北武汉430079)

“时基”与“时示”是现代汉语时间词的两个核心要素,时间词的内部一般都包含了这两个概念。现代汉语时间词最主要的构造方式是“时示+时基”,其次是“时基+时示”。其内部构造规律可以作为判定时间词的一个重要标准,在汉语的本体研究和自然语言处理领域均有应用价值。

时间词;时示;时基;自然语言处理

世界上绝大多数语言都涉及到时间概念,但时间的表达手段与民族的心理特征和文化因素相关。汉语时间词反映了汉民族表达时间的心理特征,显著特点是具有时间定位和时间度量的双重功能。比较而言,定位功能是首要的,度量功能是次要的。

作为汉语研究中的一个重要议题,时间词方面的研究成果颇丰。但是,我们认为有一个极为重要的学术问题长期以来没有得到应有关注:即构建时间词的核心要素是什么。这个问题不仅涉及到时间词的本体研究,也涉及到自然语言处理。因为,时间知识及其表示在自然语言理解中占据重要地位。正如该领域的权威学者爱伦所言:“支持自然语言的任何知识表示系统的一个中心模块是对动词和时间的处理。”①

本文旨在对现代汉语时间词作定量研究,考察时间词的内部特点与构成方式,以揭示其中蕴含的规律。我们尝试将时间词的构成规律形式化,为自然语言处理提供必要的知识支持。论文分析的材料主要来源于《现代汉语句法信息词典详解》②、《现代汉语词典》③、《普通话基础方言基本词汇集》④以及《现代汉语通用词表》⑤中涉及的时间词。

一、时间词的两个核心要素与内部构成

(一)时间词的两个核心要素:“时基”和“时示”

时间词与时间不是一个概念。时间词表示时间,但是表示时间的词不一定都是时间词。朱德熙将时间词定义为:时间词是能做“在”“到”“等到”的宾语,并且能用“这个时候”“那个时候”指称的体词⑥。本文沿用了这一定义。

汉语的时间词蕴含了两个核心要素,本文称之为“时基”和“时示”。所谓“时基”即时间的基点,它是时间表达的基础与起点。“时示”即时间的指示,是时间表达的内部指向和显示。可以打这么一个比方:“时基”好比时钟上不同单位的指针,“时示”好比时钟上的数字刻度。没有“时基”和“时示”就好比时钟失去了指针或者数字刻度,无法准确地显示时间。“时基”和“时示”构成了汉语时间概念的核心部分,最能体现汉语时间词的鲜明个性。

作为时间词的核心要素,谁是时基,谁是时示,本来并不重要,语言的使用中它们发挥的是整体功能。不过在分析时间词的内部构造规律时,有必要加以区分。判断时基与时示可以依据它们各自所起的作用为标准。比方,时间词“昨天”“今天”“明天”分别由两个语素组成,第一个语素“昨”“今”“明”是时示,其作用是时间指示,第二个语素“天”是时基,其作用是时间参照。这三个时间词均采用了“时示+时基”的组合方式。不过,在时间词“今后”中,语素“今”的作用发生了改变,它的作用是时间参照,而时间指示的功能由方位语素“后”承担。该词中“今”为时基,“后”为时示,采用了“时基+时示”的组合方式。与“今后”类似的时间词还有“年前”“年后”“世纪末”等。

时基和时示可以是准确表述,也可以是模糊表述。“一九九八年”、“二十一世纪”中的时基(年、世纪)和时示(一九九八、二十一)是准确表述。“饭前”“事后”中的时基(饭、事)和时示(前、后)是模糊表述。说话人选择准确的还是模糊的表述,取决于交际的实际需要。

值得一提的是,利用时基和时示组合表达时间的意识自古有之。据张德芳的研究,两汉时期河西及至敦煌地区十六时制时间词分别为:夜半、鸡鸣、晨时、平旦、日出、食时、日未中、日中、日失、餔时、下餔、日入、昏时、夜食、人定、合夜⑦。这些时间词,大多可分析出时基和时示两个核心概念。

(二)现代汉语时间词的内部构成情况

1.普通话词汇中时间词内部构成

本文依据《现代汉语语法信息词典详解》中的“时间词库”对普通话中的时间词作定量分析,该库共收时间词189个。189个时间词中,双音节时间词数量最多,共179个,占总数的95%。三音节词数量很少,只有10个,占总数的5%,分别是“星期一”“节假日”“本世纪”“产褥期”“端午节”“劳动节”“清明节”“上半年”“现阶段”“中世纪”。

为了发现时间词的内部组合规律,我们对189个时间词的构成进行逐个分析,并对每个词的组合方式进行人工标注。统计数据见表1。

表1 时间词的构成方式

表1的数据表明,“时示+时基”的组合方式最多,共137个,占总数的72.5%,其次是“时基+时示”,有36个,占总数的19.0%。只含有时示的时间词10个,分别为“后来”“过去”“将来”等。这些词语实际上是以说话时的时间为参照基点。其他类型指很难分析出组合方式的一类。共6个词语,分别是“白露”“谷雨”“寒露”“芒种”“惊蛰”“黎明”,其中有5个词语是节气名词,古已有之。不考虑方式1与方式2内部的区别,时间词中同时包含时示和时基的占总数的91.5%,可见,时示和时基是现代汉语时间的两个核心要素。

2.方言词汇中时间词的内部构成

我们依据《普通话基础方言基本词汇》(词汇卷上)中的“时间·节令”部分考察了时间词的内部构成。初步观察表明,方言词汇中的时间词与普通话时间词的内部构成规律具有共同特性,也包含时基和时示两个核心要素。方言词汇中时间词数量繁多,限于篇幅,我们只以其中4个词目为例进行说明。总共涉及93个方言点,词形相同的只列举其中的一个方言点,见表2。

表2 方言时间词的内部构成

表2中4个词目,共有40种不同表达形式。从内部构成来看,都包含了时示与时基,且大多数采用了时示在前、时基在后的组合方式。如,“头年”“上年”“昨年”“开年”“外前年”“向前年”“顶前年”等。只有少数词语采用了时基在前,时示在后的构词方式,如“年后”“年头上”等。可见,方言时间词构成规律与普通话大致相同。稍有区别的是,方言中三音节时间词所占的比例比普通话略大,有些方言还有四音节时间词。多音节时间词主要是增加了一些语义非常虚的语素,如“子”“儿”“个儿”等等,这种现象在普通话中很少出现。方言词汇中的三音节或四音节时间词,在构词方式上仍然可以分析出时示和时基两个部分。以歙县方言的“外前年”为例,此词的构造包含两个层次。第一层,“年”是时基,“前”是时示;第二层,整个“前年”是时基,“外”是时示。

综上所述,无论是在普通话还是方言里,时间词都蕴含了时示和时基两个核心要素。

二、“时基”和“时示”的主要类型及其理据

(一)时基的基本类型及其理据

1.表时间单位的语素充当时基

表时间单位的语素是最有资格充当时基的,它们也是时基范畴中最活跃的成员。时间单位语素充当时基的时候,其位置可在前,也可在后。

a.时基在前。如:日前、周二、星期四、月底、年初、世纪末、春分、夏至。

b.时基在后。如:半夜、昨日、本周、八月、今年、初春、现代、宋朝、本世纪。

时间单位是人们根据经验或科学测量得到的计量时间的尺度,以它们为时基,能够对时间进行比较准确的初次定位。一般说来,朴素的时间表达不一定使用时间单位语素为时基,但是科学的时间表达离不开它们。

2.表活动的名词性语素充当时基

表活动的名词性语素可以充当时基,其位置一般处于时间词的前面,采用“时基+时示”的构造方式,这一类时间词有:饭前、饭后、课后、课间、事前、事后、战前、战后。

借用某一活动来充当时间的基点,符合时间参考的基本原则。根据李铁根的研究,时间的参考标准有四⑧:(1)以说话人说话的时间为标准,如“今天”;(2)纪年标准,如1996年;(3)天文标准,如“春天”;(4)事件标准,如“出国后”。表示活动的名词性语素充当时基就是以事件作为参照的标准。

3.视觉类名词性语素充当时基

少数视觉名词性语素也可以充当时基,常见的语素是“目”和“眼”,一般采用“时基+时示”的构造方式。如:目前、眼前、眼下。

视觉类名词语素能够充当时基与人类对时间的认知有关,在人们的观念中,时间被当作一种可视的东西,原始的计时就是依靠眼睛观察、度量的。

4.代词性语素充当时基

少数代词性语素可以充当时基,其位置一般位于时间词的前面。常见的语素有“其”“之”“此”等等,如:其后、之前、之后、此前、此后。

此类语素往往能够用来代指某一事件,本质上相当于事件后面加方位词,可对时间定位。

(二)时示的基本类型及其理据

1.表数量的语素充当时示

表数量的语素能够充当时示,它们是时示中的重要成员。其位置可在前,也可在后。

a.时示在前。如:三月、四月、六号、十二点、一九九八年、十六世纪。

b.时示在后。如:周一、周三、初二、初八、星期一、星期四、年三十。

数量语素可以表示顺序义,所以能够对时间进行定位。

2.方位语素充当时示

方位语素是时示范畴中最重要的成员之一,方位语素充当时示,其位置也可前可后。

a.时示在前。如:前天、后天、上午、中午、下旬、前年、后年、中世纪、下世纪。

b.时示在后。如:月中、年中、年前、年后、饭前、饭后、午后、日前、日后、事后。

方位语素充当时示与它本身指示位置的语法功能有关,也与时间的特点有关。时间具有顺序性,所以能够用“前”与“后”来指称⑨。有些方言时间词是由两个方位语素复合而成的。如:“上前年”(成都)、“外前年”(歙县)等。

3.表身体部位的语素充当时示

一些表身体部位的语素能够充当时示,其位置也比较自由。

a.时示在前。如:头天、头年、末日、末年、末世、头晌上午(连云港)、头午上午(济宁)。

b.时示在后。如:周末、月底、月末、年尾、年底、年末、世纪末、月头月初(吉首)。

有时候,身体部位语素可以和方位语素复合充当时示。如,“年头里”(商丘)、“年头上”(兰州),分别由身体部位语素“头”与方位语素“里”和“上”组合而成。

方位语素和身体部位语素都是反映空间关系的,所以可以充当时示。汉语中不少时间概念的词语是从表示空间-视觉概念转变来的。这个演变途径符合人类思维的认知特点。一个词语由表空间义转化为表时间义,是由于隐喻的作用。Heine等将语法化看成是若干认知域之间的转移过程,各个认知域从具体到抽象构成一个等级序列:人>物>事>空间>时间>性质。⑩

4.表自然现象的名词性语素充当时示

部分表自然现象的名词性语素可充当时示,位置居前。如:雨季、汛期、花期。

自然现象类名词性语素充当时示是时间观念在农业生产和生活中的反映,代表了一种朴素的时间观,表达了一种模糊的时间概念。

5.形容词性语素充当时示

一部分形容词性语素可以充当时示,其位置一般在前。如:深秋、盛夏、酷暑、晚秋、白天、白日、黑夜、黄昏、幼年、少年、老年。

这一类时示包括表性状、表颜色和表年岁的形容词性语素。上例“深”“盛”“酷”“晚”表性状,“白”“黑”“黄”表颜色,“老”“少”“幼”表年岁。从认知的角度上看,汉语中的这些形容词代表了一个等级序列上的某个点,因而可以被投射到时间域,起指示时间的作用。

6.代词性语素充当时示

一部分代词性语素可以充当时示,其位置一般居前。例如:本周、本月、本世纪、他日、他年、这天、这会儿、那会儿。

代词性语素具有指示代替的语法功能,因此能够起到对时间定位的作用。

7.表时间的名词性语素充当时示

少数表时间的名词性语素可以充当时示,其位置通常居前。例如:昔日、昨日、昨晚、今晨、今日、今世、明夜、明年、古代、古时。

这些语素在特定的环境中(如成语)有时可以单独使用,单用时本身能够指示时间,具有定位功能,所以能够充当时示。

8.动词性语素充当时示

少数动词性语素可以充当时示,其位置也有两种情况。

a.时示在前。如:来年、来日、去年、傍晚、处暑、立秋、立冬、打秋立秋(重庆)、挨晚傍晚儿(蒙自)、擦黑傍晚儿(成都)、过冬冬至(青岛)。

b.时示在后。如:年终、春分、秋分、夏至、冬至。

动词性语素之所以能够充当时示与时间的特点有着密切的关系。时间是运动的,所以时间又被拟人化,因此出现了由动词性语素充当时示的现象。比如,时间的流动性,可以用“来”与“去”来表示,“来年”“来日”“去年”表示将来与过去的时间。

三、本文的理论价值

(一)对自然语言处理的价值

计算机理解和分析时间意义的前提是识别时间词。因此,需要对时间词进行准确的切分和标注。而实现这一目标必须依靠有关语言知识。关于词类的判定邢福义先生提出了一些极为重要的判定原则和方法,有很高的应用价值。此外,本文认为,有必要将“时基”和“时示”两个核心要素作为判定时间词的另一个重要标准。用以解决时间词标注上遇到的一些困难。先看三例:

(1)眼看婚期临近,家中三封电报催他回家完婚。

(2)桂花的花期都是在中秋前后。

(3)只有在汛期水位升高,方可提前看见这块水域。

我们利用中科院计算所开发的汉语词法分析系统(ICTCLAS)对这两个句子进行切分和标注,结果“婚期”标注为名词(n)。而“花期”和“汛期”均标注为时间词(t)。这一标注结果引起了我们的极大兴趣:同为表达时间概念的三个词语,为什么例(1)标注为名词,而例(2)、例(3)标注为时间词。查看分词软件中的词表,发现“婚期”被界定为名词,而“花期”和“汛期”都被界定为时间词。查阅《现代汉语词典》也未收入“婚期”一词,可见,将“婚期”判定为时间词缺少语言理论的支持。这显然不利于计算机理解和分析句子或语篇中的时间意义。解决这一难题,可以根据本文的结论制定相应的语言学规则,依据规则即可对“婚期”的内部结构做出正确的分析。如前文所述,“婚期”“花期”“汛期”三者结构完全相同,均采用了“时示+时基”的构造方式,“婚”为时示,“期”为时基,“婚期”一词主要的语法功能是对时间进行定位。据此,可将“婚期”判定为时间词。再举两个例子:

(4)如果术前安排做心造影,就可能避免现在的开胸后又毫无意义地关上。

(5)许多医生为术前的诊断、计划和准备工作也付出了大量的心血。

上述两例,“术前”同样没有被收入“时间词库”与《现代汉语词典》,《词表》亦未收入。根据本文的讨论,“术前”可判定为一个时间词,其构成方式是“时基+时示”,名词语素“术”充当时基,方位语素“前”充当时示。它在构造方式上与“事前”“事后”“战前”“战后”等时间词完全一样。

自然语言的信息加工,必须有一套行之有效的编码方法,即人们常说的形式化表示问题。以往的研究对时间词的构成规律及其形式化问题未能引起足够的重视。不能为面向自然语言处理的时间意义研究提供必要的知识支持。正如邢福义先生所言:“许多事实并未描写详尽,对于大量语言现象的认识还处于懵懂状态,远远不能满足中文信息处理的需求,因而跟不上时代发展的步伐。”鉴于此,本文穷尽考察了包括《现代汉语语法信息词典详解》在内的多个时间词表,对时间词的构成作定量分析,从大量的实例中概括出其组合规律。研究表明,现代汉语时间词蕴含了两个至关重要的核心要素“时基”和“时示”,它们是构建汉语时间概念的关键,也最能体现汉语时间词的特点。提出“时基”和“时示”的概念对时间词的形式化表示有重要意义,可以直接应用于汉语词语自动切分和标注、汉语时间词语编码加工,对时间的形式语义研究和自然语言处理研究有重要的理论和实际价值。

(二)对处所词的研究价值

本文揭示了时间词的内部组合规律,指出蕴含在时间词内的两个核心要素:“时基”和“时示”。这一研究思路不仅适用于时间词,也适用于处所词。按照本文对时间词的研究思路,我们发现处所词也可以分析出处所的“基点”和处所的“指示”两个核心要素。处所的“基点”有学者称之为“基准”,即构成方所的实物,例如,“山上”“水里”的基准物分别是“山”和“水”。处所的“指示”是对基点进一步定位的语素,常由方位语素或形容词语素等充当。例如,“地”能够作为处所的基点,它们可以分别与表指示作用的“上”“下”组合,联合构成处所词“地上”或“地下”。

从处所词的内部构成来看,也可分为两种类型。

类型1:“基点+指示”。如:屋里、山上、山下、墙内、墙外、地上、地下、路口、路上、水面、路面、街上、院内、院外、园内、校内、校外、郊外、城里、城外、门前、门后、国内、国外、县里、洞中、洞口、塔顶、路左、星际、背后、空中、海面、心头、心上、体内、身上、身旁、华北、厂里、腹中、湖畔、床下、田头、文中、区内、耳边、岛上、村北、梦中、胸前。

类型2:“指示+基点”。如:外屋、里屋、南方、北方、东面、西面、前台、后台、中游、左角、右角、别处、东侧、西侧、满街、满山、全县、全校、高空、各地、前线、远方、外地、近郊、中途、东郊、左岸、外地、末端、后院。

时间词和处所词分别反映了时间概念与空间概念。从认知的角度来看,时间域和空间域是可以相互投射的,可见,这两个概念域具有某种天然的联系。本文的分析表明,汉语在表达时间和处所概念时都包含了两个核心元素——“基点”和“指示”。这为进一步研究时间词和处所词之间的共性和联系提供了新的视角。

注释

①詹姆斯·爱伦:《自然语言理解》(第2版),刘群等译,北京:电子工业出版社,2005年,第311页。

②俞士汶等:《现代汉语语法信息词典详解》(第2版),北京:清华大学出版社,2003年,第444-449页。

③中国社会科学院语言研究所词典编辑室编:《现代汉语词典》,北京:商务印书馆,2005年,第1-1830页。

④陈章太、李行健主编:《普通话基础方言基本词汇集》,北京:语文出版社,1996年,第2126-2231页。

⑤清华大学计算机科学与技术系、中国科学院自动化研究所:《现代汉语通用词表》,北京:清华大学,2003年。

⑥朱德熙:《语法讲义》,北京:商务印书馆,1982年,第43页。

⑦张德芳:《简论汉唐时期河西及敦煌地区的十二时制和十六时制》,《考古与文物》2005年第2期。

⑧李铁根:《现代汉语时制研究》,沈阳:辽宁大学出版社,1999年,第10页。

⑨李向农:《现代汉语时间词参照定位语表形式——X前/后》,《语言研究》1997年第1期。

⑩Heine,B.,et al.Grammaticalization:A Concept ual Framework.Chicago:The Chicago University Press.1991.

责任编辑 张静

2010-03-29

国家社会科学基金青年项目“基于语料库的关联标记的语体差异性研究”(09CYY035);华中师范大学“211”工程重点学科建设项目“中华文化繁荣发展中的汉语学科创新”子课题(YYZX0916)

猜你喜欢

语素现代汉语方言
方严的方言
方言
现代汉语位移终点标记“往”
“楞”“愣”关系及“楞”在现代汉语中的地位
《最低入门等级音节、汉字、词汇表》语素和语素义分析
多义语素识别及教学探讨
——针对对外汉语语素教学构想
说说方言
留住方言
语素的判定、分类及语法单位关系研究述评
因果复合词