APP下载

中国二语词块研究中的概念辨析

2023-03-07秦晓晴

肇庆学院学报 2023年6期
关键词:语块词块程式

刘 凌,秦晓晴

(1.湖北工业大学外国语学院;2.华中师范大学外国语学院,湖北 武汉 430070)

词块研究一直是国内外研究的热点,以“词块”“语块”“词束”“程式语”为关键词在“中国知网”核刊和C刊上搜索到20篇2003年以来的综述类论文,以“lexical chunk”“lexical bundle”“formulaic sequence”“multi-word unit”为关键词在Web of Science 中搜索到9 篇2000 年以来的综述类论文。限于篇幅,本文的讨论仅基于国内综述论文。中国外语研究界在20年时间涌现出20篇不同侧重的词块综述类研究,一方面表明词块研究无论数量还是角度都比较丰富;另一方面也显示学界对于词块研究仍然存在诸多不确定性。其中,词块的概念和分类的界定以及研究方法的适用性等存在诸多分歧。本文在梳理前人综述研究的基础上,分析词块无法界定的原因及其影响,强调明确词块概念、术语、和分类的紧迫性,并就词块界定提出建议。

一、词块概念界定问题现状

国内外词块研究中,术语层出不穷,导致“公式语言的研究缺乏明确统一的方向,其方法和假设也各不相同。在子语言内部和跨子领域(例如儿童语言,语言病理学和应用语言学)中,同一事物使用了不同术语,不同事物使用了相同术语,并且识别所采用的起点完全不同”[1]4。对于词块术语的多样性及定义和分类的不统一,国内学界总体态度不断变化,对词块的综述和实证研究均带来相应影响。

(一)学界对词块概念界定问题的态度演变

早期综述文章主要关注词块现象及支撑理论的引介,推动国内学者开展词块的本体与实证研究,多术语现象并未得到足够关注,表现在提及多个术语但未加质疑和解释,或者回避多术语的事实,只选用某一个术语。后来逐渐有学者开始意识到词块“尚无明确的定义”“理论上对语块的定义、识别和分类还存在分歧”的状况[2],或者借用Wray 的统计,指出“学术界对语块的叫法有50 多种,现在也没有一个公认的定义”[3]。这时期的国内研究者开始感知词块术语多样、定义不统一的现象,并从“基于语块特征的侧重点”或“基于研究者不同研究目的”的角度进行解释。

进入2011 年,开始有学者对词块术语的多样性、定义和分类标准的不统一表示担忧,在综述中指出术语和界定的不统一会影响制定标准化词块知识测试量表,从而导致研究中测试形式不一,研究结果不一致[4],不利于人们对不同研究进行比较并从中得出普遍性结论[5],所得的结论不是以偏概全,就是以全概偏[6]。令人遗憾的是,这些质疑并没能推进词块术语、定义及分类标准的统一和明确。于是,研究者纷纷根据各自的研究目的选择词块的界定和标记方式开展研究。这种妥协的态度“在一定程度上阻碍了不同学科中程式语研究的交流与借鉴,使人们难以全面地认识和领会程式性现象的本质和功能并自觉地应用于语言理解、产出与习得等过程中”[7]。

(二)词块概念界定分歧的影响

事实上,词块界定的不统一给综述和实证研究均带来巨大困扰。综述类研究基本停留在对词块及其研究的“复杂性”的描述上,这类强述弱综的论文客观上是“由于使用了不同的公式语言定义,因此很难准确地比较这些研究”[8]。其结论或者空泛、缺乏针对性,或者有失偏颇。也可能因为调查的单词组合类型不同,提取和分析的方法不同,导致各个研究之间结论相互矛盾。正如Paquot & Granger所指出的,任何文综,乍一看,似乎都强调了矛盾的结论,但实际上这只是数据和方法相当大的异质性所导致的结果[9]。为避免上述问题,一些学者选取聚焦词块中某一分支类别的研究进行综合分析,确保在可比的基础上形成规律性结论。黄四宏&詹宏伟只将针对习语的词块研究纳入其综述研究[10];何安平则将纳入其综述研究的研究对象统一在“语料库语言学视角下”[11]。还有一些学者对被综述的研究依据研究对象的不同进行分类综述,比如分为习语式程式语和非习语式程式语[12-13]。

词块界定的分歧也影响了实证研究的有序开展。各种各样的方法和术语导致程式化语块研究的混乱。在某些情况下,差异只是术语上的差异,不同的术语实际上是指同一构造[14]4。此外,在多达20项综述研究的学者中,仅有四位坚持开展了词块的实证研究。术语、定义和分类不统一是导致关注词块研究的研究者无法开展进一步实证研究的重要因素之一。那些开展实证研究的研究者对词块术语和定义及分类的不确定,采用了不同的研究策略:有的学者选择词块的不同子类进行研究,有的学者坚持对同一类词块开展系列研究。前者如段士平,他的实证研究,选取的对象既有机切词块[15],又有模糊限制语词块[16-17];王立非团队的实证研究,选用的是机切语块,但却按照Nattinger & Decarrico的分类标准对机切语块进行分类[18-19];李更春的研究主要对比程式语和非程式语的加工,在程式语选择上既有借鉴研究所使用的词块的[7],也有综合借鉴Schmitt,Jiang, N. & T. M. Nekrasova 以及Biber等人的研究,选定纳入研究的词块[20]。后者如何安平及其团队,他们始终把研究对象限定在机切词块[21-25]。

由此可见,词块界定的分歧导致既无法在研究者之间也无法在个人的系列实证研究之间形成合力,最终必然难以实质性地推动词块研究。Wray就曾指出,“在发现更大,更通用的模式方面几乎没有进展”[1]5。

二、阻碍词块界定达成一致的原因

针对词块研究缺乏统一界定和分类标准的状况,学界也曾迫切地希望能统一认识。然而,从2009 年5 月16—17 日,“首届全国语言语块教学与研究学术研讨会”在中国对外经济贸易大学隆重召开之后,历经十来年如火如荼的研究,目前依然无法界定,不禁促使研究者们寻找“尚无定论”的原因。

(一)词块形式多样性

多样性是学界提及最多的原因。“语块或套语的多样性决定了对其定义的难度,目前几乎不可能下一个全面的定义”[26]53。“我们认为,程式语难以界定的原因主要在于其多样性(diversity)[20]”。“兼具语法和词汇”的特点可能是导致词块复杂多样的主要原因,但多样性并不必然导致其无法界定。笔者倾向于造成词块界定长期无法达成共识的主要原因是:为其背书的理论多种多样。

(二)支撑理论多样性

一个现象或领域的早期研究通常是引介,并为围绕该现象和领域开展研究的必要性及重要性背书,词块研究也不例外。不同的是,开启词块研究意味着既要挑战词汇、语法“二分”的传统语言观,又要挑战20 世纪60 年代以来成为学术主流的生成语法观。传统的语言学观点认为,语言是独立的次系统,词汇规则和语法规则长期二分[27]。生成语法观的倡导者乔姆斯基将词块边缘化,他提出两点理由:一,核心语法可以用普遍语法的参数原则来描述,而标记成分和构式属于分布不够普遍的边缘语法[27];二,语块不能进入词库,因为原子词库(Atomic Lexicon)中只存放最小的语言单位—词素,语块是在词素的基础上根据规则生成的[10]。“随着乔姆斯基的句法结构的方法越来越突出,程式语越来越被边缘化”[1]8。“特别是在美国,由于乔姆斯基语言学的强大影响以及它对生成所有话语的句法规则的强调,多词序列很少受到重视”[28]。为了让词块研究重新获得应有的关注,支持者们必须从各个角度援引理论。最常见的有四个理论:形式语言学(formal linguistics),语料库语言学(corpus-linguistics),语用学(pragmatics)和心理语言学(psycholinguistics)[14]4。

从各角度为词块研究提供理论背书有利有弊:一方面能引起学界对词块的相当重视,近二三十年来的词块研究持续成为热点印证了这一点;另一方面,试图综合来自不同出发点和解释力的理论必然导致由于观察角度、理解和标准不同所引发的矛盾和冲突,相互牵扯,不断阻碍学界在词块的界定、术语、分类等方面达成共识。词块的复杂、庞大并非词块难以界定的原因。毕竟,同样在长度、结构、功能等方面呈现多样化、复杂性的单词、句子等语言单位的概念界定问题都已被确定。真正困扰学界对词块进行界定的是一直试图找出能满足各方理论的界定,同时过度关注模糊和边缘化词块。正确对待词块在语言中的地位,需要克服求全心态,不过分突出其存在的普遍性和过度泛化该现象的重要性,更符合词块在语言中真实和应有的地位。同时关照语言的开放选择原则和习语原则,程序化知识和程式化知识,以及词汇和语法相辅相成的关系。

三、统一词块概念界定的建议

词块的界定包括定义、术语、分类三个方面。从上面的原因分析可见,词块研究者囿于“从多方面定义和分类词块”的思路。Wray 指出“文本中程式序列的识别极其困难,主要是因为没有任何能够同时捕获所有相关特征的单一定义”[1]44。

虽然多角度能更全面地开展研究,“横看成岭侧成峰,远近高低各不同”,但在界定不清时开展多角度研究无异于“盲人摸象”。有趣的是,Wray 提出“盲人摸象”论[29],意在鼓励研究者在没有公认标准的情况下,先根据各自的研究问题选择相应的一个或多个词块界定和分类标准开展研究。这种“搁置争议”“协调各方”的建议在词块研究之初能起到“破冰”作用,但如果始终不能在词块概念界定问题上达成共识,长期下来,会导致无法对各研究的结论和发现进行比较与综合,甚至可能导致重复或无效研究。二十年来尝试从多角度确定定义和分类未果,我们可否借鉴已有的语言单位的界定方式来界定词块呢?

(一)基于形式定义词块

从组合形式上下定义一直是语言学界常用的思路。Wary 把程式语定义为语言使用者或学习过程中单词化了的若干单词的组合[1]9-16。戴曼纯曾定义,“语块或套语是由一组词汇粘合在一起形成的大词(big word)或短语”[26]53。术语“多词单元”也隐含着从形式上界定词块。朗文词典从组合形式上给“单词”下定义,“a single group of letters that are used together with a particular meaning”。词块是和词、句一样的语言单位,我们不妨效仿“词”的定义,将词块定义为“a single group of words that are used together with a particular meaning”。

(二)分步完成词块分类

“兼具词汇和语法”的词块同时具备词汇的固定和语法的创新两种特性,这种特性带来复杂多变的组合关系,表现在内部组合和固定性上存在程度上的差异,导致有些词块边界清晰,有些词块边界模糊。随之而来的是,无论从形式、意义、功能、起源哪个角度对词块进行分类,都“存在内在缺陷:类别既不彼此分隔清晰也没有囊括所有的分类”(Hudson,1998 转引自Wray[1]46)。有鉴于此,笔者建议分步骤完成词块的分类,即先将没有争议或争议不大的词块的分类确定下来,对于争议大,特别难以确定的词块则暂缓,通过进一步研究最终确定其分类归属。仿效词典编撰的思路,在大体内容确定的情况下对词块分类进行不断的增删修订。

1. 程式语和词束的内涵与关联

从现有的国内外词块研究而言,词块研究基本使用两种界定方法: 一是采用Wray 的定义,以心理上是否整体储存和提取为标准的程式语[1]9。二是采用语料库方法,以频数为基准确定词块[30-31,14]。双方代表人物对待彼此界定思路的态度不同。Wray 拒绝承认凭借频率来界定的词束是程式语,在她看来,直觉是界定程式语的依据[1]20;Biber & Barbieri 则坚持词束是程式语的一部分[32],他们指出,“像Wray(2002)这样的研究人员低估了使用频率准则研究程式化语言的价值”。Biber及其研究团队通过一系列研究反复验证词束的组合形式和话语功能及不同语域的典型目的和情景特点之间存在复杂的交互对应关系。Boers从大脑加工角度对程式语和词束进行了区分,认为程式语更具备类似词汇的特性,语音、隐喻意义等都有可能影响其吸收和记忆;词束则更具备类似语法的特性,心理感知度低,内部词之间的组合关系非常重要,因为涉及到其衔接功能的实现[33]。Myles & Cordier 则明确指出,“这两种不同类型的FS在概念上是根本不同的现象,一种是指内部认知过程,另一种是指外部语言现象”[14]。可见词束和程式语并不具备包涵和被包涵关系。二者存在根本区别,识别方式和承担的功能不同,共同构成词块的“互补”分支。胡元江(2015)[34]也在其基于语料库的词块研究中指出词块定义有两个维度:一是从形义结合体角度基于短语学的定义,二是从词频角度的基于语料库语言学的定义。有鉴于此,本文主张词块按照基于“直觉”和基于“频数”分成两大类,各自沿用Wray 和Biber 的术语,程式语(formulaic sequence)和词束(lexical bundle)。

词束和程式语这两个分类项可各自进一步细分。基于“整体存储和检索”标准所识别和鉴定的程式语可以根据其内部组成结构和语义透明度分为习语(idiom),谚语(sayings),搭配(collocation)等[33]。词束则根据Biber的建议分为三类:包含动词短语片段的词束(lexical bundles that incorporate verb phrase fragments)、包含从句片段的词束(lexical bundles that incorporate dependent clause fragments)和包含名词短语和介词短语片段的词束(lexical bundles that incorporate noun phrase and prepositional phrase fragments)[35]。

综上,作为与词、句一样的语言单位,我们选用“词块(lexical chunks)”作为与其并列的术语,并比照朗文词典中“词”的定义将词块定义为,“由一组单词组成的具备特定意义的语言单元”。在此基础上,结合学界目前对词块识别和界定的两种主流角度,即“整体存储和提取”标准,使用“直觉”的主观角度和以“频数”标准,使用“语料库驱动”的客观角度,将词块分为“程式语(formulaic sequences)”和“词束(lexical bundles)”。再进一步将两类词块进行细分,程式语可分为习语、搭配、谚语等;词束可分为包含动词短语片段的词束、包含从句片段的词束和包含名词短语和介词短语片段的词束。

2. 统称词的确定

本文建议选用“词块”作为这一语言现象的统称词(umbrella term),而非沿用学界目前普遍采用的“程式语”。一方面,程式语并不能涵盖词束,包括Wray本人也并不十分确定该术语,“最近Wray又使用“语素对等单位”(morpheme equivalent unit)作为语块的名称……可见Wray对语块的命名及定义也不十分明确,也在不断改进和修正过程中”[36]。Myles& Cordier则认为“术语FS(Formulaic Sequence)不应在SLA 研究中用作总称”[14]25。另一方面,“词块”这一术语不仅体现了词块是由词组成的,还体现了组成的词之间密切的联系,包括“高频共现”的联系和“整体提取”的联系。“多词单元(多词序列)”也能满足上述两点,但相比之下,不够简洁。“语块”这一术语也曾被纳入考量,尤其在汉语界的词块研究中,以陆俭明为代表的学者基本都使用“语块”。但考虑到词块和英文的lexical chunk 比较对应,故最终选用词块这一术语。

四、统一词块概念界定的意义

针对词块中存在边界模糊、功能重叠的现象,应效仿学界对词、句的研究,先明确已经达成共识的部分,再专攻有分歧和争议的现象,不断完善词块研究。词块现象也存在“二八定律”,先将承担更多语言功能,更能解释词块本质和习得、教学规律的词块确定下来,集中力量对其展开研究,遵循惠及最广泛的词块研究与教学的策略。一旦在界定上形成共识,国内外的研究就能因此形成对话和合力,即使受限于现有的观察角度和研究方法,导致已达成的词块共识有失偏颇甚或背离,也会因为学界的通力合作而提高纠错、更新、完善的效率。

词块定义和分类的确定还有助于研究者明确各自的研究重点。词块虽然纷繁复杂,但不同的研究领域其关注重点会呈现不同:专注本体研究的研究者,可以对词块追根溯源,观察词块是如何“基于使用”和人类社会一起共同演化,并尝试探究边界模糊,难以确定的词块的归属;专注教学实证研究的研究者,则可以集中精力研究从高频和互信熵两个角度提取的典型词块的教学和习得方法。语言是基于使用,允许语言使用者使用并创造,而非亦步亦趋,逐字逐句地模仿。教学一线的研究者可以先观察最典型词块的掌握程度,并针对最典型词块的掌握中出现的问题去寻找解决方案。唯有如此,才能把研究“连成片”,避免在词块的外语教学和二语习得研究上的“费时低效”。

五、结语

本文通过对国内词块研究,尤其是近二十年的词块综述类研究的梳理,分析词块概念在学界无法达成共识的原因及其影响,再次呼吁在词块的定义、术语和分类上达成共识。无论词块多么复杂,形式多么丰富,其根本上是类似于词、句的语言单位,故建议从形式组合上给词块下定义;同时从两个明显互补的识别和界定角度,将词块分为程式语和词束两大类,并进一步在程式语和词束两个大类中细分类别。一旦在词块概念界定问题上形成基本共识,将极大提升二语词块研究的合力,实现该领域研究的突破。

猜你喜欢

语块词块程式
增程式电动汽车续驶里程的延长优化
英语程式语可学性的语言模因论解读
基于Motor-CAD的增程式电动车发电机设计
高中英语词块教学现状调查研究及应用策略分析
大学英语教学中的词块教学
词块在初中英语写作教学中的应用研究
英语语块在汉英翻译中的积极作用
增程式电动环卫车APU启停控制策略的设计
从语块类型看英语专业大学生语块获取能力与听力理解能力的相关性研究
美国总统就职演说词中的词块研究