APP下载

论语料库语言学的学科地位

2014-03-25李华勇

关键词:经验主义理性主义弗斯

李华勇

(四川文理学院外国语学院,四川 达州 635000)

一、引言

1967年在美国Brown大学建成100万词的现代美国英语语料库,是真正意义上的计算机语料库,标志着现代语料库的诞生。“语料库语言学”逐渐受到国内外语言学界的青睐,逐步发展成为一门极具潜力的交叉学科。随着计算机和网络技术的迅速发展,国内外各路学者都不同程度地加入了语料库研究大军——对语料库或者利用语料库进行研究,并取得了大量的研究成果。然而,由于各路学者的学术背景、研究目的或使用语料库的程度各不相同,国内外学者对语料库语言学的(学科)地位认识和理解也产生了严重的分歧:第一种观点认为语料库语言学只是一种研究方法或研究工具[1],或研究方法上的一个新视角[2];第二种观点认为,虽然语料库语言学有自己特定的研究对象,目前还难以完全确认自己独立的学科地位,但承认语料库语言学获得独立学科地位的条件已经成熟[3];第三种观点认为语料库语言学由于研究对象不同于一般的理论语言学,其内涵已超越了一般意义上的方法学,成为一门具有全新视野和方法的学科[4-6]。第一种观点只看到了语料库语言学的工具和方法属性;第三种观点表面上看是主张语料库语言学已具有独立学科地位,就其实质来讲是主张彻底的语料库驱动的方法——它不依靠任何语料库之外预设和给定的理论,强调语料库语言学的自足性,它实质上是语料库语言学具体研究方法中的语料库驱动方法;第二种观点虽然不完全承认语料库语言学的学科地位,但是已经上升到不再把它看成一种具体方法和研究工具了。语料库语言学经过近40年的发展,现在语料库语言学是不是具有了完整的学科地位呢?经查阅最近几年的相关文献,国内学者从语料库语言学的方法论和相关理论[7]、研究视野[8]、研究范式[9]、语言学思想起源[10]等作了与语料库语言学学科相关方面的论述,但还没有对语料库语言学的学科地位进行完整和系统的论述。

二、语料库语言学的哲学基础:经验主义和科学的理性主义

语料库语言学以经验主义和科学的理性主义为哲学基础。经验主义(empiricism)是和理性主义(rationalism)相对立的一种哲学思想,这两种哲学思想深刻地影响着近代语言的发展和研究。经验主义诞生于古希腊,是一种认识论学说,认为人类知识起源于感觉,并以感觉的领会为基础。在英国,大卫·休谟(David Hume)、约翰·洛克(John Locke)及乔治·贝克莱(George Berkeley)并称英国三大经验主义者。理性主义(Rationalism)是建立在承认人的理性可以作为知识来源之上的一种哲学思想,高于并独立于感官感知,17~18世纪主要在欧洲大陆传播,以勒内·笛卡尔(Rene Descartes)、伊曼努尔·康德(Immanuel Kant)为代表。乔姆斯基(Chomsky)创立的转换生成语言学就是以笛卡尔的理性主义思想为哲学基础,认为一切语言知识来源于理性,语言实质上是指语言使用者抽象的语言能力而不是其具体可观察的语言行为,是不可能通过观察和分析外在的语言行为事实获得的。他认为人类的大脑与生俱来就有一种天生的语言习得能力,作为语言学家只需要研究存在于人脑内部用于生成语言事实的那些规则。转换生成语言学把语言学家通过自己的“直觉”获得的内省数据和编造的句子置于首要的核心地位,声称这些内省数据和句子可以对语言“进行描写甚至作出解释”[11]。转换生成语言学一方面认为言语事实太混沌无序,个体差异太大,不能成为语言学研究的对象;另一方面,在缺乏研究语言材料的情况下,不得不依靠自己的直觉编造出一些句子,并根据这些句子推理和演绎出一系列生成句子结构的规则。这其中的矛盾之处在于:一方面认为普通人的言语不可靠,不能成为研究对象,但是另一方面又把自己凌驾于普通人之上,用自己的语言直觉编造出所谓的理性语言来确立解释语言的规则。更为重要的是置这些规则不能解释日常生活中的大量语言现象于不顾,存在不能对所有语言现象进行全面解释的不足。

语料库语言学是以人们日常生活中产生的大量真实语言材料为研究对象的,通过对这些海量真实语言材料进行检索、统计、分析和解释来探求语言规律。真实语言材料而非“直觉内省”语言材料是语料库语言学的一大特点,由海量语言数据的检索和分析去发现语言规律而非从理论到理论的推理得出结论是其另一大特点。从语料库语言学的这两大特点可以看出其哲学基础是经验主义的。语料库语言学一方面借用现代技术手段对大量的真实语言使用事实进行检索、统计和描写,另一方面还要对这些语言事实进行更加深入的解释和概括。可见,语料库语言学一方面强调对语言使用事实的描写,同时另一方面也不排斥理论上的演绎推理。这样看来,语料库语言学中也弥漫着理性主义的因素。我们把语料库中这种弥漫着的理性主义的因素称作温和的理性主义或科学的理性主义:在研究中不把理性推理看成是获得知识的首要的决定性的因素,不作理论预设或者说不依靠任何理论为前提,只是对研究结论进行温和的、适度的和符合语言使用实际的演绎和推理。

建立在经验主义和科学理性主义融合基础上的语料库语言学是符合现代语言学研究发展趋势的。虽然从本质上来看,经验主义和理性主义是根本对立的两种哲学思想,但20世纪以来,经验主义和理性主义并存和整合的现象日趋明显[12]。这两种哲学思想的融合也体现在语料库语言研究中:随着科学技术的进步和发展,人们对语言认识的加深,经验主义语言观一方面注重经验,同时也汲取理性主义的合理因素;既注重真实语言事实材料的收集和观察,又注重对这些材料的归纳和推理,同时还不排斥语言学家的内省和直觉。语料库语言学将经验主义和理性主义整合的哲学思想完全符合现代语言研究战略转移的方向。在战略转移中,我们应像蜜蜂那样,把理性主义和经验主义两种机能“更紧密地”、“更精纯地”结合起来,推动语言学的发展[13]。20世纪的语言学发展史是理性主义与经验主义斗争的历史,斗争的结果是两种哲学观的融合,语料库语言学将发展成为新时期语言学研究的主流方法[14]。语料库语言学将成为语言学研究的主要研究范式,并将更好地践行经验主义和科学的理性主义整合的哲学思想,扬长避短,推动现代语言研究的深入发展。

三、语料库语言学的理论基础:弗斯语言学派思想

语料库语言学以弗斯语言学(Firthian linguistics)思想为语言理论基础。弗斯(Firth)是英国语言学的奠基人和第一位语言学教授,创立了声名远扬的伦敦学派(London School)。他的语言学思想和研究方法有别于现代语言学之父索绪尔(Saussure),也不同于布龙菲尔德(Bloomfield)为代表的美国结构主义语言学,与乔姆斯基(Chomsky)开创的转换成生语言学更是差异巨大。他的语言学思想被称为弗斯语言学(Firthian Linguistics),与之相关的学者则被称为弗斯派学者(Firthians)。McEner、梁茂成把弗斯派的发展大致分为三个阶段:第一阶段,以Firth在世时及其创立的伦敦学派时的主要人员Sydeny Allen,Jack Camochan,Eugenie Henderson,T.F.Mitchell等被划为弗斯学派;第二阶段,Firth死后,Michael Halliday,John Sinclair,Angus Mcintosh,Peter Strevens继承并发展了弗斯学派语言学思想和方法:Halliday开创的系统功能语法,Sinclair等人在词语学、话语分析和语料库语言学取得了丰硕成果,他们被称为新弗斯学派(Neo-Firthians);第三阶段,20世纪70年代后,随着语料库语言学的兴起和发展,新弗斯学派学者(主要有 Sinclair,Stubbs,Hoey,Teubert,Antoinette)在该研究领域独树一帜,将弗斯的大量语言学思想运用到语料库语言学研究的实践中,借助通过语料库获取的证据和快速简便的计算机检索工具使得弗斯语言学以前抽象的概念和观点变得客观、具体、可信和可操作,他们被称为后弗斯学派语料库语言学者(Post-Firthian Corpus Linguistics)[9,15]。可见,语料库语言学的研究与弗斯语言学思想及弗斯学派的三个发展阶段密不可分,可以说语料库语言学从弗斯语言及第三阶段的弗斯学派语料库语言学学者研究实践中获得语言学理论基础。正是在这种语言学理论思想的指导之下进行的各项研究实践,才使语料库语言学具有了强大的生命力和成为世界语言研究的主流,也才能使语料库语言学逐渐成为一门新兴的显学。

(一)语料库言学的基本语言观

索绪尔把语言看成是一个完整的符号系统,具有分级分层的形式结构。乔姆斯基创立的转换生成语言学把语言看成是一种心智现象,研究核心聚焦于抽象的、存在于人脑的、受普遍语法控制的语言能力。认知语言学同样把语言观看成是一种心智现象,尽管在解释这种心智现象时强调社会环境和语言使用对语言知识产生的重要性,但认知语言学力图从心智空间、引喻转喻、意象图式和语法化等机制来解释语言的形式和意义。语料库语言学另辟蹊径,把语言视为一种社会现象、社会行为,主张语言研究应该聚焦于外化的、可观察的社会语言行为。弗斯受实验科学和经验主义认识论的影响,坚持反心智主义立场,力主基于可观察的语言事实,用实证方法研究语言,他明确宣称:

As we know so little about mind and as our study is essentially social,I shall cease to respect the du-ality of mind and body,thought and word,and be satisfied with the whole man,thinking and acting as a whole,in association with his fellows.[16]

世界著名语料库语言学家Teubert明确指出:“Corpus linguistics is based on the concept that language is a fundamentally social phenomenon.”[17]把语言看成一种社会现象和社会行为的语料库语言学,必然要求它的研究对象是外化的语言而非内化的诸如心智、意象、心理空间等抽象的语言概念,必然要采用调查、统计、数据获取和处理等社会科学研究方法来研究语言的形式、意义和功能等。

(二)语料库语言学一元论基本立场

语料库语言学把语言看成是一种社会现象、社会行为,必然坚持语言一元论(Monism)的基本立场。索绪尔的结构主义语言学坚持的是二元论立场,提出了语言和言语、能指和所指、历时和共时的二元区分。乔姆斯基从理性主义立场创立的转换生成语言学,提出了语言能力和语言行为的二元区分,并把研究的焦点放在语言能力上。而语料库语言学家坚持语言一元论立场,从弗斯、Halliday到Sinclair的弗斯语言学派学者都坚持语言一元论立场,认为语言既然是一种社会现象和行为,那么语言与思想、思维、个性、其他行为一起组成完整的整体,不应该作二元区分。在语料库技术和语料库语言学产生之前,对语言进行二元区分有其合理的成分。那时,一方面受结构主义和理性主义思想的影响,另一方面语言学家可以获取的语言证据数量及其途径极其有限,受科学技术和个人视野的限制,做出语言和言语、语言能力和语言行为等二元区分,并将研究聚焦于抽象的语言和语言能力,并凭借语言研究者的个人语言直觉编造例句对语言作出解释,成为一种最简便、最容易操作的最佳选择。随着计算机和网络技术的发展,语料库技术已经使语言研究者从数亿级,甚至数十亿级库容语料库中获取所需特定真实语料文本变得迅速、简便;这些海量的真实文本不是孤立的、脱离语境的和凭直觉内省的句子,而是基于语境的真实文本,同时这些文本还兼具共时和历时的特性,(监视语料库)甚至还能提供实时详细记录特定语言变化过程的详细数据和文本。通过语料库技术获取的这些真实海量文本,很难区分出它们是语言还是言语,是语言能力还是语言行为,是共时的还是历时的,以前这种二元对立区分的界线已经被语料库技术获取的这些文本给模糊和消融了。可见,语料库语言学坚决反对语言的二元对立区分,主张语言一元立场,把语言这种社会现象和行为看成与思想、思维、个性和其他行为一起组成的完整的整体,在一元论立场之上对语言做出的描写和解释是有其坚实的语言使用事实和科学依据的。

四、语料库语言学的研究对象、研究目的和研究目标

由于语料库语言学坚持一元论的基本立场,反对对语言进行二元区分,因此它的研究对象就必然严格限定为真实的语言使用(即文本)。语料库语言学将其研究对象限定为真实的语言使用,有利于深化对语言的型式、规律、意义和语用等方面的研究,进而使得这些问题的研究具有坚实的语言基础以做出符合语言常规的全面解释和得出符合语言使用实际情况的结论,从而避免以前那种由理论到理论的空对空的推演,得出不符合语言真实使用实际情况的理论概括的危险。

语料库语言学研究的主要目的是研究语言的意义,这里的意义不是结构主义语言学那种脱离语境的纯形式意义,而是结合了语境、形式、语义和功能的意义。在语料库语言学一元观中,语言的形式、结构与意义及功能是一个统一整体,它们都在使用中得以体现[8]。因此,对语言意义的研究不能脱离形式,也不能不顾及功能,更不得离开语境。语料库语言学认为任何意义都只能存在于特定的形式和语境之中。对语言意义的解释只能使用语言来解释,只能在文本中获得解释,正如Teubert声称的那样:一切知识和文化都体现在文本中[5,18]。对意义的研究必须基于文本是语料库语言学对意义研究的一条核心原则。对意义的研究和解释,语料库语言学和其他语言学的不同之处在于它既不像结构主义和转换生成语言学那样去寻找真实语言使用之外的“理想语言”,也不像认知语言学和心理语言学那样去寻找“心理(智)语言”,更不像逻辑语言学那样去寻求“形式化公式”,而是利用真实使用中的语言,结合语言的语境、形式、语义和功能来解释语言。Teubert指出语言只能用语言来描述和解释,而不是用别的什么[5]。

语料库语言学的研究目标是通过海量语言的使用实例的检索、统计、分析并结合相关语言理论和语言研究者的语言直觉,探索语言各层面的规律、全面揭示语言本质、指导语言学习和构建语料库语言学的应用理论。

五、语料库语言学的研究方法和一系列研究工具

现代语言学追求对语言解释的普遍性、概括性、科学性这三重研究目标,不论是结构主义语言学,还是转换生成语言学、系统功能语言学和认知语言学都以此为重要目标。语料库语言学同样要追求对语言解释的普遍性、概括性和科学性这三重研究目标,为了实现这三重目标,语料库语言学采取基于语料库和语料库驱动的研究方法,定性和定量相结合的方法,实证为主和内省相辅的方法。

Tognini-Bonelli首次将语料库语言学的研究方法区分为基于语料库(corpus-based)的研究方法和语料库驱动(corpus-driven)的研究方法[6]。基于语料库的研究方法利用语料库获取的大量语言数据去证实或证伪现有的语言理论、语言描述或语言解释,它不企图创立新的理论和改变原有语言理论的概念范畴体系。从总体上来说,它是一种至上面下(up-bottom)的研究方法,即先有理论后用语料数据验证,这种方法只能验证理论不能直接构建新的理论。语料库驱动的研究方法则是以语料库提供的语料作为出发点和唯一研究对象,在对通过语料库技术获取的语言数据进行充分观察、统计和分析的基础之上,对这些数据反映的语言现象进行全新的描述,然后构建新的语言理论来对这些使用中的语言现象进行解释和构建新的语言理论,从而实现新的理论突破。它是一种纯正的至下而上(bottom-up)的研究方法,是完全由语料数据到理论的经验主义方法的典型代表,它反对对语料库进行任何形式的标注(tagging)和进行理论框架预设。现在的语料库语言学在研究方法上呈现这两种方法相融合的趋势,扬长避短,以展现语料库语言学的强大描写力和解释力。

语料库语言学还是定性和定量相结合的研究方法的典型代表。语料库语言学中的定性是指对语料研究的深度即对语言描写的精度,它可以帮助我们更加深入地认识语言问题的本质和核心,可以对定量研究所发现的语言规律和变化趋势做出深度的原因分析。定量是指对语料研究的广度即能够描写和解释多少语言素材,可以让我们更加直观和广泛地认识该语言现象,通过定量研究获取的语言数据可以发现语言发展和变化的趋势。定性和定量研究各有长短,语料库语言学做到了对这两种方法的扬长避短,能够深入和广泛描写、解释日常生活中复杂的语言现象。

尽管语料库语言学是以真实使用中的语言为研究对象进行的基于观察、统计、描写和分析的实证研究,但是在通过对真实语言数据分析得出的结论做出合理的解释和构建相关语言理论时,又不得不用到语言研究者的语言直觉和内省理性思维。因此,语料库语言学又采用以实证为主和内省相辅的研究方法。

语料库语言学还采用共时和历时相结合的研究方法。语言的发展和变化是在共时和历时两个维度上进行的,语言在共时变化时具有概率性特征,语言历时变化具有历时和文化继承性特征,是文化和知识的积累过程,这些特征都沉积在语料库的文本中。为了对语言做出全面合理的描写和解释,语料库语言学在对文本进行观察、统计、分析和解释时,可以采用共时和历时相结合的研究方法。

为了能够迅速方便地建设和使用语料库,语料库语言学家开发了一系列的软件工具。例如,在建库阶段有EditPad Pro等文本编辑工具、Power Grep等文本整理工具、CLAW4和Tree Tagger等自动词类赋码工具;在语料库检索阶段有WordSmith Tools、Concordance和Power GREP等工具;在数据统计阶段还SPSS等工具。同时还有各类基于网络对大型语料库进行检索和分析的工具。语料库语言学有了属于自己的一系列研究工具,顺应了网络技术和计算机技术的发展,使语料库语言学对语言的研究带有了科学基因,促使语言研究朝着精确化、客观化、科学化方向发展。

六、语料库语言学的应用前景

语料库语言学是顺应语言研究战略大转移发展趋势和语言研究朝更客观化、更精确化和科学化发展的要求,并融合了计算机技术、普通语言学、心理语言学和外语教学等学科而诞生的一门交叉学科,有着广泛的应用前景。

(1)辞书和语法书编撰。《牛津高阶学习词典》(Oxford Advanced Learners Dictionary),《朗文当代英语词典》(Longman Dictionary of Contemporary English),《柯林斯高阶英语学习词典》(Collins Cobuild Advanced learner’s English Dictionary),《当代英语语法(1972)》(AGrammar of Contemporaneity English 1972),《英语综合语法1985》(A Comprehensive Grammar of the English Language 1985)等都是在英语语料库运用在辞书和语法书编撰中产出的杰出代表[19]。

(2)外语教学。语料库从一开始出现就与外语教学有着密切联系,通过语料库来探索外语教学规律、组织外语教学活动和为外语教学获取真实语言使用实例等,都体现了语料库语言学服务于外语教学的实践。

(3)机器智能翻译。机器智能翻译的实现一方面依赖于计算机对自然语言处理的研究技术突破,另一方面也依赖于大型语料库的数据支持。

(4)教材和大纲设计。基于大型语料库编写出来的教材和大纲比起基于经典文学作品和编写者的“语言直觉”编写出来的教材和大纲更加符合语言学习的要求和更能反映真实的语言规律,从而有利于语言学习者的语言学习。

(5)深化对语言词汇、短语、句法、语用、语篇和历史文化的相关研究层面。利用语料库可以深化对该语言从词汇到语篇和相关历史文化的研究,使对该语言的各层面的研究更加科学化和客观化,从而有利用对该语言的规律的掌握,这是语料库语言学的最重要的研究和应用领域。

(6)专门用途语言研究。利用相应的专门用途语言文本可以建立专门用途语料库(Corpora for Special Purpose),通过专门用途语料库可以对这些专门用途语言的特点进行探索,找到这些专门用途语言的规律,为专门用途语言的教学、学习和科学研究服务。

[1]McEnery T,Wilson A.Corpus Linguistics[M].Edinburgh:Edinburgh University press,2001.

[2]崔艳嫣,黄瑞红.语料库语言学研究方法之哲学思考[J].云南师范大学学报,2010(4):1 -4.

[3]Renouf A.Corpus Linguistics past and Present[C]//卫乃兴,等.语料库应用研究.上海:上海外语教学出版社,2005:1-5.

[4]Aarts B.Corpus linguistics,Chomsky and fuzzy tree fragment[C]//Mair C M.Hundt Corpus Lingustics and Linguistics Theory.Amsterdam:Rodopi,2001:5 -13.

[5]Teubert W.Writing hermeneutics and corpus linguistics[C]//Teubert W,Krishnanurthy R.Corpus Linguistics Critical concept in Linguistics.London and New York Routledge,2007:134 -159.

[6]Tognini-Bonelli E.Corpus Linguistics at work[M].Amsterdam and Philadelphia:John Benjamins Publishing Company,2001.

[7]卫耐兴.语料库语言学的方法论及相关理念[J].外语研究,2009(5):36-42.

[8]李文中.语料库语言学的研究视野[J].解放军外国语学院学报,2010(2):37 -40.

[9]梁茂成.语料库语言学研究的两种范式:渊源、分歧及前景[J].外语教学与研究,2012(3):323-335.

[10]卫乃兴.语料库语言学的弗斯学说基础[J].外国语,2008(3):23-32.

[11]Chomsky N.Aspects of the theory of Syntax[M].Cambridge:MIT,1965,20.

[12]陈勇.论经验主义和理性主义之争——关于西方语言学研究中的认知论[J].外语学刊,2003(3):57-62.

[13]冯志伟.论语言学研究中的战略转移[J].现代外语,2011(1):1-10.

[14]梁茂成.理性主义、经验主义与语料库语言学[J].中国外语,2010(4):91-95.

[15]McEnery T,Hardie A.Corpus Linguistics:Method,Theory and Practice[M].Cambridge:CUP,2012:122 -143.

[16]Firth J R.Papers in Linguistics:1934 -1951[C].London:OUP,1957 .

[17]Teubert W.Corpus linguistics-A partisan view[J].TELRI Newsletter,1999(8):4 -19.

[18]Teubert W.My version of corpus linguistics[J].International Journal of Corpus Linguistics,2005,10(1):1 -14.

[19]钟兰凤,张王璘.基于语料库的汉英词典研编面临的挑战及对策研究[J].江苏大学学报:社会科学版,2012(2):62-66.

猜你喜欢

经验主义理性主义弗斯
包豪斯理性主义设计思想刍议
总得有人去擦星星
从理性主义到历史唯物主义——马克思利益观的形成理路研究
批判的语境经验主义:数据与语境
——第十七届《哲学分析》论坛专题研讨之二
思 辨
走出经验主义、拿来主义迷津——苏宁峰《表现论视野下中学语文的批判性解读》序
走出经验主义、拿来主义迷津——苏宁峰《表现论视野下中学语文的批判性解读》序
爱心树(上)
西西弗斯的神话
阁楼上的光