APP下载

新文科背景下本科英语专业语言学课程群建设的三条路径
——基于语言学研究型人才培养目标

2023-12-26孟庆楠罗卫华付科

航海教育研究 2023年4期
关键词:语言学人文数字

孟庆楠,罗卫华,付科

(大连海事大学 外国语学院,辽宁 大连 110026)

一、引言

“新文科”这一概念源自美国的希拉姆学院。2017年10月,该校对29个本科专业进行学科重组,将新技术融入哲学、文学、语言等传统的人文课程,为学生提供综合性的跨学科学习与研究平台,并由此率先提出“新文科”的概念。我国的新文科建设始于2018年10月,教育部在《关于加快建设高水平本科教育全面提高人才培养能力的意见》中明确提出了关于“四新”建设的总体部署[1]29。自此,新文科和新工科、新农科、新医科一道,成为高等教育人才培养的“中国方案”[2]5。

所谓新文科建设,其路径就是要融合创新,“要与现代信息技术融合,与其他学科交叉融合,要与相近的专业集群融合,通过这样的融合守正和创新,把新文科建设推向新的高度”[2]7。在新文科建设理念指导下,国内高校英语专业开始进行课程体系建设及人才培养模式改革的思考和探索,并产出了一系列相关论文成果。不过到目前为止,多数成果仅限于宏观层面的探讨,在课程设置的具体操作层面尚缺乏详细阐述。本文以本科英语专业语言学方向课程群建设为例,深入论述如何通过构建跨学科知识体系,真正践行新文科所倡导的复合融通式的人才培养理念。

二、国内语言学研究及语言学方向课程设置现状

我国的语言学研究起步较晚,真正意义上的发展大约是在改革开放之后。据《外语教学与研究》主编王克非介绍,该刊自1957年创刊后十年内发表的四五百篇论文中,与语言学研究相关的仅占3%~4%(1)数据援引自2021年5月15日在湖南大学举办的“第二届理论语言学国际前沿课题高端研讨会”开幕式上《外语教学与研究》期刊主编王克非教授的致辞。。这主要与我国的外国语言文学学科脱胎于外语教学有关——在当时特定的历史时期,外语教师的首要任务是培养具有较强听、说、读、写、译能力的外语人才,再加上当时国内高校的外语教师大多并未受过系统的学术训练,因此在科研能力方面存在先天不足。近几十年来,在一大批留学归国人员的带动下,我国语言学研究正在逐步缩小与世界领先水平的距离,也培养了一大批优秀的中青年学术人才。自2019年至今,国内已有5所院校相继开设了语言学本科专业,其中以外语学科为依托的共有3所,分别是北京语言大学、上海外国语大学和西安外国语大学,这也为传统英语专业的转型与发展提供了一条可行的路径,即将建设语言学本科专业作为未来发展的长远目标。不过,以目前国内大多数院校英语专业现有师资情况来看,要想在短期内迅速完成这一转变恐怕有些困难。因此,不妨先从语言学课程群建设入手,逐步进行相关学术积累和师资力量储备。在2020年4月教育部英语专业教学指导委员会发布的《普通高等学校本科外国语言文学类专业教学指南(上)——英语类专业教学指南》(以下简称《指南》)中,已经明确指出英语专业应开设语言学、文学、翻译、比较文学与跨文化、国别和区域研究五大专业方向课程,其中罗列的与语言学相关的必修及选修课程多达11门[4],这也为英语专业语言学方向课程群建设提供了政策依据。

然而,在“互联网+”和“人工智能”的时代背景下,《指南》中建议开设的语言学方向课程从整体来看与国外语言学研究的最新进展仍有一定距离,未能充分体现新文科建设所倡导的跨学科交叉融合的人才培养理念。语言学研究日新月异,目前正逐渐呈现出以定量研究为主体,与人工智能和机器学习、自然语言处理等学科进行深度融合的发展态势,以往的内省式研究已逐渐被科学的研究范式所取代。因此,这一课程群建设不仅是新文科建设的外在要求,同时也是语言学学科发展的内在需要。国内院校要想真正实现“双一流”建设目标,培养出具有国际竞争力的学术人才,顺应时代的需求,唯有通过增设相关课程,为学生呈现语言学研究的前沿动态,并帮助其构建跨学科的知识体系。否则培养出的学生在未来出国攻读硕博士学位时,便会由于缺乏相关的学术训练,而感到依靠已有的知识储备很难真正与国际学术话语体系接轨。这也为国内从事语言学教学与研究的一线教师提出了更高的要求——只有不断提升自身的学术科研水平,具备在高水平国际期刊发文的学术能力,才能将自己的最新研究成果有效融入课堂教学活动当中,对具有学术潜质的本科生形成有效的学术引领,从而培养出具有国际学术视野和扎实学术功底的创新型人才。从目前语言学成果的国际化情况来看,无论是SSCI还是A&HCI,收录的论文数量大陆高校与我国港台地区高校尚且存在一定的差距[5]。浙江大学刘海涛指出,“成为世界一流的前提是首先要让世界知道,我们很难想象,一个在相关领域论文国际发表数量进不了中国(含港澳台地区)前25的高校,能成为该学科的世界一流”[5]42。由此可见,国内的语言学学科要想真正跻身世界一流的行列,培养出一流的研究型人才,仍然任重而道远。

本文第一作者曾于2017年和2023年分别赴比利时鲁汶大学(KU Leuven)和瑞士纳沙泰尔大学(Université de Neuchtel)进行为期一年的国家公派访学。从这两所院校英语语言文学本科专业的课程设置情况看,其所开设的语言学相关课程的广度和深度均远超国内同类院校。以鲁汶大学为例,其语言学核心课程可谓共时与历时、描写与理论并重,既包括“语法化学说”“古英语与中古英语”等就某一专门领域进行深入探讨的课程,也包括“世界英语变体”等与语言的变异及演变相关的概要性课程[6]42-44;纳沙泰尔大学更是为二年级本科生开设了“二语习得”“心理语言学”“语料库语言学”“话语分析”“语言学研究方法论”等多门专业选修课。而国内院校在本科阶段开设的语言学方向课程大多是零散的,且普遍存在根据现有教师的研究方向“因人设课”的情况,很多本应开设的语言学核心课程因难以找到合适人选而被迫取消。而上述两所国外院校的语言学方向课程均具系统性,且均是“因课选人”。若某一课程在学院内物色不到合适人选,就通过外聘或两所高校教师联合授课加以解决。这自然引发了我们的思考:该如何结合各高校的优势特色资源进行语言学课程群建设,培养厚基础、宽口径的研究型人才,让其在本科阶段便逐渐形成完备的跨学科知识体系和广阔的学术视野,从而为后续阶段的学习与研究打下坚实的基础?这一问题的解决与否将决定我国语言学学科未来能否真正成为世界一流。

下文将基于我们的语言学教学与研究实践,以学科知识体系为学理依据,提出在新文科背景下语言学课程群建设的三条跨学科路径,并结合全球顶级院校的相关课程设置情况,在每条路径的最后列出若干门建议开设的课程,以期能为我国英语专业未来语言学课程群建设以及语言学研究型人才培养提供借鉴。

三、新文科背景下语言学课程群建设的三条路径

(一)语文学路径

语文学(Philology)是一门古老的学问,最早可以追溯至古希腊时期。早期的语文学研究主要指广义的文献研究,包括词源学、语法、文学、批评、文学史、文化史和语言史、对翻译和解释原始文献能力的训练等诸多方面,主要关注经验世界的古老文本和原始资料,与考古学和历史学共同构成古典学研究的三大组成部分,可谓最早的跨学科研究,被称为“学问之女王”[7]162。时至19世纪,西方语文学逐渐分化为语言学和文学两个部分,其中脱胎于历史比较语言学的现代语言学研究发展最快,成就也最为卓越,因此一些学者甚至将语文学等同于语言学。到20世纪初,语文学这一术语在西方整个人文学科中已被逐渐遗忘,仅见于一些学术期刊的刊名当中[8]29。近年来国内逐渐兴起的国别与区域研究,亦与早期将词源学、词典学、民间文学、宗教学与民族文学相结合的民族语文学研究具有密切的联系。

纵观语文学的主要发展历程,其背后一直伴随着“专才”与“通才”之争,以及关于知识的分类与分科问题的探讨。在古代西方,以柏拉图为代表的古希腊哲学家将知识视作哲学之下包罗万象的“知识总汇”。随后,亚里士多德首先尝试根据研究对象的不同,对知识进行分类,这也是欧洲中世纪教会学校由“三目”(语法学、修辞学、辩证法)和“四科”(天文学、几何学、音乐、算数)构成的“七艺”课程体系的雏形,并一直延续至欧洲文艺复兴运动之前。在古代中国,也有关于知识分类的记载,如由“六艺”(礼、乐、射、御、书、数)组成的西周官学,以及由“六经”(诗、书、礼、乐、易、春秋)组成的孔子私学。可见,无论在东方抑或西方,这些古代先贤对于各个知识领域均有所涉猎且能融会贯通。后来,随着人类知识总量的不断增长,人们逐渐发现要想成为通才已不太现实,于是便逐渐出现知识的分科。到了18世纪,高等教育开始出现文科、理科、工科等学科的分化,文科又进一步分为人文科学和社会科学,传统的语文学研究随着语言学、文学等子学科的相继独立而变得名存实亡。然而,近年来人们发现,学科及专业细化的局限性也愈发突出,如学科壁垒林立,培养出来的人才知识面狭窄,难以应对当代科学技术发展愈来愈显著的综合化和整体化趋势[9]15。因此,人们开始重新审视因学科分科过细而带来的种种弊端,逐渐意识到唯有通过各学科之间的交叉融合,才能解决科学研究中的新问题,从而不断推动人类知识的创新和文明的进步。常言道,“合久必分,分久必合”。现代语言学研究未来可通过追本溯源,尝试回归曾经的语文学传统,择善而从,将与古典学研究相关的核心知识体系纳入英语专业的培养方案,不失为一条踵事增华的发展路径。在国内汉语学界,以训诂学、文字学、音韵学为代表的传统小学,就曾依附于语文学。王力曾指出,鸦片战争以前,中国的语言学基本上就是语文学[10]2。

复旦大学历史系长期开设的古典拉丁语、古希腊语等课程,对于英语学习者同样大有裨益。通过这些古典语言的学习,可以更好地了解英语语法中的语气、时态、(名词的)格等语法术语,并能深入认识早期依赖拉丁语语法体系创立的规定性语法(prescriptive grammar)缘何后期逐渐被描述性语法(descriptive grammar)所取代。北京外国语大学、上海外国语大学等外语类院校也长期开设拉丁语、希腊语等古典语言本科选修课。中国人民大学、上海师范大学也组织过古典语言暑期研修班,感兴趣者不在少数。2018年,北京外国语大学还创办了目前国内唯一的拉丁语本科专业,填补了国内在西方古典语言文学专业教学和研究方面的空白。古典语言的学习有助于学生深入了解古代西方文明,把握西方的逻辑思维方式,并熟谙英语中的许多词根和词源。诚然,我们不能机械照搬欧洲中世纪文法学校(Grammar School)的语文学传统,否则培养出的人才自然会与当今社会和时代脱节,但我们完全可以从中汲取一些养分,将语文学的部分核心课程纳入英语专业的语言学课程体系,以此夯实学生的语言基本功,为其后续硕博士阶段学习创造条件。其实,这种专业共建的做法在国外已有先例。英国爱丁堡大学长期设有“古典学与英语”(Classics and English Language)以及“古典学与语言学”(Classics and Linguistics)两个本科专业(2)详见网站http://www.drps.ed.ac.uk/22-23/dpt/utmahlinen1f.htm,这足以说明传统语文学仍有可吸纳之处。我们所设想的语文学路径下的语言学课程群建设方案如图1所示。

图1 语文学路径下的语言学课程群建设方案

语文学路径下的语言学课程群主要围绕历史语言学、普通语言学、拉丁语、词典学、修辞学五个方向展开,不同方向之间有着密切的联系,且每个方向又可延伸出一些相关课程构成子课程群。其中,“拉丁语入门”“古英语入门”以及“古典语文学入门”这三门课程专业性较强,可考虑聘请本校历史系或是其他院校专门从事相关研究的教师在第三学年开设。由于拉丁语难度较大,因此建议仅作为选修课开设,主要侧重对拉丁语语法体系的系统介绍,供感兴趣且学有余力的学生修读。“语言哲学”与“逻辑学导论”这两门课程,亦可考虑与人文学院或是哲学系从事相关研究的教师共同建设。诸如“英语史”等其他课程,对于英语专业出身的教师而言,在经过精心准备后完全可以胜任,而这也有益于拓宽教师本人的学术视野,让其在备课过程中培养一些新的学术兴趣。学生在修读完这些课程后,将对语言学发展历程、英语词根词源以及英语语法学中的相关概念有更加深入的理解,并且在潜移默化中养成追本溯源、求真务实的学术考据和学术规范意识,为今后继续求学打下坚实的基础。

纵观国外许多顶级院校,都为英语相关专业的本科生开设语文学方面的课程。如牛津大学为英语语言与文学(English Language and Literature)专业本科生开设“19世纪以前的英语史”(The History of the English Language to c.1800)课程,并且提供“古典学与英语”(Classics and English)的双学位项目(3)详见网站https://www.english.ox.ac.uk/about-the-course-undergraduate;剑桥大学为语言学专业的本科生开设“历史语言学”(Historical Linguistics)及“英语史”(History of English)课(4)详见网站https://www.undergraduate.study.cam.ac.uk/courses/linguistics;美国加州大学伯克利分校为语言学专业的本科生开设“历史比较语言学”(Comparative and Historical Linguistics)课(5)详见网站https://lx.berkeley.edu/ugrad/major。这些课程说明将语文学乃至古典学相关课程融入语言学课程体系是完全可行的。

(二)数字人文路径

数字人文主要指利用数字技术和人工智能解决人文学科的相关问题,可以说是人文学科在数字时代的自然延伸与发展。而作为其前身的“人文计算”(Humanities Computing),最早可追溯至Roberto Busa神父1946年与IBM公司合作为Thomas Aquinas文集开发计算机索引程序的计划。“数字人文”的正式定名始于2001年6月由计算机和人文协会与文学和语言学计算协会联合举办的一次学术年会,其主题是“数字媒体与人文研究”。会上,Johanna Drucker作了题为“现状核实:数字人文项目与前景”(Reality Check: Projects and Prospects in Digital Humanities)的学术报告。同年4月,ALLC协会主席Antonio Zampolli在意大利比萨召集了一次多学科综合性人文计算研讨会,会后英国雷丁大学David Robey整理发布了比萨会议报告,其中Willard McCarty和Harold Short绘制了一幅关于人文计算的全景知识地图,畅想了数字人文研究的未来发展路径,其修改完善后的版本如图2所示。该图中心的椭圆区域表明不同人文学科具有共同的方法论基础(6)这一方法论共同体涵盖了五种人文计算技术,分别为文本分析(text-analysis)、数据库设计(database design)、数值分析(numerical analysis)、图像处理(imaging)以及音乐信息检索与分析(music retrieval and analysis),并被冠以“通信及超媒体”(communications and hypermedia)这一共同的标签。在早期的版本中,椭圆区域内仅给出了上述五种方法所对应的数据类型。,其上方用双向箭头连接的方块区域展示了若干与人文计算密切相关的学科群。椭圆下方的云状区域为上述学科群所包含的各个子学科及其分支领域。从这一超学科的视角看,文学、历史、哲学、艺术、语言学等不同的人文学科之所以能形成学术共同体并产生一些新兴的交叉学科研究,主要得益于共同的方法论基础。

图2 McCarty和Short绘制的关于人文计算的全景知识地图[11]1225

随着新技术的不断涌现,数字人文研究发展迅速,导致其概念的内涵不断变化,因此目前学界对数字人文研究的认识呈现出多元化趋势。一些学者将其视作对既有人文学科研究方法的补充,另外一些学者将其视作一个跨学科的研究领域或是一种新型的学术活动,还有学者仅将其视作涵盖了多种实践范式的一个伞式标签。然而,无论持有何种观点,数字人文这一概念本身就代表着一种知识的创新,即利用新的工具与方法,将文本转化为结构化的数字,再通过算法对数据化文本实现概览式阅读。数字人文研究为传统的人文研究注入新的活力,并由此拓展了语言学研究的学科边界,这也与新文科建设所倡导的学科交叉融合理念一脉相承。

近年来,全球高校已为培养数字人文研究人才进行了一系列探索与实践。2001年,John Uns-worth在美国弗吉尼亚大学首创数字人文研究生课程;2005年,英国伦敦国王学院设立了全球首个数字人文博士学位授权点,并与新加坡国立大学合作开展了数字人文联合培养博士项目。此外,美国加州大学伯克利分校,英国牛津大学、国王学院,加拿大维多利亚大学等多所国际知名院校,均开设了数字人文本科专业。截至2020年,欧洲已有数字人文本科学位授权点6个、硕士学位授权点22个、博士学位授权点4个和暑期学校3个。根据DHCR网站的不完全统计,全球已有数字人文课程和培养项目超过240个,且世界排名前50的高校几乎都设有数字人文研究中心(7)数据来自南京农业大学包平2021年9月13日“数字人文方法论”在线课程的课件。。而“数字人文”这一概念真正进入我国并受到学界广泛关注,是始于武汉大学王晓光在2009年“教育部人文社会科学研究方法创新论坛”上发表的题为《“数字人文”的产生、发展与前沿》的论文。随后,武汉大学于2011年成立了我国大陆首个数字人文研究中心。次年,台湾大学亦正式成立了“数位人文研究中心”,并且该校自2009年发起的“数位典藏与数位人文国际研讨会”已成为亚洲最大的数字人文国际会议[12]61。在人才培养方面,目前国内院校的数字人文教育主要分为三种培养模式:以专业学位教育为基础的综合教育模式(如内蒙古师范大学2022年创办了国内首个数字人文本科专业、中国人民大学2020年开设了国内首个数字人文学术型硕士学位项目并于2022年8月成功增设数字人文二级学科博士点)、以短期培训课程为主的教育模式(如南京大学2016年开设的“数字工具与世界史研究”本科生课程、南京农业大学2021年推出的“数字人文研究方法论”课程)和以为学生提供参与项目实践及研讨机会为主的项目学习模式(如上海外国语大学语言研究院邀请南京农业大学方志物产研究团队开展的研究生学术训练营活动)。2023年2月,教育部等五部门联合印发了《普通高等教育学科专业设置调整优化改革方案》,其中谈到如何加快新文科建设时,明确提出要“推进文科专业的数字化改造”(8)详见教育部网站http://www.moe.gov.cn/srcsite/A08/s7056/202304/t20230404_1054230.html,这为数字人文相关课程的设置提供了良好的契机和有力的政策支持。而就国内英语专业而言,目前各院校对数字人文的相关了解仍较为有限,多数一线教师虽听说过这一概念,但就如何将其有机融入英语专业现有的课程体系尚缺乏深入的思考。同济大学吴赟认为,英语专业可考虑开设诸如文学与数字文化、电影、媒介与文化、电子文学、技术与文本、故事与地图、多媒介多模态翻译实践、技术传播、计算机辅助翻译等与数字人文相关的课程(9)摘自吴赟2020年11月21日在第17届全国理工类院校英语专业教学研讨会上题为“数字人文与英语专业的新使命”的主旨发言课件。。但是,这些课程大多集中在文学与翻译研究领域,至于语言学方向课程如何与数字人文研究相结合,目前鲜有学者进行过专门的探讨。

武汉大学王晓光将数字人文研究划分为三个层次:(1)方法层:借用新型数字化技术,创新人文学科的研究方法与路径,如语料库建设、文本挖掘、图像自动识别等;(2)工具层:通过深入应用新型软件工具与网络平台,实现人文知识的生产、传播与教学,如数字出版工具、数据库检索工具、GIS系统等;(3)问题层:发现并研究由新型数字技术带来的新兴人文问题,如数字资本主义、数据主权、人工智能伦理等(10)摘自王晓光2022年2月22日题为“全球视野下的数字人文”的讲座课件。。本文认为,与数字人文相关的语言学课程群应主要围绕方法层和工具层进行展开,并以定量研究范式为主体,让学生能利用相关软件或是编程语言进行大规模语料库数据的处理,然后通过数据驱动的方式带动相关理论的构建,并在此过程中逐步形成计算科学的思维方式,让数字人文真正实现对语言学研究的技术赋能。结合我们多年的语言学研究经历及多所世界知名院校的相关课程设置情况,在数字人文路径之下,语文学课程群可考虑开设如图3所示的课程(均为学期课程,每门2学分)。

图3 数字人文路径下的语言学课程群建设方案

这些课程涉及机器学习、数据可视化、文本挖掘、文本编码与标注等多个数字人文研究的子领域,且均具有较为成熟的研究方法和工具。建议学生入学伊始便可开设“数字人文导论”课,让学生尽早了解本领域的前沿动态,并从一年级起针对性地修读一些高数类课程,为搭建相关学科知识体系进行系统规划。如“应用统计软件(R)”“文本挖掘与Python入门”等编程类课程可在第二学年开设,各校也可结合自身的师资实情,用“应用统计软件(SPSS)”等课程来替代。“语料库语言学导论”“计量文体学”“语言学定量研究方法”三门课程应在学生修完“语言学概论”等相关必修课程后,自第三学年起循序渐进开设。对于“多元统计分析”课,建议在第二学年下学期开设,以缓解学生第三学年需修读大量专业课的压力,且学生在此之前应完成高等数学及线性代数等先修课程的修读,具备一定的数学基础,尤其是关于多元正态分布、均值向量和协方差阵等方面的知识。该课程所涉及的聚类分析、对应分析、主成分分析、决策树与随机森林分析等方法,均为语言学定量研究的前沿方法,而其中的部分内容也是“人工智能与机器学习”课程的核心。不同的是,后者还会从机器学习的全过程出发,就数据的准备、模型的评估与选择、人工智能与机器学习及深度学习的关系等问题进行更为系统全面的介绍。因此,建议先开设“多元统计分析”,在学生对相关研究方法形成直观的认识后,再开设“人工智能与机器学习”,供感兴趣的学生进一步深入学习。“大数据分析与可视化”课程可与“人工智能与机器学习”课程同步开设,并更侧重于对大规模语料库数据潜在特征的挖掘以及对结果的可视化呈现与解读。“语料库语言学导论”“计量文体学”等课程均可视作这些机器学习技术在语言学研究领域的应用,因此若学生能熟练掌握这些核心研究方法与技术手段,那么解决实际的语言学研究问题将会变得得心应手,未来的学术发展潜力更是不可估量。

除上文提到的具有数字人文本科专业的国际知名院校以外,还有不少国际知名院校为英语语言及语言学专业的本科生提供数字人文的相关课程。如美国斯坦福大学为英语系学生提供了“数字人文”辅修专业(Minor in Digital Humanities)(11)详见网站https://dhminor.stanford.edu/,芬兰赫尔辛基大学为全校本科生开设“数字人文与社会科学导论”(Introduction to Digital Humanities and Social Sciences)选修课程(12)详见网站https://www.helsinki.fi/en/digital-humanities/teaching,荷兰乌特勒支大学的数字人文研究中心为该校人文学院本科生提供了“数字工具及研究方法”(Digital Tools and Methods)等多门选修课程以及若干与数字人文相关的工作坊及教师培训项目(13)详见网站https://cdh.uu.nl/education/students/bachelors/,美国麻省理工学院的语言学与哲学系(Department of Linguistics and Philosophy)还将“人工智能”(Artificial Intelligence)、“机器学习概论”(Introduction to Machine Learning)等课程作为语言与心智本科专业(Program in Language and Mind)语言学方向(linguistics track)的选修课程(14)详见网站https://linguistics.mit.edu/undergraduate/。这些国外顶级院校的经验做法充分说明了为英语专业本科生开设数字人文相关课程的必要性和可行性。

(三)计算语言学路径

计算语言学(Computational Linguistics),又称自然语言处理(Natural Language Processing)(15)根据冯志伟的观点,“自然语言处理”这一术语主要用于说明方法,而当涉及自然语言处理的基本理论时,常使用“计算语言学”这一术语。二者各有分工,以体现各自的特点[14]3。,是用计算机来研究和处理自然语言的一门交叉学科,横跨文科、理科和工科三大知识领域,近年发展迅速,是计算机科学与人工智能领域的一个重要研究方向,可以说是“人工智能皇冠上的一颗璀璨的明珠”[13]98。早在“数字人文”的概念诞生以前,便已有若干以数字方式处理相关文本的计算语言学研究,因此从某种意义上说,计算语言学研究人员可谓文理交叉融合办学理念的早期践行者。

计算语言学的主要目标可从两方面来看。从工程学的视角看,计算语言学要解决的首要问题是研发一些可用于处理人类自然语言的实用性系统,如机器翻译系统、信息检索系统以及人机交互系统。除这些应用层面的需求以外,计算语言学还有更加科学的研究目标,一是检验一些理论语言学家提出的语法模型及规则系统,如检验生成语法理论能否真正做到仅生成合乎语法规则的句子;二是与认知科学和心理学等学科相结合,通过建立模型来模拟人类分析与识解语言的全过程,尤其是对“花园幽径句”(garden path sentences)等一些复杂语言现象的理解能力;此外,计算语言学还涉及对于人脑中百科知识的结构化存储及表征。Grishman认为,上述工程学与科学两个研究目标应齐头并进,以形成一个良性循环[15]6。

因人类语言的理解与生成是一个复杂的过程,要想构建一个用于处理自然语言的计算机系统就需要先对不同方面的语言学知识进行模块化处理,然后再统一整合。冯志伟认为,建立自然语言处理模型主要需要九个方面的知识,即声学和韵律学、音位学、形态学、词汇学、句法学、语义学、话语分析、语用学以及外部世界的常识性知识。因其中大部分涉及的是语言学知识,因此自然语言处理原则上是一个语言学问题。此外,自然语言处理还涉及计算机科学、数学、心理学、哲学、统计学、电子工程、生物学等八个知识领域,因此是一个多边缘的交叉学科[16]4-6。

从图4可知,计算语言学作为一个交叉学科研究领域,与人工智能、机器学习、统计学均有紧密的联系,并与数据挖掘、数据库、图书馆情报学等其他周边学科共同为文本挖掘提供重要的技术支持。

基于计算语言学的这一交叉学科属性,对那些今后有志于长期从事这方面研究的本科生来说,必须在具有扎实的语言学本体研究功底的同时具备一定的数学和计算机科学基础。在系统梳理了计算语言学的学理基础后,我们认为,要想从本科阶段培养学生在这方面的学术兴趣,可考虑搭建如图5所示的课程体系。“高等数学”及“概率论与数理统计”难度较大,建议每门课3学分,除此之外,其余均为每门课2学分。

图4 文本挖掘及其他相关学科之间关系的文氏图[17]31

其中,“高等数学”“线性代数”“概率论与数理统计”三门课程是自然语言处理的数学基础,尤其是线性代数,对自然语言处理中常用的词向量和词嵌套技术、数据降维、矩阵变换等内容的理解至关重要,应该要求学生在一、二年级至少修读其中的两门。“语义学”“语用学”“句法学”等均为《指南》中罗列的传统语言学研究领域的分支课程,可谓自然语言处理的语言学基础,建议在第二、三学年每学期开设一门。与硕博士阶段的同类课程相比,这些课程在本科阶段应更侧重相关研究的广度,如对各理论流派所采用的不同视角与方法进行简要介绍,而非一味地追求深度和难度,拔苗助长很有可能导致学生产生厌学与恐惧心理。“语料库语言学导论”可作为“语言学概论”的进阶课程在第三学年下学期开设,建议学生在此之前应至少掌握一种编程语言。“自然语言处理概论”和“自然语言处理算法”两门课程是计算语言学的核心内容,主要涉及理论层面,而“数据库与语言处理”及“机器学习”课程则主要涉及实践层面。各院校可结合实际,从“R统计软件”“Perl编程”“Python编程”中挑选一至两门作为先导课程,在第二学年下学期或第三学年上学期开设。若外国语学院暂时不具备相应的师资条件,可先邀请其他院系具有相关研究背景的教师授课,并结合英语专业学生的专业特点及实际需求对与语言学研究相关的内容进行重点讲解,或采用共享课程的方式,将其他院系开设的同类课程纳入英语专业的培养方案,这样便可在不大幅增加相关任课教师教学工作量的同时实现培养复合型外语人才的目的。此外,也可选派一至两名对相关研究感兴趣的英语专任教师全程跟课,并思考如何结合这些编程软件及大规模语料库数据解决相应的语言学研究问题。经过一至两个周期,这些教师便可逐渐具备独立开设相关课程的能力。在此过程中,相关教师还可自发组建若干跨院系的学术科研团队,从而实现校内学术资源的优化配置,产出一些交叉学科的研究成果。

图5 计算语言学路径下的语言学课程群建设方案

上述部分课程在世界一些知名院校与语言学相关的课程体系中随处可见。如中国香港大学为语言学系的本科生长期开设“自然语言处理”(Natural Language Processing)、“计算语言学”(Computational Approaches to Language)、“人文研究中的高级统计学”(Advanced Statistics for the Humanities)等选修课程(16)详见网站https://linguistics.hku.hk/courses/ba-courses/;在英国兰卡斯特大学的英语语言及语言学本科专业培养方案中,第二学年即为学生开设“计算语言学导论”(Introduction to Computational Linguistics)课(17)详见网站https://www.lancaster.ac.uk/study/undergraduate/courses/english-language-and-linguistics-ba-hons-qqc3/;荷兰乌特勒支大学的语言学本科专业在第二学年开始划分方向,其中“语言与计算”方向共分为“语言与计算”(Language and Computation)、“语言数据的回归分析”(Regression Analysis of Language Data)、“形式与自然语言”(Formal and Natural Languages)以及“计算语言学”四个阶段(18)详见网站https://www.uu.nl/en/bachelors/linguistics/study-programme/。这些例证充分说明,在人工智能与大数据的时代背景下,计算语言学已经成为语言学研究不可或缺的重要组成部分。因此,要想真正对标世界一流院校,应为英语专业本科生开设相应的入门级课程。

四、制度保障及未来构想

要确保上述相关课程顺利开设,自然离不开多媒体智慧教室、机房实验室等相关软硬件配套设施的建设。除这些物力和财力保障之外,更重要的是人力保障,具体而言是师资队伍建设以及学校相关政策制度的支持。华勒斯坦在谈及如何打破学科间的壁垒进而重构开放社会科学体系时,对未来的知识机构及行政管理人员提出了四点建议:一是扩展大学内部或与大学联合的各类机构,集合各方学者围绕某些紧要主题共同展开为期一年的研究,自筹经费成立跨学科研究中心;二是在大学内部制定跨越传统界限、具有特定的学术目标且在一定期限内得到资金保障的整合性研究项目;三是采取强制性联合聘用教授的做法;四是联合培养研究生,并强制要求攻读某一门学科博士学位的学生到外系去听一些课程,或从事一些属于外系专业的研究[18]111-113。

这些二十多年前提出的关于理想大学的组织架构及管理模式的一系列设想,即便在今天仍具有积极的指导意义。根据华勒斯坦的观点,理想状态下的开放社会科学研究既要回应当下社会关切的热点问题,开展一些短平快的研究,也要允许学者遵循自己内心的研究兴趣去大胆提出新的中长期研究计划,要给予他们充分的信任和一定的容错空间,并解决其经费方面的后顾之忧。此外,要想真正产出一些创新性研究成果,每名教授都应该同时受聘于两个系,其中一个系的专业与其所拥有的学位有关,另一个系的专业则与他的个人研究兴趣相关。为保证这一想法的顺利实施,每个系应规定至少25%的教授不具有该学科的学位[18]112,如此就会产生一系列创新的组合形式,每个系里的学术讨论、课程设置以及合理的改革观点都将因此而得到改变。此举既保障了学术研究理应具有的专业性与严谨性,同时又不失活力与创新性。与“学院—系部—教研室”这种传统的教学单位组织架构相比,上述这种扁平化的学术管理模式更能有效激发科研人员的学术潜力,让其在与不同学科背景的研究人员进行学术交流的过程中充分汲取其他学科的养分,构建复合融通的知识体系,从而逐步具备独立开设相应课程的能力,同时也可有效打破教学系部主任“一言堂”的做法,通过不同学科人才的集思广益,在更广阔的学术视野下共同谋划未来的专业建设与学科发展。

从语言学学科的发展趋势来看,在新文科的时代背景下,未来与统计学、大数据科学等学科进行深度交叉融合已势所必然。建议可先尝试通过校级科研项目联合立项的方式,让外国语学院从事语言学定量研究的教师与诸如人工智能学院、理学院等其他学院的相关教师自由组建学术团队开展合作科研,力争在语料库语言学、计量语言学、计算语言学等领域产出一批创新性成果,并在此过程中不断拓宽外语学科的边界,发现一些新的学术增长点。此外,这一举措还可为学院的学术梯队建设及未来交叉学科博士点的申报打下坚实的基础。在研究生培养方面,可试行导师组制度,根据学生的论文选题及个人意愿为其配备第二导师,确保其在遇到跨学科具体问题时能得到更加专业的个性化指导。当然,要想顺利推进这一系列举措,还应出台跨学科科研团队考核及管理办法、第二导师工作量计算办法等相关规章制度作为保障。

五、结语

目前国内本科英语专业的课程体系改革已进入“深水区”。随着大数据时代知识更新速度的不断加快以及语言学研究边界的不断拓展,以往以“语言学概论”为代表的少数几门语言学方向课程在广度和深度上均难以满足新时代复合型人才的培养要求,相关课程数量上的匮乏很难让学生真正搭建起完整的知识体系,遑论培养出一流的研究型人才。针对这些问题,我们提出了语言学课程群建设的三条路径,分别对应新文科建设所倡导的人文科学内部的交叉融合、人文科学与社会科学之间的交叉融合以及人文科学与自然科学之间的交叉融合三个不同层次,且后两者与自21世纪以来语言学研究逐渐呈现出的以统计学为基础的定量转向[19]242这一整体趋势相吻合(19)Kortmann认为,21世纪的语言学研究主要呈现出三大转向,分别为基于统计学的转向(statistics-based turn)、基于用法的转向(usage-based turn)以及基于变异的转向(variation-based turn)。。各院校可结合自己的师资情况及办学特色,有针对性地选择最适合自己的发展路径。当然,这些想法能否最终实现,还取决于学校及学院相关政策及制度的支持与保障。由于学术背景及研究方向所限,本文仅提供了与语言学跨学科研究相关的三条发展路径,而至于与应用语言学相关的课程群建设方案,还有待其他学者后续的补充。

近年来,国内的语言学研究虽已取得了长足进步,但我们须清醒地意识到目前与国际领先水平仍有一定的差距,要想从国外语言学理论本土化的初级阶段逐渐过渡到积极参与国际主流语言学理论的构建和方法论的创新活动当中,仍然任重而道远。要想真正培养出与国际学术体系相接轨的语言学研究型人才,还应放眼全球,对标世界顶级院校的语言学相关课程体系,坚持跨学科交叉融合的新文科建设理念。

猜你喜欢

语言学人文数字
人文
答数字
人文绍兴
认知语言学与对外汉语教学
数字看G20
人文社科
让人文光辉照耀未来
成双成对
社会语言学名词
语料库语言学未来发展趋势