APP下载

语料库方法在新闻传播研究领域的应用

2018-04-02唐佳梅何子杰

韶关学院学报 2018年4期
关键词:语料库领域文本

唐佳梅,何子杰

(广东外语外贸大学 新闻与传播学院,广东 广州510006)

长期以来,语料库方法作为语言学重要方法论之一,丰富了语言学的研究内容,为其提供了新的研究视角。世界上第一个机读英语语料库(布朗语料库,Brown Corpus)诞生于20世纪60年代初期的美国布朗大学。随后美国和英国学者分别在70年代建立了美国英语书面语语料库BROWN(Brown University Standard Corpus of Present—Day American English)和英国英语书面语语料库LOB(The Lancaster-Oslo/Bergen Corpus of British English)。BROWN 和LOB语料库的建立有助于将美国英语和英国英语进行系统的比较研究[1]。但作为一种研究性工具,语料库在新闻传播研究领域出现的时间较晚。直到20世纪90年代,有学者在充分认识到互联网时代下的新闻语言之后,依据语言学理论、统计学理论以及新闻学理论等对新闻类语言进行了广泛研究,并建立新闻类语言语料库[2]。由此,语料库方法在新闻传播研究领域的应用逐步开展起来。

一、语料库在新闻传播研究领域的应用

(一)语料库在国内新闻传播研究领域的运用

在中国知网上搜索“语料库”,有6 252篇文献,其中大部分集中在外国语言文学、中国语言文学以及计算机软件与计算机应用这三个学科方面。通过关键词搜索“语料库”并选择“新闻与传媒学科”,仅得文献67篇,表明语料库研究方法在本学科的研究基础薄弱。

喻国明和李慧娟在《大数据时代传播研究中语料库分析方法的价值》中指出:大数据思维对当下新闻与传播研究造成强烈的冲击,传统的文本分析手段拘泥于有限的文本数量和定性研究的窠臼,无法满足大数据时代对内容深度和广度的挖掘需求。在这种情况下,来源于应用语言学的语料库研究方法对于文本数据库的建立成为一种可能[3]。笔者在上述67篇文献中,剔除4篇与语料库研究相关度不高的文献,将剩余的63篇文献通过分析归类,得出以下几种类型:

第一,语料库在应用传播研究领域的运用。应用传播包括国家形象或城市区域形象传播、健康传播以及公共传播等。齐佩在研究美国媒体对中国经济形象的构建时,通过选取2008年 9月 18日 至2010年12月 31日期间的美国三大报纸对中国经济报道的文本,自建有关中国经济形象的专用语料库,从关键字索引、搭配和词簇等方面入手,分析美国各大报的报道框架并进一步研究外媒报道框架对中国经济形象的构建及其影响[4]。除了通过媒介报道来呈现国家或区域城市形象外,赵凌则通过语料库工具,挖掘个体传播和国家形象传播的互动关系,另辟蹊径研究国家形象传播[5]。

健康传播是近20-30年来在中国逐渐兴起的一项有关健康的传播学科,但运用语料库作为健康传播研究工具的文献匮乏。中国知网论文数据库仅有3篇健康传播的文献与语料库有关联性,且研究对象集中在太极拳以及中医药两个方面。这三篇文献通过运用语料库相关功能来分析太极拳和中医药在国外的传播现状及特点,进而得出我国该如何运用民族文化精髓来提高对外传播能力的结论。

公共传播的研究主要涉及民生问题、公共基础建设以及公益事业等。廖卫民在“浙江省民生新闻传播与社会幸福感评估”这一课题研究中就引入语料库研究方法,从新视角(即媒体对民生新闻的报道反映人民的幸福指数)切入分析[6]。该研究以《杭州日报》民生新闻报道作为语料库来源,利用频率词分析媒介报道文本的呈现与人民幸福感的关系,指出民生新闻的不足与缺陷。谷羽在其博士论文《微博客平台的企业公益传播》中提到:运用语料库分析软件的统计功能对具体词语的使用频率,词语搭配结构等语言学特征进行统计,以此为基础运用诠释型内容分析法,通过精读、理解并解释文本内容,从整体和更高层次上把握文本内容的复杂背景和思想结构[7]。由此可见,在新闻传播学领域,语料库作为一种具有定性研究方法特点的工具,其重要性越来越显著。

第二,语料库在新闻理论和实践研究领域的应用。新闻理论与新闻实践随着社会发展而不断发展,但研究方法却没有取得突破性的创新。同质化、低水平的研究泛滥,严重阻碍新闻与传播学科的发展,而语料库作为应用语言学的研究工具,与新闻学研究中的内容分析法有异曲同工之处。

值得一提的是,在基于语料库对新闻理论和实践研究的文献中,多数研究者以外国语言学相关背景为主,运用语料库方法对外媒报道中国的文本进行研究,进而得出相关结论。当然,也有少数新闻传播领域里的学者在研究新闻实务的过程中引入语料库研究方法,如喻国明运用语料库主题词检索的分析方法,预测互联网时代数字报纸的发展前景及人民对其发展的信心度[8]。体育新闻写作研究中也逐渐呈现引入语料库这一研究工具的趋势。郑丽杰在分析网络体育新闻标题时指出:基于语料库的体育新闻标题研究能够运用计算机技术对大量文本进行定量统计和定性描述,让语言分析朝着更加纵深的方向发展[1]。该研究通过统计标题中出现的主题词频率以及主题词的搭配方式等,全面系统地剖析标题的感情色彩以及标题结构,为网络标题写作研究提供理论层面的支撑。

第三,基于语料库的舆论舆情研究。互联网的广泛使用促使舆情的不断变化,大数据时代对舆情的研究不断增长,语料库方法作为一种能够大规模运作、分析以及统计文本词条的研究方法,无疑与舆情研究有着天然的契合点。喻国明就语料库对舆论研究的作用指出:通过语料库研究方法可以检测舆情的动态情况以及舆论热词的分析处理,通过建立相关的数据库可以更好发现和建立舆论应对模型,以预防和应对舆论的发生。在一项对2011-2013年全国两会舆情中心词和关联词的分析中,他将语料库和大数据选择的研究方法相结合,将舆论热词切分成两个维度进行探索,为舆情研究提供了一种新思路[3]。

(二)语料库在国外新闻传播研究领域的运用

20世纪90年代,国外学者开始运用语料库对新闻实践展开研究,其中路透社语料库(Reuters Corpus)(第1版)在2000年已开发完成,收录了路透社从1996年8月20日至1997年8月19日发布的新闻语篇样本 806 791篇,词汇量达2亿次[2],为英国通讯社语言的研究提供了重要的参考作用。此外,国外对语料库的使用不局限于根据不同研究目的建立不同语料库,而且对语料库的实践运用,在方法论要求上具有不同特点。

第一,基于语料库的研究对象广泛。其一,在新闻报道文本的研究上,学者根据不同的研究目的而使用语料库方法从不同方面对文本进行解构,最终发现某种共性,进而得出相应的结论。这类研究以英国曼彻斯特大学学者Kyung Hye Kim关于美国媒体对韩国的报道研究为代表,通过研究新闻文本的词频、词语感情色彩以及报道框架来分析媒体报道的相关特点[9]。这类研究以应用型研究为主,通过探索研究对象在媒体上的呈现来评价其实际作用、传播策略或传播效果等。其二,对政府或企业的报告文本进行研究。社会的激烈竞争使得人们越来越重视发展战略的研究,语料库作为一种文本分析工具也被大量引入到相关公文和报告的研究中。加拿大学者Francis Cornut等人就政府公共部门在发展战略上的相关公文进行了一系列研究,运用语料库分析方法对相关文本的类型、战略关键词的频率以及战略目标的特点来进行分析并评估预期的效果[10]。也有学者运用语料库研究方法通过企业发展报告来研究其商业传播价值,如学者Brian A和Rutherford关于企业年度报告的体裁分析,等等。不管是政府或者是企业,对这些文本的研究目的大多数在于完善传播战略,更好地促进发展并进行前景预测。其三,运用语料库方法分析特定语境下短信息以及书面话语的作用及特点。1999年至2017年的国外文献中,关于语料库在新闻传播领域的研究对象呈现从文本—语段—词条的趋势,研究发展趋势不局限于书面文本,维系人们日常生活的口语以及短信息逐渐进入学者的视野当中。学者Brian P.Jenssen等在网络时代对青少年影响的一项研究中,采用SNS网页留言板的记录作为语料基础。SNS网站是一个以青少年为目标受众的网络社区,青少年可在该社区上分享信息以及互动对话。研究者通过收集346名参与者浏览网站并互动所产生的147 432个单词作为文本语料库,以词频和关键词关联的方法来研究该网络社区对青少年的影响[11]。

综合国外对语料库的使用情况来看,研究对象从以往的长篇文本逐渐发展到对某个核心词的分析,研究不断深入。在研究成果方面,国外的语料库一般偏向应用研究,通过对某一对象存在的问题进行分析,发现问题的本质并提出建议或者预测发展前景。

第二,将语料库方法和批评性话语分析理论相结合。批评性话语分析通过分析言语特征及其生成的文化背景来挖掘出隐含于语言中的意识形态,进而揭示语言、权力以及意识形态之间的复杂关系。换而言之,批评性话语的基础是文本,对文本的筛选、统计、解析和验证是批评性话语分析法的第一步。语料库方法与批评性话语分析相结合的运用使研究得出的数据和结论更为客观、权威更具有深度。除了与批评性话语分析理论相结合外,国外的研究也开始尝试将语料库研究方法与其他分析理论结合起来,如马丁的“评价理论”等。

二、语料库发展存在的问题及研究趋向

从语料库方法在国内外新闻传播领域内的应用来看,作为语言学的一种重要研究工具,语料库已逐渐进入新闻传播的研究视野,拓宽了该领域的研究范围创新了研究方法,但在使用语料库作为研究方法和研究工具上仍存在一些局限。

一是国内相关研究主要把语料库作为大数据时代下一个大规模的文本分析工具,作为一个抓取关键词以及频率词的统计工具,却在词汇词性、短语结构、词语背后的感情色彩、词语的隐喻等方面涉及较少。国内新闻传播学领域里仍有为使用语料库研究而研究的现象,未能把语料库研究方法与本学科的方法与理论相契合,因此,今后亟需深挖语料库功能,对其应用方法方式进行突破创新。

二是有关新闻传播领域大规模、权威型语料库需要不断构建。我国第一个大型的基于新闻的现代汉语标注语料库是由北京大学计算语言学研究所和日本富士通公司合作完成的《人民日报》标注语料库[2]。相比国外的语料库建设,我国在新闻传播学领域创建语料库的时间较晚,选择样本的历时较短。当前运用语料库分析方法的前提是自行建立研究对象相关的语料库,缺乏可以参照和对比的同类型权威语料库,分析结果也局限于研究者自身抽样的范围,缺乏一个更系统规范的检验标准。此外,在相关抽样过程中的主观性也是影响最终分析结果的一个重要因素,如何为自建语料库抽样提供更加客观完善的标准?值得我们继续思考。

三是在新闻传播学领域内,语料库的语料基础比语言学领域更薄弱。对新闻传播研究自建相关的语料库,一般是选取一家或者几家报纸的报道文本来作为样本容量,虽然符合语料库研究样本数量的规定,但是由于新闻报道的偏向性。因此,报纸的立场或研究者自身的经验等因素也会影响文本词汇的使用,而且抽取的样本历时性局限也难以系统而全面地分析文本,得出的结果只能是某个阶段的发现,难以形成一个完整的研究体系。

三、结语

本文对语料库方法在国内外新闻传播研究领域中的应用进行了初步探索。通过对国内和国外的相关应用情况进行分析和归纳总结,发现语料库作为研究工具在国内国外新闻传播领域的应用中存在差异。大数据时代下,传统定性定量研究方法已难以满足新闻传播学发展的需求,语料库方法的应用为该领域提供了一种全新的跨学科研究方法及路径。国内外的相关研究显示语料库方法在新闻传播领域里未能充分发挥其应有的作用,研究程度还不够深入。进一步探索语料库的相关功能,构建更多的新闻传播类语料库,拓宽其在新闻传播研究领域内的应用范围,结合语言学的视野进行跨学科的研究,将是今后研究中亟待解决的问题。

[1]郑丽杰.基于语料库的网络体育新闻标题研究[D].北京:北京体育大学,2009.

[2]黄艳军.基于语料库的国内外主要新闻语料库综述[J].读与写,2011(5):89-90.

[3]喻国明,李慧娟.大数据时代传播研究中语料库分析方法的价值[J].传媒,2014(2):64-65.

[4]齐佩.从关系过程看美国大报中的中国经济形象[D].石家庄:河北师范大学,2011.

[5]赵凌.个体传播与国家形象传播互动路径探究——以姚明个体传播为个案[J].当代传播.2012(6):49-52.

[6]廖卫民.民生新闻传播与社会幸福感评估——基于浙江省媒体语料库的实证分析[J].当代传播,2012(3):21-25.

[7]谷羽.微博客平台的企业公益传播[D].武汉:华中科技大学,2013.

[8]喻国明,李慧娟.从“付费门”到“付费墙 2.0”:数字报纸盈利模式的景气度研究[J].当代传播,2014(4):21-22.

[9]Kyung H K.Examining US news media discourses about North Korea:A corpus-based critical discourse analysis [J].Discourse&Society,2014(2):221-223.

[10]Francis C,Hélène G,Ann L.The strategic plan as a genre[J].Discourse&Communication,2012(1):21-24.

[11]Yoshiko O.A case study of US deaf teens’ text messaging:Their innovations and adoption of textisms[J].New Media&Society,2013(8):1224-1240.

猜你喜欢

语料库领域文本
《语料库翻译文体学》评介
2020 IT领域大事记
在808DA上文本显示的改善
领域·对峙
基于doc2vec和TF-IDF的相似文本识别
基于COCA语料库的近义词辨析 ——以choose和select为例
文本之中·文本之外·文本之上——童话故事《坐井观天》的教学隐喻
基于JAVAEE的维吾尔中介语语料库开发与实现
新常态下推动多层次多领域依法治理初探
如何快速走进文本