APP下载

大数据情感分析*
——数字时代理解国际关系的一种非理性范式

2020-03-12王云璇董青岭

国际论坛 2020年6期
关键词:政治情感分析

王云璇 董青岭

【内容提要】作为人际关系和政治体验的直接表达,情感是政治决策中难以排除、也难以回避的扰动因素,但是由于传统国际关系研究理性范式的盛行和情感分析技术的缺位,情感分析作为一种研究范式一直未能受到应有的重视。当前,随着大数据时代的到来,新素材、新技术和新思维的出现使得大数据情感分析有可能发展成为国际关系研究走向工程应用的一个重要实验领域。整体上,大数据情感分析主要立足于计算机自然语言处理技术与国际关系专业知识的跨学科融合,重在探索作为非理性因素的情感对于现代政治运行的隐秘影响。放眼未来,大数据情感分析有着广阔的拓展空间,但其发展也面临若干困境。文章以政治情感为切入点,从政治情感分析的理论演化及技术进展两个方面入手,分析了情感计算的基本原理,探索了大数据时代情感分析技术在国际关系领域内的应用场景,并简要评估了大数据情感分析的优势和不足,旨在捕捉复杂社会中的微妙人际互动和情绪传播。

传统国际关系研究大多假定人是理性的,但情感作为人性的重要组成部分,无时无刻不在影响着人的思维方式和行为方式。人们可以学习控制和压抑自己的情感,但是,没有人能够完全按照纯粹理性的逻辑行事。无疑,情感在激励政治行为中扮演着重要角色,但由于传统分析范式一度高扬理性、贬斥感性,使得情感分析在国际关系研究中一直未得到应有之重视。然而,伴随着人工智能时代的到来,借助大数据平台捕捉国际关系中的情感因素不仅在技术上已成为可能,而且深入细微的情感计算将有助于打破国际关系研究中长期盛行的理性崇拜,①Cheryl Hall,“‘Passions and Constraint’:The Marginalization of Passion in Liberal Political Theory,” Philosophy and Social Criticism,Vol.28,No.6,2002,pp.727-748.甚至能够推进研究者更好地发掘那些一度被忽视、被漠视的情感诱因。政治行为究竟更多是激情决策还是理性选择的结果?如果人们无法将情感考量有效排除于理性算计之外,那么蕴含于人际互动和话语言说中的情感又将如何被量化和计算?进而,情感计算又将对当下和未来的政治运行产生何种影响?有感于上述困惑和疑问,本文试图以情感分析技术的进展为线索,着力厘清国际关系情感计算的基本原理与可能应用场景,以窥其在未来研究中的可能拓展空间。

一、政治行为的幕后驱动:理性还是激情

简单来说,情感分析,又称“意见挖掘”,是指对包含情感词语的主观文本所进行的情感计算,其基本任务是从文本中提取出评论实体并计算该实体所表达的情感倾向和情感强度,其中情感倾向分析重在挖掘“情感极性”(polarity),而情感强度计算则重在度量“情感调性”(tonality)。从技术史的角度来看,大数据情感分析是伴随着自然语言处理(NLP)技术的发展而产生的。2001年,加拿大蒙特利尔大学计算科学系乔舒亚·本吉奥(Yoshua Bengio)、雷让·杜恰姆(Réjean Ducharme)和帕斯卡·文森特(Pascal Vincent)等人率先提出神经语言模型,②Yoshua Bengio,Réjean Ducharme,Pascal Vincent and Christian Jauvin,“A Neural Probabilistic Language Model,”The Journal of Machine Learning Research,Vol.194,No.3,2003,pp.1137-1155.开启了自然语言处理的大门,也架起了通往情感分析的桥梁;2002年,康奈尔大学波庞(Bo Pang)和莉莲·李(Lillian Lee)等人进一步定义了情感分析在自然语言处理中的计算原理与应用场景,①Bo Pang,Lillian Lee,Shivakumar Vaithyanathan,“Thumbs up? Sentiment Classification Using Machine Learning Techniques,”paper presented at the Conference of Empirical Methods in Natural Language Processing(EMNLP 2002),Philadelphia,USA,July 2002.情感分析遂成为NLP 的热门方向之一。但在国际关系领域,情感分析的应用至今并未像在计算机领域那样得到热情拥趸,一方面是因为相关技术门槛的限制,另一方面则是理性范式长期占据主导地位所致。总体而言,自进入21世纪以来,伴随着社交工具被广泛应用于信息传递和人际沟通,情感分析在国际关系研究中的价值也随之显现,而作为国际关系最基本构成单位的人,究竟是理性主导决策还是激情主导决策,也再度成为学界争议的焦点。

(一)难以排除的扰动因素:政治运行的情感基础

人是一种极为复杂的社会存在,情感不仅是个体决策的重要影响因素,同时也是驱动国家行为、塑造国际体系结构的潜在力量。从国际关系研究的不同层次来看,情感在个人、国家和体系三个层次对国际关系运行产生影响,是国际关系研究中不容忽视且难以排除的重要决策动因。

1.个人层次。情感是人性的重要组成部分,个体决策并非完全出自理性抉择。②相关研究参见Herbert Simon,“Bounded Rationality and Organizational Learning,”Organization Science,Vol.2,No.1,1991,pp.125-134; Robert J.Shiller,Irrational Exuberance, Princeton:Princeton University Press,2000,pp.148-168; Martha C.Nussbaum, Anger and Forgiveness,New York:Oxford University Press,2016,pp.21-25.从社会构成的角度来看,情感是人作为社会存在的核心价值追求,同时也是人类构建社会关系、形成伦理道德并驱动决策和行为的隐形力量。很早之前,政治学家们就已经认识到,捕捉、操控或诱导人性中的情感倾向,不仅可用于维系社会稳定、增强政治统治的合法性,而且还可用于鼓舞政治士气、建构政治认同,一些学者甚至提出情感本身就是政治生活的一种功能。③Patrick R.Miller,“The Emotional Citizen:Emotion as a Function of Political Sophistication,”Political Psychology,Vol.32,No.4,2011,pp.575-600.在国际关系研究中,深入探讨情感建构与政治秩序的作品历来并不鲜见,譬如:托马斯·霍布斯由人性恶推导出人的自私和伪善必然会导致国与国之间无尽的纷争;④托马斯·霍布斯:《利维坦》,黎思复、黎廷弼译,北京:商务印书馆,1985年,第94页。伊曼努尔·康德对人性中宽恕、博爱和自尊等道德情感的强调推断出国与国之间实现永久和平的条件;⑤伊曼努尔·康德:《永久和平论》,何兆武译,上海:上海人民出版社,2005年,第57页。同样,自爱心和怜悯心这两种情感因素在卢梭的人性论和自然法学说构建过程中也占据了重要位置。①让-雅克·卢梭著:《论人类不平等的起源和基础》,李常山译,北京:商务印书馆,1997年,第20页。此外,乔纳森·默瑟(Jonathan Mercer)指出,情感是非理性的,在一定意义上反映的是人们对于现实政治生活的直观感受和心理体验;②Jonathan Mercer,“Human Nature and the First Image:Emotion in International Politics,”Journal of International Relations and Development,Vol.9,No.3,2006,pp.288-303.谢丽尔·豪尔(Cheryl Hall)强调,情感是政治生活的重要组成部分,情感应该被确立为政治理论分析的一个核心范畴,学者们应注重研究不同情感因素对政治运行所产生的后果。③Cheryl Hall,“‘Passions and Constraint’:The Marginalization of Passion in Liberal Political Theory,”Philosophy and Social Criticism,Vol.28,No.6,2002,pp.727-748.总体来说,研究人性中的情感基础对于理解国际政治的深层逻辑,具有别样的启发意义。

2.国家层次。在某种意义上,国家是一定疆域内各类社会关系的构成,而情感分析是对由人所构成的社会关系的探索,是理解社会结构和国家行为的重要视角。目前,国际关系学者主要从以下方面探讨了政治秩序与情感建构之间的联系:一是情感能力说,即认为情感是一种能力,是一种建构性因素,是社会秩序生成的核心元素;④潘泽泉:《理论范式和现代性议题:一个情感社会学的分析框架》,《湖南师范大学学报(社会科学版)》2005年第4期,第53—57页。二是特殊情感说,即社会秩序的建立在很大程度上源于某种特殊情感,如人类同情心的驱动,社会的稳定与国家的存在主要依赖人与人之间的共同感情归属。在现有文献中,一些学者着力探讨了理性和情感的交互作用是否能够创造和维持共同的身份,进而缔造特定群体内的团结与合作;⑤Ned Lebow,“Reason,Emotion and Cooperation,”International Politics,Vol.42,No.3,2005,pp.283-313.而另外一些学者则从跨文化的视角重点剖析了不同国家所拥有的情感状态,以及不同性质的国家特质和民族情感对国家行为所产生的影响。⑥Blanka Rip,Robert J.Vallerand,Marc-André K.Lafrenière,“Passion for a Cause,Passion for a Creed:On Ideological Passion,Identity Threat,and Extremism,”Personality,Vol.80,No.3,2012,pp.573-602.如有学者认为,不同的国家身份会塑造不同的情感状态,而不同的情感会带来不同的国家行为,一般来说,为满足自身的情感需求,国家行动中都蕴藏了或积极或消极的情感动机,⑦季玲:《国际关系中的情感与身份》,北京:中国社会科学出版社,2015年,第117—126页。包括作为交换资源的情感、作为行为动机的情感和作为互动结果的情感,不同的情感资源都会对国际政治中的冲突与合作造成潜在的影响。⑧黄真:《国际关系中的情感》,《中南大学学报(社会科学版)》2012年第15期,第165—172页。

3.体系层次。情感是社会文化的重要组成部分,而处于不同情感秩序下的体系文化对国际体系结构的变迁有着重要影响。建构主义学者认为,不同性质的体系文化会塑造不同成员的共有身份,而身份定位会直接影响到一国利益的界定及其行为走向,进而影响整个国际体系结构的构成。譬如亚历山大·温特指出,充斥敌意的霍布斯文化会生成冲突的体系结构,彼此竞争的洛克文化会导致竞争的体系结构,而相互友善的康德文化会形成和平的体系结构;①亚历山大·温特:《国际政治的社会理论》,秦亚青译,北京:北京大学出版社,2005年,第246—370页。安德鲁·罗斯(Andrew Ross)②Andrew Ross,“Realism,Emotion,and Dynamic Allegiances in Global Politics,” International Theory,Vol.5,No.2,2013,pp.273-299.和妮塔·克劳福德(Neta Crawford)则强调了不同的体系文化、不同的秩序结构都必然蕴含于一定的情感基础,在国际政治中恐惧、耻辱和同情心等情感要素都是体系文化形成的重要驱动力量。③Neta Crawford,“The Passion of World Politics:Propositions on Emotions and Emotional Relationships,”International Security,Vol.24,No.4,2000,pp.116-156.此外,政治学家塞缪尔·亨廷顿指出,情感上的“排他”和“排异”是造成文明间冲突的深层根源,崇尚一种文明的同时贬低其他文明、归属一个民族的同时仇视其他民族以及弘扬一种文化的同时贬抑其他文化,正是当今世界文明断裂、冲突不断的重要诱因。④塞缪尔·亨廷顿:《文明的冲突与世界秩序的重建》,周琪、刘绯、张立平、王圆译,北京:新华出版社,2010年,第228—334页。

综上所述,作为国际政治最微观的构成单元,个人身处社会关系之网并深受人际关系中的情感波动之影响。⑤董青岭:《大数据安全态势感知与冲突预测》,《中国社会科学》2018年第6期,第176—177页。传统国际关系研究主要以理性主义范式为基底,在很大程度上忽略了行为体所处社会关系的复杂性,也漠视了政治决策过程的非理性扰动。在现代日趋繁密的社交网络时代,国际关系研究应重新审视“人”的复杂性和情感丰富性。

(二)情感分析的技术契机:捕捉互动中的情感交流

长期以来,很多学者关注到情感是政治运行难以排除的扰动因素,但情感分析在国际关系研究中却并未得到长足发展,原因主要有以下两点:其一,理性范式的历史惯性。很多学者相信,政治行为体是谨慎且具有理性思考能力的,国际政治的宏观结构主要是群体间互动理性选择的结果。⑥Jon Elster,“Rationality,Emotions,and Social Norms,”Synthese,Vol.98,No.1,1994,pp.21-49.其二,分析手段的技术门槛。作为飘忽不定的非理性变量,情感通常被认为是难以捕捉、难以衡量的,以至于情感的量化研究通常被认为是不现实的。正是由于以上两个障碍,国际关系研究中的情感分析一直未得到应有之重视,国际关系研究长期为理性范式所垄断。但是,伴随着社交网络时代的到来,使用大数据即时捕捉并观测个人乃至群体的情感变化日趋成为可能,情感分析的价值正在逐步释放和展现。

1.新的政治运行模式的崛起呼唤新的政治分析视角。在某种意义上,情感分析在国际关系中的运用是现实政治发展的客观需求,它为人们理解现实政治运行提供了一个不同于理性分析的视角。根据最新《2020 全球数字报告》,全球互联网使用人数已达45.4 亿,截至2020年1月,全球社交媒体用户达38 亿,超过51.9 亿人使用手机,普通互联网用户人均每天在线花费6 个小时43 分钟,①We Are Social,Hootsuite,“Digital 2020:Global Digital Overview,”January 30,2020,https://wearesocial.com/digital-2020.可见网络空间已经成为人类经济和社会生活的重要舞台。与此同时,由于网络空间的开放性、自由度和低成本等特征,越来越多的年轻人选择以网络设施特别是社交媒体为平台了解社会运动、参与大众政治进程,涌现出诸如推特外交、微博问政和搜索政治等新型政治模式,国际政治的数字沟通时代已然开启,这为国际关系研究中的情感分析提供了丰富的文本素材和广阔的实践场景。数据革命下的海量信息涌动和新型政治实践方式表明,传统政治研究手段已不能满足当下政治变革的需求,未来政治的运行越来越受制于人际关系的牵绊和社会情绪之影响。

2.理性范式的解释失灵要求重新审视被忽视的情感价值。情感分析主要瞄向解释现实政治运行中的“非理性”“非逻辑”和“反智”现象,重在探索和阐释那些不合乎理性选择的行为逻辑。近年来,全球政经体系“黑天鹅”和“灰犀牛”事件频频出现,各种“非理性因素”粉墨登场,理性主义范式日渐陷入一场前所未有的“解释危机”和“预测危机”。②相关研究参见阎学通:《“黑天鹅现象”对国际关系理论研究的警示》,《国际政治科学》2017年第2期,第4—6页;陈定定、刘丰:《认真对待预测:国际关系理论发展与预测》,《世界经济与政治》2012年第1期,第19—33页。诸如2016年特朗普当选、英国脱欧公投、中美贸易战和当下各色的逆全球化进程,无不彰显了传统政治理论太过执着于结构解释和理性假设,忽略了现实世界人际互动的复杂性和微观政治主体情感联系的多样性。总体而言,传统国际关系理论不以微观主体为考察对象,侧重研究宏观结构对于微观主体的框定作用,将国际关系舞台上一个个生动活泼、感情丰富的政治行为体简化为毫无感情的“原子行为体”,忽略了微观主体之间的互动特别是人际间情感的交流对于宏观结构的塑造和维系作用。在此情形下,理论预测与现实政治运行严重脱节,国际关系研究迫切需要“人的回归”特别是情感因素的回归。①相关研究参见郝拓德、安德鲁·罗斯:《情感转向:情感的类型及其国际关系影响》,柳思思译,《外交评论(外交学院学报)》2011年第4期,第40—56页;尹继武:《国际政治心理学研究的新进展:基本评估》,《国外理论动态》2015年第1期,第27—36页。

3.数字时代的高频人际互动彰显情感分析的社会感知功能。在数字时代,人们借助各种设备表达情感更加自由且频繁,而情感分析具有强大的社会感知和预测能力,不仅能够在商业领域帮助企业采集特定人群的消费意愿、购买倾向,捕捉客户体验、改善服务水平和维护品牌形象,而且在政治领域能够有效监测社会舆情、捕捉社会负面情绪、预测社会冲突走向。简单来说,情感分析能够通过文本中情感词的提取和判别了解某一主体对特定议题的情感倾向,进而分析其意图和行为趋势,这大大提升了决策者和研究人员的政治洞察力和分析预判力。目前,情感分析在政治领域的应用主要有以下场景:选举预测、舆情监测和危机预警。典型案例如:2012年,奥巴马竞选团队将社交媒体大数据与情感分析相结合,建立了较传统选民数据库更为精准的选举预测模型,实时监测选民政治倾向、进行精准政治营销,从而为赢得大选提供了更多可供操作的政治武器;②相关研究参见董青岭:《美国大选背后的数据军团》,《中国投资》2018年第5期,第40—42页;翟峥:《对2012年美国总统大选的政治传播学探讨——以奥巴马竞选团队的新媒体运用为例》,《国际论坛》2013年第6期,第59—65页。2016年特朗普团队雇佣了一家名为“剑桥分析”(Cambridge Analytica)的数据公司进行选民情感分析和性格画像,一举击败了希拉里团队基于传统人口数据的预测模型,充分展示了情感分析在现代政治运行中的实战作用。③相关研究参见沈辛成:《社交媒体常态化与选举政治——2016年美国大选的两种数字媒体策略》,《美国问题研究》2016年第2期,第78—102页;汉纳斯·格拉希格,迈克·克罗格鲁斯:《大数据时代特朗普获胜美国大选的秘密》,《汕头大学学报(人文社会科学版)》2017年第1期,第91—96页。

由此可见,情感因素作为人性的重要组成部分对现实政治运行具有不可忽视的重要影响,而情感分析在国际关系中的运用将有助于决策者捕捉社会情绪的细微变化,洞察政治变动的风向并制定具有前瞻性的应急响应预案。

二、情感分析的旨趣:研究目标与分析路径

作为观察现实政治运行的一个非理性视角,情感分析在国际关系中的应用主要可归结为两大阵营:其一,有关情感分析的理论构建,主要旨趣是探析情感影响政治决策和政治行为的逻辑机理;其二,有关情感分析的技术实现,主要旨趣是探讨如何利用人工编码和机器学习技术提升情感分析的效率与精度。

(一)洞察人性中的非理性:情感分析的研究旨趣

情感分析与理性分析相对立,它假定政治行为体在决策时并非是纯粹理性的或难以做到理性抉择,侧重考察弥漫于人际关系中那些飘忽不定的情感和情绪等非理性因素。作为一种分析视角或分析路径,较早见于20世纪七八十年代的政治心理学作品。1976年,美国政治学者罗伯特·杰维斯在其名著《国际政治中的直觉与错误知觉》一书中,较为成功的将心理学理论引入国际关系研究,指出情绪作为一种心理要素对国家认知和外交决策具有不容忽视的影响,源自成见、仇恨或从众的错误知觉会造成难以想象的政治灾难。①罗伯特·杰维斯:《国际政治中的知觉与错误知觉》,秦亚青译,北京:世界知识出版社,2003年,第373—401页。但是,直到21世纪初,伴随着全球反美情绪的高涨和自然语言处理技术的进步,研究者们才开始大规模关注并重视情感之于政治运行的影响,一些关于情感分析的方法描述和理论构建才不断涌现。②相关研究参见Edward Schatz and Renan Levine,“Framing,Public Diplomacy,and Anti-Americanism in Central Asia,”International Studies Quarterly,Vol.54,No.3,2010,pp.855-869; Sharon Werning Rivera and James D.Bryan,“Understanding the Sources of Anti-Americanism in the Russian Elite,”Post-Soviet Affairs,Vol.35,No.5-6,2019,pp.376-392.

1.情感、理性与行为

政治行为究竟是出自深思熟虑的结果还是激情所为,关于这一问题的争论在国际关系研究中长期存在。在大多数学者看来,理性主导一切、理性是人性的本质,“情感”太过飘忽不定、不受控制,通常被视为“秩序的破坏者”“暴力和伤害的驱动因素”。③相关研究参见肖晞、郎帅:《文化、情感与理性选择:一个政治学的难题》,《公共管理研究》2010年第8期,第53—63页;朱德米:《当代西方政治科学最新进展——行为主义、理性选择理论和新制度主义》,《江西社会科学》2004年第4期,第192—199页。有学者甚至主张,情感由于太飘忽不定,在政治研究中可予以排除,政治研究应该首先关注理性这一人性中的稳定因素。④安东尼·唐斯:《民主的经济理论》,姚洋、邢予青、赖平耀译,上海:上海世纪出版集团,2010年,第34—48。但是,情感和理性事实上并不是二元对立的,情感与理性在本质上是人性的一体两面,无论是情感还是理性都不可在政治行为中随意被排除。一方面,情感能够破坏理性,冲突与战争并不仅仅起因于利益的争夺和权力的压迫,有时诸如仇恨、嫉妒和荣誉等情感因素也可诱发不可收拾的暴力伤害;①相关研究参见Younes Saramifar,“Emotions of Felt Memories:Looking for Interplay of Emotions and Histories in Iranian Political Consciousness Since Iran-Iraq War(1980-1988),”Anthropology of Consciousness,Vol.30,No.2,2019,pp132-151; Iasonas Lamprianou,Antonis A.Ellinas,“Emotion,Sophistication and Political Behavior:Evidence from a Laboratory Experiment,”Political Psychology,Vol.40,No.4,2019,pp.859-876.另一方面,情感又是理性得以维系的重要支撑,诸如联盟体系的形成、人道主义援助的实施和国家间的互帮互助以及大国行为的自我克制,都离不开善意、同情、信任和认同等情感因素的正面影响。②相关研究参见Jonathan Mercer,“Rationality and Psychology in International Politic,”International Organization,Vol.59,No.1,2005,pp.77-106; Neta Crawford,“The Passion of World Politics:Propositions on Emotions and Emotional Relationships,”International Security,Vol.24,No.4,2000,pp.116-156.此外,情感还会对政治沟通过程产生塑造效应,无论是国内政策的制定还是外交战略的执行,都离不开良好政治氛围的营造,如国际关系学者布伦特·塞斯利(Brent E.Sasley)就研究了情感是如何驱动群体感知进而影响国家外交政策的。③Brent E.Sasley,“Theorizing States’ Emotions,”International Studies Review,Vol.13,No.3,pp.452-476.情感在政治中无处不在,有时候个人情感会迸发并汇集成社会情绪;在任何时候,忽略了社会情绪的影响,政治磋商和政治谈判都难以收到预期的效果。④George Marcus,“Emotions in Politics,”Annual Review of Political Science, Vol.3,No.1,2000,pp.221-250.

2.情感、身份与规范

情之所动,意之所向。在某种意义上,“情感”一词所描述的是人与人之间以及人与特定对象之间的连接关系和精神依赖,是构成个人政治身份和社会归属关系的重要维系纽带。简单来说,在现实政治运行中,情感具有如下建构作用:其一,情感建构成员身份并赋予其归属感。情感既可以使政治行为体产生归属感,同样也能使之产生背离感,族群的形成最早就是源自成员间的共同情感认知。⑤相关研究参见Helena Flam,“Emotional‘Man’:The Emotional‘Man’and the Problem of Collective Action,”International Sociology,Vol.5,No.1,1990,pp.39-56; Karl W.Deutsch,Sidney A.Burrell and et al.,Political Community and the North Atlantic Area,Princeton:Princeton University Press,2002,pp.195-200; Daniel A.Miller,Eliot R Smith and Diane Mackie,“Effects of Intergroup Contact and Political Predispositions on Prejudice:Role of Intergroup Emotion,”Group Processes & Intergroup Relations,Vol.7,No.3,2004,pp.221-237.其二,情感建构社会关系并赋予其规则和规范。情感不仅能使政治行为体明晰彼此关系的性质,而且还能够使其知晓何谓适当的和可被接受的行为规范。①Daniel A.Miller,Eliot R.Smith,Diane M.Macki,“Effects of Intergroup Contact and Political Predispositions on Prejudice:Role of Intergroup Emotion,”Group Processes and Intergroup Relations,Vol.7,No.3,2004,pp.221-237.换言之,情感本身就是规则得以建立并维系的元规范。社会成员接纳、尊重并照顾彼此的感受便是社会共情的体现;②陈文娟:《公民友爱与政治秩序》,《哲学研究》2015年第11期,第98—104页。反之,违反一致认可的价值观和社会规范就会引发集体内他人的情绪反应,而遵守的人则会感到愤怒或羞耻,进而对规范的执行和存续产生维系作用。③Helena Flam,“Emotional‘Man’:The Emotional‘Man’and the Problem of Collective Action,”International Sociology,Vol.5,No.1,1990,pp.39-56.有鉴于上述认知,一些建构主义的作品集中关注了情感、身份与规范之间的关系,如亚历山大·温特重点关注了共同命运感和“我们感”(we-ness)之于集体身份形成的内化作用;④亚历山大·温特:《国际政治的社会理论》,秦亚青译,上海:上海人民出版社,2008年,第397—445页。而阿米塔夫·阿查亚(Amitav Acharya)在其“地区安全共同体”理论构建中,重点审视了价值观的匹配之于规范扩散的润滑推进作用。⑤Amitav Achaya and Jürgen Haacke,ASEAN’s Diplomatic and Security Culture:Origins,Development and Prospects,London and New York:Routledge Curzon,2003,pp.197-198.除此以外,本尼迪克特·安德森在《想象的共同体》和露丝·本尼迪克特在《菊与刀》中,均强调了共同的情感经历是一个民族或国家得以形成并长期维系的心理基础。⑥相关研究参见本尼迪克特·安德森:《想象的共同体——民族主义的起源与散布》,吴叡人译,上海:上海人民出版社,2005年,第66—80页;露丝·本尼迪克特:《菊与刀》,吕万和、熊达云、王智新译,北京:商务印书馆,1998年,第31—68页。

总体而言,情感作为人性中的隐性因素和决策的幕后驱动力量,会对政治进程产生难以抹灭的影响,甚至会重塑政治格局和政治体系规范。一方面,政治行为体通过共同情感经历的叙述可以把个体认知转化为集体认知、将个体情感转化为集体情感,进而情感联系的不断加强将演化出共同体认知和集体性政治话语,如羞辱感对美国反恐政策形成具有促进作用、排外情绪对法国难民政策的产生具有塑造作用;⑦相关研究参见Saurette Paul,“You Dissin Me? Humiliation and Post 9/11 Global Politics,”Review of International Studies, Vol.32,No.4,pp.495-522; Hutchison Emma,“Trauma and the Politics of Emotions:Constituting Identity,Security and Community after the Bali Bombing,”International Relations,Vol.24,No.1,pp.65-86.而另一方面,集体情感也可能裹挟个体情感迫使其服从于集体性的安排,从而导致政治上的压抑、屈从或妥协,甚至外交上的追随战略和站队政治。就此而言,情感本身也是一种权力资源,是一种标准的关系性权力和规范性权力。

(二)捕捉政治中的情绪:情感分析的研究路径

作为一个分析变量,“情感”飘忽不定、瞬息万变,但在现代技术条件下基本可捕捉、可衡量并可计算。有关政治运行的情感影响,一些学者指出,正面情感是塑造主体间信任的粘合剂,是维系良性互动和友好合作的“定海神针”。①相关研究参见Schneiker Andrea,“Why Trust You? Security Cooperation within Humanitarian NGO Networks,”Disasters,Vol.44,No.1,2020; Morton Deutsch,“Trust and Suspicion,”Journal of Conflict Resolution,Vol.2,No.4,1958,pp.265-279.当然,也有学者在研究中关注到负面情绪的破坏性影响,认为负面情绪是政治压抑长期得不到疏解和释放的极端表现,一旦负面情绪在人群中扩散传播并累积到一定程度,就会爆发并激发社会抗议、政治游行、暴力袭击乃至武装冲突。②相关研究参见刘瑜:《后现代化与乡愁:特朗普现象背后的美国政治文化冲突》,《美国研究》2018年第6期,第83—108页;谢惠媛:《以希望引导恐惧:纳斯鲍姆政治情感新论——访玛莎·纳斯鲍姆教授》,《哲学动态》2019年第4期,第118—123页。概括来说,在目前技术条件下,国际关系研究中的情感分析主要有以下两种研究路径。

1.传统人工编码文本分析。所谓的“文本分析”主要是指通过对文本特征项的提取来对文本进行语义表达。传统上,特征项亦即关键词的设定、分类与评级主要依赖人工编码。该编码方式的长处是专业、准确,能够较为灵活的适应不同文本语境的变化,短处是由于人员、经费和时间的限制无法应对处理大体量文本。考虑到国际关系是一个特殊的话语沟通领域,政治语言的表达通常被内嵌于错综复杂的事件联系之中,有时政治家比普通民众更善于使用虚浮的文字掩藏自己内心的真实感受,以至于政治语言的表达通常堂皇而隐晦,如果不是专业人士很难洞察这些言说幕后所表达的真情实感和政治意图。因此,有学者认为,即便到了今天拥有大数据技术的辅助和加持,政治话语分析仍然离不开人工编码和专业人士的介入,甚至这一方法无可取代。③相关研究参见Tony Mullen,Robert Malouf,“A Preliminary Investigation into Sentiment Analysis of Informal Political Discourse,”paper presented at the Computational Approaches to Analyzing Weblogs Conference,Stanford,California,USA,March 2006; Tim Loughran,Bill Mcdonald,“When is a Liability Not a Liability? Textual Analysis,Dictionaries and 10-Ks,”Finance,Vol.66,No.1,2011,pp.35-66.理由如下:其一,政治话语与普通文本不一样,它需要被植入深广的政治背景和博弈环境才可加以理解,一般性的情感词典引用难以判断政治文本的幕后真实含义,有时析出的含义与真实意思甚至南辕北辙。譬如新闻报道中“两国进行了坦率而真诚的对话”,实质意思是谈判双方各自抛出了自己的立场主张,或有争执、各不相让,而不是文字表面所呈现出来的亲切友好交谈。其二,基于机器的文本分析无法辨别(或者说无法准确识别)政治言说中的“反讽语”和“高级黑”,如“特朗普真是实在的可爱”,其意实为“特朗普是个傻子”。此类案例在政治场景中不胜枚举,在目前技术水平下,机器学习难以做到精确理解,人工编码仍然是不可或缺的最佳研究路径。

2.大数据机器学习情感挖掘。当前,由于信息的海量涌动,无论是在政治领域还是商业和其他领域,人们普遍面临“信息超载”现象。以前,政治文本分析遭遇的主要障碍是缺乏研究素材或研究素材获取难度较高,而今研究者们面临的新困境是如何快速处理每天汹涌而来的信息狂潮。在新技术环境下,有学者认为,传统文本分析依赖人工编码面临着文本处理量低、人力成本高和耗费时间长等问题,面对突发性政治事件难以做出即时反应,已无法把脉数字时代舆论风向的瞬息万变。①Julio Cesar Amador Diaz Lopez,Sofia Collignon-Delmar,Kenneth Benoit and Akitaka Matsuo,“Predicting the Brexit Vote by Tracking and Classifying Public Opinion Using Twitter Data,” Statistics,Politics and Policy,Vol.8,No.1,2017,pp.85-104.相比之下,基于大数据的情感分析反而倍显优势:其一,大数据不仅能够处理快速涌动的大体量流式数据,而且还能有效应对数据类型的多样性和复杂性;其二,大数据情感标记主要采取机器学习分类预测处理模式,不仅能够有效节省人力、物力和财力,而且还能够有效提高情感分析的细度和精度,更适宜捕捉社交网络时代人际之间高频率的信息传递;其三,大数据情感分析较传统文本分析具有更强的模型泛化推广能力,用于某个场景的机器学习模型很容易迁移泛化推广到其他领域。总体上,基于大数据的情感分析具有更大的样本容量、更快的处理速度和更低成本的人力、物力以及时间消耗,特别适用于挖掘网络时代的人际复杂关联和密集互动。

三、情感分析的原理:技术逻辑与应用场景

作为观察世界政治的一种切入角度,与传统理性假设不同,情感分析假定国际关系中的政治行为体并非可以独立决策的理性行为体,而是感情丰富并有着多样需求的“社会人”,深植社会关系之中并受到社会道德和伦理规范之约束,无论是个人还是群体都难以摆脱情感因素的扰动和影响,政治行为在很多时候都不是独立理性决策的结果,而是一定社会情景下理性与激情交互作用的产物,正是因为情感因素的介入且难以排除,政治的后果总是出乎理性的预期之外。

(一)情感分析的技术解决

1.词典规则法。情感分析的第一阶段是基于语法规则的词典搜索判别法,其操作原理是:编辑情感词典并根据词典所定义的规则,来判别特定对象的情感极性。具体操作步骤是:(1)先通过人工编码方式构建包含特定情感词语的情感词典,即将语料划分为积极情绪、消极情绪和中性词库;(2)然后构建语料库并滤掉停用词汇(stop words);(3)依据情感词典搜索计算正、负向情感词语的频数,评估文本所包含的情感倾向。整体来说,通过正、负情感词语的搜索统计进行情感极性判定,是目前最为常见也是操作最为简单的一种情感分析方法。

但词典法词频统计分析有缺陷,因为最初情感词典的构建没有考虑情感词语所表达的情感程度差异,如“高兴”和“狂喜”、“抑郁”和“愤怒”以及“相信”和“坚信”等词语表达的是同一种情感,但却处于不同的情感强度级别。于是,在词典法的后续发展中,研究人员便试图赋予不同情感词语以不同的情感权重,由此带来词典法的优化和升级,即情感词典编辑除了词性标注外还需情感强度标注,词典法进而发展出情感极性分析和情感调性分析两种分析旨趣。除此以外,在词典法的最近发展中,一些学者甚至还将表情符号、缩写词和社交媒体俚语纳入词典标注范畴,以求进一步提升情感分类的精细度和准确性。①Maite Taboada,Julian Brooke,Milan Tofiloski,Kimberly D.Voll,“Lexicon-Based Methods for Sentiment Analysis,”Computational Linguistics,Vol.37,No.2,2011,pp.267-307.基于上述进展,一些开源情感词典如GI 英文词典、知网Hownet 情感词典、普林斯顿Wordnet 词典、台湾大学简体中文情感词典以及清华大学李军中文褒贬义词典等不断涌现;②Zhao Yanyan,Qin Bing and Liu Ting,“Sentiment Analysis,”Journal of Software,Vol.21,No.8,2010,pp.1834-1848.此外,还有一些学者在政治研究过程中创建了特定议题定制词典,如针对政党声明和媒体报道的德语政治词典,大大增强了政治文本情感分析的针对性和专业性。③相关研究参见Martin Haselmayer,Marcelo Jenny,“Sentiment Analysis of Political Communication:Combining a Dictionary Approach with Crowdcoding,”Quality & Quantity,Vol.51,pp.2623-2646;Christian Rauh,“Validating a Sentiment Dictionary for German Political Language—a Workbench Note,”Information Technology & Politics,Vol.15,No.4,2018,pp.319-343.这些词典的编辑和发布不仅丰富了情感语料库,而且有力推进了基于词典法的政治案例分析。

总体来说,基于规则的情感分析方法主要是情感词典的编辑与应用,其分析效果受情感词典编辑质量和词汇覆盖率以及搜索算法的影响。整体上,词典法情感分析算法简明易懂但耗时费力,当目标文本比较复杂时,词典法将面临操作性困难。

2.机器学习法。基于机器学习的情感分析,又称“文本语料的统计学习与分类判别分析”,其操作原理是运用统计建模方法提取研究对象的词向量特征,构建特征向量空间并进行情感类型的分类判别计算。一般来说,根据研究对象是否需要标记训练样本以及训练样本标记体量的大小,基于机器学习的情感分析主要有以下三种研究范式。

其一,有监督学习。这是目前自然语言处理机器学习的基础方法,其操作的核心精神是样本训练与模型泛化,首先是选取样本语料进行情感词人工标记,然后进行分类算法数学建模并生成情感分类器,再将训练好的情感分类器应用于未标注数据来进行情感预测。诸如支持向量机(Support Vector Machine)、K 最近邻(K-Nearest Neighbour)以及朴素贝叶斯(Naive Bayesian)等算法,是目前有监督学习进行情感分类器训练的典型算法。整体上,有监督学习在实践中虽实现了局部智能化和批处理操作,但仍存在高度依赖人工标注数据和标注成本高等问题,难以应付社交媒体时代流式数据的挑战。①相关研究参见厉小军、戴霖、施寒潇、黄琦:《文本倾向性分析综述》,《浙江大学学报(工学版)》2011年第7期,第32—39页;邓楠、余本功:《基于情感词向量和BLSTM 的评论文本情感倾向分析》,《计算机应用研究》2018年第12期,第3547—3550页。

其二,无监督学习。无监督学习的目标是让计算机程序自己去领悟嘈杂数据的分类标准并计算情感极性和情感强度,不为情感判别指定可供学习逼近的案例目标,主要依赖数学上的超平面分类器算法(Hyper-plane Classifier)建立情感模式识别(Pattern Recognition)。简单来说,基于无监督学习的情感分析并不需要人工标记样本数据,计算机程序会根据聚类算法自动对样本间的相似性进行聚类统计,以实现类内差距最小化、类间差距最大化,从而完成非标记文本的情感模式识别。无监督学习的最大优势是无须对样本进行标注,可节省数据样本标注的人力支出,尤其适用于处理不断更新的大体量流式数据,其缺陷是训练样本规模要足够大、算力要足够强,但精度却不够高。②孙艳、周学广、付伟:《基于主题情感混合模型的无监督文本情感分析》,《北京大学学报(自然科学版)》2013年第1期,第102—108页。

其三,半监督学习。可视为有监督学习和无监督学习相结合的一种折中方法。其基本操作路径是使用少量有标记的训练数据,结合大量未标记数据,训练出具备“举一反三”能力的模型,从而帮助机器建立起强泛化认知功能,大大降低对数据标签的需求。与有监督学习相比,半监督学习无需标注太多的训练样本;与无监督学习相比,半监督学习又因为有人工判别的介入和案例样本的存在,有效提高了情感分类的训练精度。如Pseudo-Label 模型证实了半监督学习能够从无标签数据中提取有效信号;①Dong-Hyun Lee,“Pseudo-label:The Simple and Efficient Semi-Supervised Learning Method for Deep Neural Networks Workshop on Challenges in Representation Learning,” in ICML 2013 Workshop:Challenges in Representation Learning(WREPL),Atlanta,Georgia,USA,July 2013.Google 在2019年提出的UDA(Unsupervised Data Augmentation)框架,则大大提升了半监督学习的分析精确度。②Xie Q.,Dai Z.,Hovy E.,et al.,“Unsupervised Data Augmentation for Consistency Training,”June 25,2020,https://arxiv.org/pdf/1904.12848.pdf.由此可见,半监督学习不仅可以大大减少情感标注的人力成本,③Wiebe Janyce and E.Riloff,“Creating Subjective and Objective Sentence Classifiers from Unannotated Texts,”CICLing 2005:Computational Linguistics and Intelligent Text Processing,Vol.3406,2005,pp.486-497.而且与无监督学习相比,它提供了更结构化和可读化的结果。④Andrius Mudinas and et al.,“Combining Lexicon and Learning based Approaches for Concept-Level Sentiment Analysis,”in Proceedings of the First International Workshop on Issues of Sentiment Discovery and Opinion Mining,Beijing China,August 2012.

3.深度学习法。深度学习模型的核心是神经网络算法。简单来说,神经网络(Neural Networks)是一种仿生人脑神经元结构和信息处理模式的分布式算法,其最大技术特征是可以进行大规模并行计算和分布式存储,尤其适用于处理非线性问题。按照网络神经元的复杂程度,它一般可分为单隐层神经网络和多隐层神经网络;按照信息传递方式又可分为前馈型神经网络(如BP 网络)和后馈型神经网络(如Hopfield 网络),因其具有令人惊叹的运算速度、超强的容错能力以及出色的自组织适应性,神经网络近乎已成当下人工智能技术的“代名词”。

在情感分析领域,目前经常被使用到的神经模型主要是卷积神经网络(CNN)和递归神经网络(RNN)。前者包含了一个由卷积层和子采样层构成的特征抽取器,主要用于视觉计算并构建图像中的面部微表情识别,该方法在提升情感分析的精确度、情感分类的准确性以及模型的自适应性等方面均有卓越表现;后者属于循环神经网络的一种,主要用来计算树状结构的子、父节点连接距离,在自然语言处理中主要用来解决自编码和语句解析等问题,比如长短时记忆网络(LSTM)就属于一种典型的时间递归神经网络,它可以记忆不定时间长度的数值,允许计算模型根据以前的记忆来理解当下的语义,能够有效克服传统词典法词典不足的问题,也不用人为提取词向量特征,大大减少了工作量,并可使用GPU 来训练,缩短了训练时间。①严鹏:《基于深度学习的商品评论情感分类》,《软件》2019年第11期,第135—138页。

总体上,基于深度学习的情感分析方法能够适用于超大规模的信息处理,但是这种方法通常需要高性能计算机和大量的训练才能达到较高的满意度,训练成本相较于传统的机器学习方法更高。由于深度学习理论和技术目前还不是特别完备,其应用和发展也存在诸多争议,其在情感分析领域内的应用尚未得到真正展开。

综上所述,截止到目前,情感分析主要有词典法、机器学习法和深度学习法三种算法解决方案,分别对应信息的人工处理、统计学习和智能化计算三个技术阶段,反映了在不同历史阶段研究者们试图利用新技术来理解社会复杂互动的雄心抱负,同时也折射了当下学术潮流对传统理性范式的反思、扬弃与超越。

(二)情感分析的应用场景与政治洞察

情感分析不同于理性分析,它重新设定了国际关系研究的若干前提假设:(1)国际关系本质上是多层次的复杂人际网络,政治行为体身处复杂社会关联中并深受人际关系之影响,独立思考、理性决策虽是政治上一贯的美德,但在复杂人际关联中很难得以保持;(2)情感是政治感受的外在表达,同时也是人性的客观需求与价值期望,国际关系中的“人”是感情丰富多彩的,而不只是具有理性算计能力且专注于物质收益;(3)国际体系结构是由微观主体之间的互动所造就的,而情感联系又是微观互动的重要扰动因素,因而情感虽然飘渺且善变,但不应被排除在国际关系研究议程之外。基于上述假设,在国际关系研究中,大数据情感挖掘主要被应用于如下场景:

1.社会舆情监测。伴随着社交媒体的兴起,人们越来越习惯于借助网络工具进行政治宣传、发表政治观点和抒发政治情感,网络舆情监测遂成为大数据情感挖掘的政治试验场。借助大数据情感计算模型,主要是使用LSM 和LDA 等主题模型以无监督学习方式对隐含语义结构进行聚类统计,一国政府不仅可以即时监测本国公众和国际社会的政治关注主题,而且还能够有效探测社会情绪的涨落与社会冲突的可能爆发点,提供基于即时监测的社会舆论情报和趋势研判,从而有助于一国政府进行危机预防和实施精准政治沟通。譬如,一些学者将主题模型应用于“一带一路”海外舆情监测,通过主题挖掘得以观测海外民众对“一带一路”的讨论热度和态度变化。①赵常煜、吴亚平、王继民:《“一带一路”倡议下的Twitter 文本主题挖掘和情感分析》,《图书情报工作》2019年第63期,第119—127页。而另外一些学者则试图将情感分析应用比较政治,通过计算和观察两国舆论的情感距离,以求研判国家间关系的亲疏远近和潮涨潮落,进而探求数字时代的危机公关战略和新公共外交战略。②相关研究参见:Amaney A.Jamal,Robert O.Keohane,David Romney and Dustin Tingley,“Anti-Americanism and Anti-Interventionism in Arabic Twitter Discourses,”Perspectives on Politics,Vol.13,No.1,2015,pp.55-73; O’Connor,B.M.Stewart Brendan,and N.A.Smith,“Learning to Extract International Relations from Political Context,”present at the 51st Annual Meeting of the Association for Computational Linguistics,Sofia,Bulgaria,August 2013.如克里斯托弗·卢卡斯(Christopher Lucas)等人通过对比中国和阿拉伯国家有关“棱镜事件”的网络评论,探究了该事件在不同国家对美国形象所造成伤害程度的差异;③Christopher Lucas,Richard A.Nielsen,Margaret E.Roberts,Brandon M.Stewart,Alex Storer and Dustin Tingley,“Computer-Assisted Text Analysis for Comparative Politics,”Political Analysis,Vol.23,No.2,2015,pp.254-277.而纳撒尼尔· 钱伯斯(Nathanael Chambers)等人意图借助社交媒体中的情感信息建立民族国家之间的关系模型,重点聚焦了不同国家外交人员官方用语的主题变化和情感变化,揭示了情感词频观察在双边关系预测中具有指向性作用。④Nathanael Chambers,Victor Bowen,Ethan Genco,Xisen Tian,Eric Young,Ganesh Harihara and Eugene Yang,“Identifying Political Sentiment between Nation States with Social Media,”presented at the Conference on Empirical Methods in Natural Language Processing,Lisbon,Portugal,September 2015.

2.政治倾向分析。政治倾向分析的核心是政治极性判断,主要关注政治话语和政治文本中所蕴含的情感褒贬与政治立场归属,被广泛应用于选举预测、政治形象分析、党派立场调查和政府服务质量评价等诸多方面。以选举预测为例,政治倾向分析的基本操作原理是大样本采集新闻媒体报道和社交网络评论,利用主题分析和正负情感计算来监测候选人政治支持度的变化,比如2016年谷歌和微软都曾使用了情感分析来预测美国总统大选,所不同的是谷歌利用搜索算法和主题分析计算比较了候选人的社会支持热度,而微软则使用了词典法对近2000 万条新闻评论进行了正负情感分析,可惜的是由于算法和政治正确的原因,二者都没有成功预测到特朗普的逆势当选;⑤Walter Sun,“Bing Predicts:Election Primaries Recap,”June 16,2016,https://blogs.bing.com/search/june-2016/Bing-Predicts-Election-Primaries-Recap; Harry Enten,“How Much Did WikiLeaks Hurt Hillary Clinton?”December 23,2016,https://fivethirtyeight.com/features/wikileaks-hillary-clinton/.相反,较为成功的预测则是一家名为“剑桥分析”(Cambridge Analytica)的公司,该公司基于脸书(Facebook)的5000 万条选民数据利用心理侧写(psychological profiles)算法精准预测了美国选民的投票倾向,而在此之前,该公司已成功利用情感挖掘预测了英国脱欧派的可能胜利。①相关研究参见董青岭:《美国大选背后的数据军团》,《中国投资》2018年第5期,第40—42页;漆海霞:《大数据与国际关系研究创新》,《中国社会科学》2018年第6期,第160—171页。概括而言,与传统民意调查相比,大数据情感分析更能对选民的心理变化做出迅速反应,因而也更能把脉政治选情的瞬息万变,并成为现代选举预测的新利器。②Ferran Pla,Lluís-F.Hurtado,“Political Tendency Identification in Twitter Using Sentiment Analysis Techniques,”presented at the COLING 2014,Dublin,Ireland,August 2014.

3.暴力冲突预测。传统国际关系理论以“工具理性人”为前提假定,认为暴力冲突通常是特定社会结构压力下冲突各方理性抉择的结果,即冲突中的各行为体理性且自私,每一个冲突群体或个体都将冲突行动视为实现自我利益的手段,并从自身利益最大化出发计算成本与收益,考虑利弊、权衡得失;但实际上,冲突行动并不尽然是理性衡量的产物,暴力行为在爆发之前往往首先表现为情绪性发泄和盲目的从众行为,因而通过捕捉人际关系中的负面情绪聚合或可预测暴力冲突。③董青岭:《大数据安全态势感知与冲突预测》,《中国社会科学》2018年第6期,第172—181页。基于上述认知与逻辑,情感分析在大数据时代被广泛应用于非传统安全问题研究,在诸如预测恐怖主义、国际冲突、社会抗议和宗教极端主义等方面业已取得丰硕成果。譬如,通过跟踪恐怖主义痕迹和挖掘恐怖主义言论,研究者可以使用数据手段刻画恐怖思想的传播路径,进而采取针对性措施阻遏恐怖情绪的蔓延与扩散;④相关研究参见Kay L.O’Halloran,Sabine Tan,Peter Wignell,John A.Bateman,Duc-Son Pham,Michele Grossman,Andrew Vande Moere,“Interpreting Text and Image Relations in Violent Extremist Discourse:A Mixed Methods Approach for Big Data Analytics,”Terrorism and Political Violence,Vol.31,No.3,2019,pp.454-474; Michael Fire,Rami Puzis,Yuval Elovici,“Link Prediction in Highly Fractional Data Sets,”in V.Subrahmanian,eds.,Handbook of Computational Approaches to Counterterrorism,New York:Springer,2013,pp.283-300.再如,通过捕捉和分析对峙国家民众态度和情绪表达,研究者可以有效预测国际冲突,进而敦促国际社会及各国政府采取有效危机应对策略;⑤Anna Rumshisky,Mikhail Gronas and et al.,“Combining Network and Language Indicators for Tracking Conflict Intensity,”SocInfo 2017:Social Informatics,Vol.10540,2017,pp 391-404.此外,情感分析在世界贫困救助、人道主义救援、犯罪预防以及气候治理等方面也有上佳表现①相关研究参见董青岭:《精准农业:数字时代的反饥饿运动》,《中国投资》2018年第21期,第24—25页;朱玉良,王丽萍:《大数据在传染病监测中的应用研究进展》,《安徽预防医学杂志》2019年第5期,第370—373页。。

四、情感分析的前景:拓展空间和当前缺陷

总体来看,大数据情感分析在国际关系领域内极具应用价值。基于大数据的情感分析具有抽取样本量大、处理速度快和政策反应智能化程度高等特点,能够有效提升社会舆情的把脉范围,助力社情民意的即时收集与反馈,同时还能有效降低政策产出的人力、经济与时间成本,堪称数字时代政治分析的新路径。但是,由于情感分析技术本身仍处于初步发展阶段,特别是在国际关系领域内相关语料资源建设匮乏、相关理论构建尚不完善,其未来发展也面临诸多困境。

(一)大数据情感分析的优势

1.数据处理成本低、效率高。大数据情感分析依托高性能GPU 和分布式计算可以迅速处理大规模的数据流,相较以往的人工编码成本更低且效率更高。传统上,由于资金、人力、时间和设备资源的有限,研究者通常只能采集小规模的政治样本(如政府文件、领导人讲稿或民意调查报告等)进行分析,由于数据规模的局限性、抽样人群的特殊性以及问卷设计的技术误差等因素,传统情感分析往往无法捕获调查人群的真实政治情感,即便捕获到了也因样本规模小而无法映射真实世界的普遍性。②Julio Cesar Amador Diaz Lopez,Sofia Collignon-Delmar,Kenneth Benoit,Akitaka Matsuo,“Predicting the Brexit Vote by Tracking and Classifying Public Opinion Using Twitter Data,”Statistics,Politics and Policy,Vol.8,No.1,pp.85-104.就此而言,大数据与情感分析技术的结合,可在短时间内进行高维度的数据处理和情感计算,并直观展示情感变化的时间序列趋势和空间分布状态,从而为政治决策提供坚实的材料支撑。

2.政策反应时效快、预测性强。当前,由于社交网络的应用,人与人之间的联系较之以前更为紧密,信息传递也更为迅猛和及时,全球社会已因微观主体之间的高频互动被链接成一个超级复杂巨系统,世界任何一个角落里的微观情绪发泄都有可能触发影响全球的“蝴蝶效应”。①相关研究参见董青岭:《数据力量的崛起与新秩序的形成》,《世界知识》2019年第20期,第24页;维克托·迈尔-舍恩伯格,肯尼斯·库克耶:《大数据时代:生活、工作与思维的大变革》,盛杨燕、周涛译,杭州:浙江人民出版社,2013年,第67—96页。在此情形下,情感分析重在关注传统政治研究中那些经常被忽略或被漠视的微观非理性因素,诸如某位政治家在不经意言谈中所透露出来的情感立场、选民在网络搜索和讨论中的政治表达与政策评价、甚至政治互动中个性化表情符号的运用,等等。借助大数据平台的快速处理能力,情感分析能够有效捕捉弥漫于政治表达中的不满、恐惧和愤怒,进而感知社会矛盾的发展演变,并给出具有针对性的政治解决方案。②相关研究参见Andrés Montoyo,Patricio Martinez-Barco,Alexandra Balahur,“Subjectivity and Sentiment Analysis:An Overview of the Current State of the Area and Envisaged Developments,”Decision Support Systems,Vol.53,No.4,2012,pp.675-679; Huberty Mark,“Can We Vote with Our Tweet? On the Perennial Difficulty of Election Forecasting with Social Media,”International Journal of Forecasting,Vol.31,No.3,2015,pp.992-1007.整体上,基于大数据的情感分析,政策反应敏捷、及时且精准。

3.研究过程容错高、完整性强。作为一种新的数据类型,尽管大数据本身噪声多、价值密度低,但基于大数据的情感分析较之人工操作仍表现出较高的容错能力。③李文、邓淑娜:《大数据时代中美关系发展的机遇与挑战》,《中国社会科学院研究生院学报》2015 第3期,第126—133页。首先,计算机在进行数据分析时能够摒弃主观评估过程的各项干扰,最大程度的降低人工编码的政治立场影响,并能够以统一标准清洗和规整研究数据,减少数据预处理中的操作失误并提高数据一致性;其次,大数据与民意调查不同,它采取的是主动式数据挖掘而不是被动式或奖励式意见问答,加之网络空间的匿名性可以使人们充分表达自己的真实政治观点,因而大数据情感分析较民意调查更有可能洞察人们的真实政治需求;最后,大数据信息采集多采用爬虫许可与信息请求模式,基本可以做到数据来源可追溯、可验证,因而数据的完整性和溯源性比较强,而不是关于政治情感的零散数据分析。

(二)大数据情感分析的缺陷

1.研究数据噪声大、训练难度高。作为一种技术性研究路径,大数据情感分析的准确性受到多重因素的影响和制约,如文本噪音和分类器的选择。一方面,由于网络用语的随意性和非正式性,给文本信息的提取造成了很大的噪声,可能会出现语义颠倒、语义难以识别和语义混淆等困难,同时中文语法中存在着一词多义和多词一义现象,有时会产生对立语义,而目前尚缺乏较为成熟的过滤技术来有效应对这些问题。①相关研究参见董青岭、王海媚:《21世纪以来中国的大数据国际关系研究——董青岭教授访谈》,《国际政治研究》2019年第4期,第141—160页;J.Fernando Sánchez-Rada,Carlos A.Iglesias,“Social Context in Sentiment Analysis:Formal Definition,Overview of Current Trends and Framework for Comparison,”Information Fusion,Vol.52,2019,pp.344-356.另一方面,在样本训练和模型优化过程中,由于社交媒体数据的短小和表达方式的多种多样,上下文关系衔接并不紧密,甚至还有越来越多的网络词、火星语和变形词出现在训练样本中,很容易导致分类器的训练出现偏差和误差,进而影响情感分析的准确度。

2.语言结构多样化、语义解析难。网络语言结构复杂、句式多元且创新强,导致情感分析经常面临隐含语义推断困境。相比结构化整齐划一的统计数据,大数据情感分析主要的处理对象是纷繁芜杂的非结构化散言碎语,其标准化操作流程是首先要将非结构化自然语言转化成可以统计分析的结构化数据,因而在语义析取中大数据情感分析要应对诸如比喻、附和、讽刺和正话反说等复杂语法现象。有时,风俗俚语、人造新词和舶来词汇的移植与借用,会带来严重的语义理解的偏差和误差。除此以外,句式的复杂性如祈使句、疑问句、否定句和反问句以及句式的不同搭配,也都会对自动编码和机器学习造成难以消除的干扰。②相关研究参见周立柱、贺宇凯、王建勇:《情感分析研究综述》,《计算机应用》2008年第11期,第2725—2728页;李纲、程洋洋、寇广增:《句子情感分析及其关键问题》,《图书情报工作》2010年第11期,第104—107页。当然,如果考虑到政治语言的隐晦性和象征性,那么基于机器学习的语义理解则更是难上加难。总的来说,由于语言结构和语法问题导致的训练稀疏性和不均衡性,都会造成情感分析失去一定精准度。

3.技术要求门槛高、操作难度大。作为一种跨学科研究范式,大数据情感分析所要瞄向的是计算机自然语言处理技术与政治洞察的结合,因而其实战运行既需要有计算机编程技术的支撑,同时更需要有来自国际关系学和政治学基础理论的指引。整体来说,在国际关系研究领域,大数据情感分析尚处于萌芽发展阶段,相关的技术积累和配套资源建设还不够完善。首先是跨学科编程人才的匮乏,目前的研究者要么来自计算机领域,缺少政治的敏锐洞察,要么是来自政治科学领域,概念阐述多、实战操作少;其次,面向国际关系领域的专业性情感词典的编辑缺位,目前绝大多数的政治情感分析所使用的情感词典主要是各学科通用词典,没有考虑政治语言和政治文本的领域特殊性,因而情感分析精度不高;①相关研究参见Hogenboom Alexander,Bas Heerschop,Flavius Frasincar and Uzay Kaymak,“Multilingual Support for Lexicon-based Sentiment Analysis Guided by Semantics,”Decision Support Systems,Vol.62,2014,pp.43-53; Mullen Tony and Malouf Robert,“A Preliminary Investigation into Sentiment Analysis of Informal Political Discourse,”paper presents at Computational Approaches to Analyzing Weblogs Conference,Stanford,California,USA,March 2006.再次,面向国际关系领域的大数据计算平台的缺失,大数据情感分析需要处理大体量的数据,这就需要高性能的硬件平台(如高速硬盘集群)和计算软件的支持,但由于这类平台建设技术难度高、投入成本大,在国际关系领域内尚不多见。最后,由于情感分析技术首发于英语国家,相关词典和技术建设也多以英语为语言基础,对于对非英语国家的政治研究者而言,情感分析技术在开发和验证时表现出强烈的语言偏见,同时可用于非英语语言的情感分析工具数量少,且输出质量低,②Saif M.Mohammad,“Sentiment Analysis:Detecting Valence,Emotions,and Other Affectual States from Text,”in Herbert L.Meiselman ed.,Emotion Measurement,Woodhead Publishing,2016,pp.201-238.为国际关系的跨语言研究带来一定困难。

五、结语

伴随着社交网络的崛起和人工智能时代的到来,大数据情感分析将会成为国际关系研究朝向工程应用的一个重要创新领域。不同于传统的理性分析范式,大数据情感分析重新假定了国际关系是一个感情丰富的情感世界,在这个人人彼此关联又相互扰动的复杂世界里,情感表达与情感联系是人性的客观表现,任何政治行为体的决策都难逃社会关系的束缚并深受情感伦理之影响,因而通过捕捉、观察数以百万计的微观主体之间的情感联系与互动,大数据情感分析或可建立起观察国际政治变动的“情感温度计”。总体来讲,大数据情感分析具有数据处理成本低、政策反应速度快和预测精度高等优势,尤其适用于舆情监测、危机预警和政治极性分析等社会感知领域,但本身也存在数据噪声大、训练难度高和技术门槛高等问题。放眼未来,在云计算环境下,大数据情感分析有助于研究者洞察人性中的非理性因素,进而提供基于精细情感分析的政治洞察和政治建言。当然,其发展当前也面临诸多困境,亟待克服和解决。

猜你喜欢

政治情感分析
“讲政治”绝不能只是“讲讲”
隐蔽失效适航要求符合性验证分析
如何在情感中自我成长,保持独立
情感
“政治攀附”
“政治不纯”
政治不过硬,必定不可靠——政治体检不能含糊
诗歌与情感的断想
电力系统不平衡分析
如何在情感中自我成长,保持独立