APP下载

基于情感挖掘和话题分析的旅游舆情危机演化特征

2019-10-15李勇蒋冠文毛太田蒋知义

旅游学刊 2019年9期
关键词:情感分析

李勇 蒋冠文 毛太田 蒋知义

[摘    要]现有旅游业危机管理体系缺乏对旅游舆情危机的关注。该研究聚焦旅游业的舆情危机,从情感传播的视角对旅游舆情危机的演化规律和行为特征进行深入剖析,尝试探寻旅游舆情危机传播演化的一般性规律。文章以“丽江女游客被打”事件为例,采用网页数据采集工具爬取互联网中新闻报道和用户评论的相关数据,通过提取危机关键词、识别舆情话题、计算情感强度,并结合危机生命周期的阶段性特征,对旅游舆情危机进行综合分析。研究结果显示:(1)公众心理存在“放大效应”,对危机事件的评价更容易被舆论场中最突出的行为特征所掩盖,而忽视事件自身客观规律,导致以点概面的评价结果;(2)事件引发的舆情话题存在纵深发展和横向扩散两种演化方式,并衍生出新的话题,新的舆情话题伴随着负面情绪的波峰出现;(3)由公共安全引发的旅游舆情危机突发且易逝,事件生命周期长度具有显著的不确定性,与现实中案情调查进展、政府应对及信息公布和突发新闻等影响因素密切相关。

[关键词]旅游舆情危机;情感分析;话题分析;演化特征

[中图分类号]F59

[文献标识码]A

[文章编号]1002-5006(2019)09-0101-13

Doi: 10.19765/j.cnki.1002-5006.2019.09.014

引言

近年来,我国旅游市场负面新闻频发,一些广受关注的负面事件引起了社会各界的舆论轰动,如“青岛天价虾”“凤凰古城收费事件”“丽江女游客被打”事件等。这些事件不但干扰了当地旅游企业的正常营运,造成经济上的损失,还会损坏旅游地的形象,对其声誉和口碑造成长远的危害。而这种危害又往往取决于事件所引发的舆论声势——实质上是负面事件经过传统媒介和互联网新媒体的传播曝光,在互联网环境中引发广泛讨论,进而降低公众(潜在游客)的出行意愿,甚至引起公众对当地旅游市场的集体抵制与抗议。由于旅游业的高度依赖性和敏感性等行业特点,任何非常规事件的发生,都易使当地旅游市场深陷舆情危机,互联网新媒体的广泛普及也加剧了这一现状。然而,如何对旅游市场的舆情现象进行系统科学的解释,如何厘清旅游舆情危机的内在演化规律和传播特征,并将国内外已有的方法体系和理论成果运用到我国旅游业的危机管理中来,已经成为当下亟待解决的研究课题。为此,本研究以“丽江女游客被打”事件为例,通过采集互联网上的“数据痕迹”作为原始材料,采用情感分析和话题挖掘等方法,以公众负面情绪作为旅游舆情危机的测度工具,结合危机事件生命周期理论,对旅游舆情危机进行综合分析。尝试回答以下问题:(1)互联网环境中,公众对旅游舆情危机表现出何种普遍性的行为特征?(2)旅游舆情危机演化的阶段特征是什么?这些特征对舆情话题的演变和公众情绪产生了何种影响?(3)影响危机生命周期的因素有哪些?

1 文献回顾

关于旅游业危机认知的前期研究中,最早对旅游业的危机进行系统性梳理的是邓冰等于2004年发表的《国内外旅游业危机管理研究综述》,该文在收集了大量国内外文献资料的基础上,从危机产生的根源上把旅游业危机划分为受其他行业波及(如战争、金融风波、恐怖主义、公共卫生危机)引起的危机和旅游业内部(如针对游客的恐怖袭击、饭店火灾、旅游娱乐设施发生意外等)的危机两大类[1]。而后陈文君就旅游景区的主要危机进行划分,即细分为战略危机、目的地危机、突发事件危机等十几种形式[2]。李锋在沿用世界旅游组织(WTO)对旅游危机的定义(“影响旅游者信心,并会危及该地旅游业持续正常运转的任何不曾预见的事件”)基础上,将旅游危机事件的性质划分为自然灾害事件和公共卫生事件[3]。这些研究聚焦于战争、自然灾害、恐怖袭击事件、公共突发性事件等旅游危机事件,形成了丰富的研究成果,为后续学者提供了宝贵经验。

2013年4月“凤凰古城收费事件”发生以后,我国学者开始从公众舆论的视角出发,首次将旅游市场的舆情危机纳入考量,并就此类危机展开专项研究。付业勤等将网络空间的舆情信息考虑进影响旅游现象的因素当中,以“湖南凤凰古城收费事件”为研究案例,根据网络关注度走势,划分出舆情演化的不同阶段,指出旅游危机事件网络舆情演化的阶段性特征[4],并建立了危机预警指标体系[5]。罗秋菊等人研究了“占中事件”在微博上引发次生舆情危机(secondary crisis communication)的传播机理,深入探讨了社交网络中次生危机如何使政治事件演化为旅游联合抵制的问题,并将之视为旅游目的地危机管理(crisis management in tourism destinations)在互联网思维下的补充[6]。祁凯和杨志将“三亚宰客事件”“青岛天价虾事件”等负面事件划归为由人为因素导致的旅游公共危机,认为旅游市场的宰客、欺诈、打人等恶意行为严重威胁到旅游业的正常发展和旅游者的旅游信心,并以“青岛天价虾事件”为研究案例建立了政府、旅游企业和旅游者的三方博弈模型[7]。

整体看来,围绕旅游业舆情危机的相关研究取得了一定进展,但仍有不足,这主要体现在对旅游业中舆情危机的概念和范畴的理解和认识上。虽然舆情信息的传播实质上扰乱了当地旅游业的正常经营,削弱了潜在游客的出行信心,但被曝光的负面事件本身往往并不具有很大的破坏性,而由其引发对当地政府以及旅游部门的舆情追责才构成了真正的危机。这与前期研究中聚焦于战争、自然灾害、恐怖袭击事件、公共突发性事件等常规性旅游危机事件存在性质上的不同,相关学者将旅游市场的舆情危机籠统地归于“旅游危机”并不恰当。这说明,学界对此类危机的研究仍处于初级阶段,对“旅游危机”的界定尚未达成统一意见。笔者认为:那些由旅游地某一刺激事项所引发,在相对较短的时间内生成大量信息,这些信息的“矛头”直指当地政府和相关旅游组织,并在更大区域内掀起范围更广、强度更强的社会反映,最终危害旅游市场声誉,影响当地旅游业正常运营,是为旅游舆情危机。其目的是借助网络舆论,寻求自身利益诉求,其后果在于会损害旅游目的地形象,打击潜在游客的出行信心。

2 研究设计

2.1 研究方法

2.1.1    情感分析

根据上述对旅游舆情危机的定义,危机的发生会对旅游市场的正常运营造成实质性破坏,并且会损害旅游地形象,打击潜在游客出行的信心。而游客的这种信心,则直接反映在其行为和态度所表现出的情感倾向中。具体而言,积极的情感情绪有利于增长潜在游客对于旅游目的地的信心和出行意愿,消极情绪则会破坏这种信心,使潜在游客放弃原定的计划。因此可把互联网上的负面情感视为舆情危机的一种测度工具。

情感分析旨在对用户发表的带有情感倾向的评论、意见、观点等文本数据自动进行甄别,同时计算每一条文本数据的情感强度,通过统计情感值的分布和变化趋势,从而跟踪和观测网民的情绪变化。基于词典的情感分析是通过提取待分析语料文本中的领域主题词,对这些主题词进行情感极性和强度的标注,同时借助现有的通用情感词典,构建一个完整的情感分类特征词典。该方法的关键是通过人工标记,为现有的情感词典补充领域特征词,构建一个全面的、能够涵盖特定事件全部情感特征的词典[8]。目前,中文通用情感词典的发展已较为完备,如“清华大学中文褒贬义词典”1收录了人文社会科学领域的常用情感词;知网HowNet情感分析中文词表1不仅对常用的公共领域情感词进行了收录,还根据句式区分了不同句型的情感权重;大连理工大学中文情感词汇本体库2覆盖了名词、动词、形容词、俗语和近几年的微博网络用词。其中,知网HowNet常被国内学者用作构建领域扩展词典的基础词典。基于词典的情感分析方法在分析舆情危机事件中具有较好的适用性和准确率,在各大领域广泛使用,近年来也有学者专门针对旅游市场,提出了旅游网络在线评论的情感词典构建方法[9-10],取得了可喜的进展。

2.1.2    话题分析

传统的危机传播研究视角认为,消除危机的根本任务是说服公众与危机相关的各个利益攸关方危机已经结束。为了达到该目的,组织对危机事件进行跟踪报道、发布事件的进展和处理结果,媒体对这些信息活动进行加工传播,公众围绕组织发布的信息活动来表达其观点和态度[11]。这种由组织、媒体、公众之间组成的互动关系,在现代互联网新媒体平台下,表现为危机曝光后相关信息的持续发酵和相关话题的发生、衍化、迁移[12]。不断演化的话题为分析和监控舆情诉求提供了重要窗口。

已有研究表明,高影响力的话题往往受到更高的关注和认同,并被认为是舆情产生的萌芽期和初级阶段[13];类型不同的话题事件在互联网上的传播也具有差异性,在中文微博中,社会热点和突发事件的微博话题具有比其他微博话题更深更广的传播性[14];在Twitter上,国际性议题和旅游信息则是最流行的话题[15]。

2.1.3    关键词分析

话题分析能够描述危机事件在组织、媒体、公众三方交互作用下的动态发展过程以及揭示舆情诉求的变化,关键词分析则能从更小的粒度刻画危机事件在舆论场中传播的普遍性特征。由于互联网相对自由的舆论环境,网民的评论观点通常被看作其情感态度的真实反映,但海量无序的评论信息中是否存在具有普遍代表性的观点和意见?若存在,如何从随意和零散的用户评论信息中提取?以何种形式呈现?

齐普夫定律为这个问题提供了可行的思路,该定律认为,在印欧语系的长文章中,大多数词被很少使用,只有極少数词经常被使用,这些少数的词语表达了文章大多数价值[16]。许文霞在1986年证明了齐普夫分布规律在汉语语系中具有同样的适用性[17]。因此,齐普夫定律为从海量的用户评论数据中提取能够刻画舆情危机特征的关键词提供了理论上的可行性。若把从信源平台上采集的有关旅游舆情危机事件的评论数据视为一个语料集合,把词语出现的频率视为大致衡量关键词刻画危机事件的能力标准,同时语料集合中的词语符合齐普夫分布,则可以通过适当的文本处理技术和关键词赋权算法,从海量数据中提取描述危机特征的关键词,最后以适当的可视化方法呈现出来。

2.1.4    危机事件生命周期理论

对危机事件的生命周期阶段的划分,学界普遍认同的是Mituoff提出的M模型理论[18]和Fink提出的四阶段理论[19]。前者把危机划分为信号侦测阶段、损失控制与处理阶段、恢复工作阶段、危机事后学习阶段;后者将危机的生命周期划分为征兆期、发作期、延续期和恢复期。通过对M模型理论和四阶段理论的不断修正,形成了一种被普遍使用的危机事件生命周期划分方法,即将危机的生命周期划分为:潜伏期、爆发期、延续期和消退期4个阶段[20-24]。中国社科院在2016年年末发布的“中国社会心态研究报告”指出,网民的注意力易受热点事件调动,往往不经任何预热便迅速传遍网络,同时,注意力消散也很迅速,对热点事件的关注一般不超过72小时,但在危害人身安全的恶性犯罪事件中则表现出更高的关注度[25]。这符合我国当下舆情危机的传播事实。本文综合现有危机传播生命周期理论与研究案例自身特点,将危机生命周期划分为热议期、冷却期和消散期3个阶段。

2.2 数据采集

样本数据的选择对旅游舆情危机研究的结论影响甚大,因此选择具有典型意义的案例至关重要。根据人民网旅游3·15投诉平台2014—2016年公布的旅游投诉舆情来看,云南旅游投诉率连续3年据全国榜首,是我国旅游投诉重灾区[26],而2017年新年前后丽江负面新闻成为持续的舆情沸点,直接导致了2017年春节期间云南游客的锐减,因此选择“丽江女游客被打”事件的相关数据作为研究样本具有一定的代表性和现实意义。此外,以“丽江”“被打”为主题在中国知网文献库进行检索,仅有12篇相关文献,其中,只有5篇文献来源于期刊论文,其余均来自报纸。相较于往年旅游舆情危机事件的研究(如2013年凤凰古城收费事件、2015年青岛“天价虾”事件等),本案例的研究极少,并且大多数是以对案情进行报道和还原事件原委的报纸为主,对案例进行量化分析,深入探讨互联网环境中旅游舆情危机传播特征的研究几近于零,这与该事件造成的社会危害严重不符,也正是由于以上现状,使本文的研究案例锁定于“丽江女游客被打”事件。

2.2.1    事件回顾

2016年11月11日凌晨3点左右,网名为“琳哒是我”的女游客与其朋友在丽江古城的某烧烤店就餐时,与当地一群男子发生语言冲突,遭多名男子辱骂殴打半个小时,被用碎酒瓶划脸至其毁容,并遭其威胁恐吓。在随后的报案和鉴定伤情的过程中,“琳哒”声称自己遭到了当地政府和医院的不公平对待。2017年1月24日深夜,被打女游客在其新浪微博主页中曝光了其在丽江遭恶性毁容抢劫的消息,呼吁网络还她公道。随后,此事在网络上被网友关注转发,并引起媒体关注,纷纷进行转载报道。截至2017年1月26日21时,微博、网站、论坛、新闻、微信等各类媒体对该事件进行了大肆跟踪报告,全网关于“丽江女游客被打”事件的信息总量达84.7万条,其中,新浪微博的相关数据达83.8万条,占数据总量的98.9%1,远高于其他媒体,成为了该事件主要的传播平台。

2.2.2    数据获取与预处理

(1)选择网络信源。基于新浪微博对该事件的报道量高达99%,已接近互联网上关于此次危机事件的信息全量。因此,本文将新浪微博作为主要网络信源;并辅以财经网、头条新闻、华西都市报、新华网、中国青年网和环球时报等对事件传播扩散推动较大的网络媒体的实况跟进和评论报道作为数据补充。

(2)确定时间区间。为了突出研究的针对性,本文采集了舆情关注度较高的“丽江女游客被打”事件曝光后的25天(2017年1月24日21:30—2017年2月18日21:30)新浪微博相关报道数据,并以8小时为单位划分时间窗,为下文计算统计时段内的情感值强度做准备。

(3)确定检索词条。由于新浪微博中数据评论的随意性和零散性,社会现实当中的真实事件可能拥有多个与之对应的微博话题,为了更加全面和精确地采集该事件的有效信息,对“丽江女游客被打”事件分别以“丽江女子被打”“丽江恶性毁容抢劫”和“琳哒是我”3组词条作为检索关键词,以“原创微博”作为限定条件分别进行检索。

(4)爬取数据。在时间区间和词条检索下,使用网络爬虫工具八爪鱼软件,对检索目录下的数据进行爬取,爬取内容包括:① 用户名;② 发布时间;③ 发布内同;④ 发布方式;⑤ 发布网址;⑥ 用户主页;⑦ 用户UID;⑧ 转发数;⑨ 评论数;⑩ 点赞数。将爬取的微博数据保存在Excel表格中;对各大网络媒体的报告数据采取与微博数据同样的形式并入整体数据集中。

(5)初步清洗。使用Excel删除重复项、空白项;剔除广告信息、垃圾信息等无关项。最终得到初始数据。

3 分析过程

3.1 关键词权重计算

为了刻画“丽江女游客被打”事件在新浪微博平台上的传播的普遍性行为特性以及主要情感态度,对初始数据进行文本可视化处理。关键词可视化系统通常包含以下步骤:

(1)对获取的初始数据进行分词处理,去除停用词。

(2)统计词频,得到待分析语料词分布特征。

(3)进行关键词提取,并为这些关键词加权,得到带有权重的词语。

(4)针对提取到词语的特征信息,选择合适的可视化表达方式,并以计算机编码或图形设计的手段進行可视化呈现。

(5)用户与可视化图形的交互。

tfidf权重法因其具有较强的普适性和相对简单易行的操作,成为文本分类特征项赋权方法中最重要的计算方法之一[27]。通过tfidf算法计算“丽江女游客被打”事件待分析语料数据中关键词权重,具体计算公式如下:

[tfi,j=ni,jknk,j] (1)

式(1)中,ni, j表示词语ti出现在“丽江女游客被打”事件待分析语料数据集合(dj)中的总次数。[knk,j]表示该待分析语料数据集合中全部词语个数。

[idfi=lgDj:ti∈di] (2)

式(2)中,[D]表示“丽江女游客被打”事件待分析语料数据集中的微博总条数。[j:ti∈di]表示“丽江女游客被打”事件待分析语料数据集中包含了词语ti的微博条数。

计算词语ti在待分析语料数据集中tfidf值的公式为:

[tfidfi,j=tfi,j?idfi=ni,jknk,j?lgDj:ti∈di] (3)

通过综合考虑关键词的词频特征(tfidf值)和情感特征(情感强度等级T),则可进一步定义情感关键词的重要性,令词语ti的重要性为Ii,Ii的计算公式为:

[Ii=tfidfi?Ti] (4)

部分计算结果见表1。

3.2 微博话题发掘

在信息检索领域,热点话题发掘一直是中文文本分析中一项重要研究工作,但相比于传统的网络长文本信息,新浪微博本身具有更为复杂的关系:同一话题事件可能产生多个与之相关的话题;这些话题会在一定条件的触发下衍生出新的舆情话题[28]。在微博平台中,不同的话题通过“#”和中间包含的话题名称加以区分表示,这种包含一个字串“#丽江打人#”的标记方式被称为“话题标签”。通过标记方式可以揭示文本主题,并对话题事件进行发现与跟踪[28]。这种方法在分析微博文本数据时,能有效克服传统长文本热点话题发掘方法中或是脱离事件内容本身,只分析了趋势的变化,或是完全依赖文本内容,缺乏灵活性等不足,但由于微博将“话题标签”当作文本正文本身的一部分引入,因此在分析过程中应当注意对关键词提取的影响。

本文以“丽江女游客被打”事件的微博评论数据作为待分析文本,基于微博“标签”功能提取危机事件的相关话题,该事件在新浪微博中的相关话题以及对应话题事件见表2。

3.3 危机事件中的情感分析

3.3.1    构建情感分类领域特征词典

基于词典的情感分析方法关键在于构建一个能全面地反映特征本体全部情感要素的词典。本文选取大连理工大学情感词表作为构建本文领域特征词典的通用情感词典,该词典将词汇本体的情感分为7大类21小类,包含0(中性),1(正面),2(负面)3种情感倾向和1、3、5、7、9五种情感强度等级,共收录情感词27 466个。本文中领域特征词典的构建方法具体如下:

(1)对“丽江女游客被打”事件待分析语料数据集进行分词处理,并通过停用词字典去除语料库中的部分介词、代词、语气助词等。此步骤处理后的词汇集为X。

(2)令大连理工大学情感词表中的全部词语为集合Y,定义集合Z=X-Y,Z即领域补充主题词集。

(3)进一步去除集合Z中的指示词以及无关名词,得到扩展词汇184个,然后根据大连理工大学情感词汇本体库的标注规则,人工标注这些词汇的情感倾向和强度。

(4)根据“丽江女游客被打”事件的舆情环境,对通用情感词典中的部分情感词重新标注情感强度。此步骤在于消除同一词汇在不同语境下可能存在的情感倾向差异所引入的误差。例如“轻薄”一词,在对电子产品的评价信息中属于正面词汇,而在对女性的形容中则有负面含义,因此需要对部分情感词重新定义情感倾向和强度。

(5)步骤3和步骤4中人工标注情感强度的流程和标准参考文献[29],标注后的词汇并入大连理工大学情感词表中,获得此次事件的领域特征词典,共包含情感词汇27 650个。

3.3.2    单位时间内的情感强度计算

根据本文2.2.2部分确定的时间区间,将采集的相关新浪微博数据以8小时为单位划分成75个统计时段,每个统计时段的所有微博数据归并为一个微博语料集合。

定义集合D={Wn|n=1,2,3,…,75}为确定时间区间内所有的微博语料数据集,Wn代表第n个统计时段内所有的微博语料集合;对任意一Wn有Wn={Bj|j=1,2,3,…},Bj代表集合Wn中第j条微博;对任意一Bj有Bj={Sk|k=1,2,3…},Sk代表集合Bj中的第k条语句;对任意一Sk中有Sk={Ti|i=1,2,3…},Ti代表Sk中包    含的第i个情感词ti的情感强度。单位时间内的情感强度计算规则如下:① 计算微博中每个句子的情感强度[F(Sk)=F(Ti)],其中[F(Ti)]为句子中所有情感词的情感极性强度之和;② 考虑不同句型对  情感表达的差异,不同句型[F'(Sk)]的计算方法[30]如表3所示;③计算每条微博的情感值[F(Bj)=][F'(Sk)],其中[F'(Sk)]为微博中所有句子的情感极性强度之和;④计算每个统计时段内的情感值[F(Wn)=F(Bj)],[F(Bj)]为统计时段内所有微博的情感强度之和。

4 分析结果

4.1 关键词可视化分析

危机事件发生后,以新浪微博为网络信源,对“丽江女游客被打”事件的初始语料数据进行文本处理和关键词提取,进而得到危机事件舆情语料的关键词特征。定义关键词ti的词频为f,词频为f的关键词个数为n,去除特殊点(词频为5094的“丽江”一词)后统计关键词词频f和对应关键词个数n的分布情况,绘制面积图(图1a),发现“丽江女游客被打”事件微博关键词分布呈现长尾分布,曲线头部的少数关键词反映了文本内容的主要信息,而大多数出现频率较低的关键词,则在曲线后部形成了一条“长尾”。将f和n分别取对数,令横坐标为lg(f),纵坐标为lg(n)绘制散点图(图1b),对图形进行曲线拟合,取对数后的词频分布呈线性分布特征,经验回归方程的确定系数R2=0.90978,拟合度高。结果显示,该危机事件微博关键词的分布符合齐普夫分布定律。

根据3.1部分提出的关键词赋权方法,计算危机事件语料文本中关键词的权重,绘制关键词词云(图2)。分析发现,网民舆论的侧重点集中体现在少数重要程度高的关键词上(tfidf值大于100的词条有146个,信息量占比48.8%),这部分关键词体现了网民对该事件的观点看法与主要诉求,如“云南”“鉴定”“女子”“警方”“真相”“调查”“政府”等。而数量上占大多数,但重要程度较低的关键词(tfidf值小于100的词条有8669个,信息量占比51.2%),则体現了舆论场中网民观点主张的多样性。具体呈现以下特征:

整体而言,“云南”“鉴定”“警方”“政府”“真相”等词最为突出,特别地,“云南”一词是描述该危机事件地理位置特征最突出的,也是词云中最突出的关键词;“古城”则是类型特征中重要程度最高的关键词;虽然“丽江”是出现频率最高的关键词,同时还是危机事件发生的所在地,但是词云中的表现程度却远不如“云南”;在描述地理位置特征的关键词中,突出程度方面表现为:云南>丽江>大理,并且“云南”的重要程度远高于其他词。这说明此次舆情事件的讨论焦点不再仅仅是丽江,同时也扩散至大理、香格里拉等云南省其他的旅游城市或景点,公众对此次危机事件的“口诛笔伐”已经由点及面地从发生城市上升至发生省份,这可能与舆情历史等原因有关。

值得注意的是,以往的研究通常根据词频的高低排列区别不同关键词的重要程度。本研究通过tfidf计算关键词权重,对关键词权重进行排序,得到的主题关键词能更加精确地描述危机事件在互联网上传播的特征。例如“丽江”一词在待分析语料数据集中出现次数最高,达5094次,远高于其他词条,但是权重却只排在第61位,这是由于样本选取是以“丽江女游客被打”事件作为“话题标签”进行数据挖掘,“丽江”一词存在于该话题下的所有微博当中,因此认为“丽江”一词不能很好地识别该危机事件的特征。tfidf算法能有效规避“话题标签”对关键词权重计算所产生的影响,同时降低了单纯依据词频高低确定权重所带来的误差。

进一步考虑情感关键词权重(tfidf值)和情感强度等级(T)作为重要性依据,根据公式(4)计算“负面情绪关键词”和“舆情诉求关键词”重要性,结果如图3所示。

4.2 情感扩散的时间特征分析

危机事件发生后,网友通过微博评论表达主观情绪具有明显的时序特征,并且负面情绪占比高达58.36%,大多数评论表现出对此次事件的震惊、愤怒,以及对政府的追责和渴望调查真相等舆情诉求。信息扩散过程呈现出明显的阶段性特征。舆情经过短时间的汇聚,在某个时刻爆发式增长,经过几天时间发酵达到峰值;随后雪崩式下降,但依然维持一定热度,并在很长一段时间内反复波动,形成信息长尾;信息量缓慢降低,危机事件慢慢走出舆论漩涡,热度逐渐消散。

把上述阶段划分为:热议期→冷却期→消散期。各时段内微博信息扩散的整体走势情况如图4,具体每阶段特征如下:

(1)热议期。1月24日21:57,“丽江女游客被打”事件受害者@琳哒是我 通过新浪微博平台阐述自己在丽江的遭遇,希望寻求网络舆论支援;1月25日12:36,政府官方部门通过微博发声,舆情开始发酵,随着网络媒体的持续跟进,以及微博大V、具有传播力的名人、明星等意见领袖的二次转发,危机事件广泛进入大众视野,微博话题开始形成,微博平台中的信息量开始增速走高,成为舆情危机爆发拐点;1月25日12:36,在云南丽江警方发布官方微博对案情进行通报,宣称已经成立行动组介入调查后,舆情信息量呈现爆发式增长;1月27日13:52,云南警方通报已刑拘6名嫌疑人,期间危机事件开始横向扩散,由“丽江女游客被打”事件引发的各类暴力事件相继被曝出,微博网友对此次事件的关注点由“震惊”“怀疑”发展成“愤怒”与“公布调查进展”等舆情诉求。

(2)冷却期。随着1月27日警方公开调查进展,危机进入冷却期。该阶段案情信息逐渐明确,总体关注度下降,舆论信息量大幅度回落,但依然保持一定舆情热度,并在很长一段时间内波动往复。在此阶段,网友对该事件的评价趋于理性,舆论诉求由“公布调查进展”发展为“事件后续发展”以及“公开调查真相”等,舆情开始趋于消退,但公众并未就该危机事件产生免疫,此阶段网民情绪十分敏感,是谣言最易萌发,舆论导向最不稳定的时期。在此阶段施加正向引导,效果相对最佳。

值得一提的是,危机事件在此阶段的演化中,受到某種外界作用,使事件内部“出现”了一个次生危机,信息量显著提高,舆论出现了一个新的高峰点,导致舆情演化的弛豫时间延长(图5)。此次事件的核心攸关方应当在该阶段付出最大努力,维护舆论稳定,杜绝次生灾害发生,让舆情收稳,以保证交互期向消退期的自发过渡,进而缩短危机事件的生命周期。

(3)消散期。2月13日新华网发文称“丽江女游客被打事件”受害者将做伤情鉴定,鉴定结果今日公开。信息逐渐明朗,大众视线开始转移。信息扩散达到边界,舆情消解,舆论风波淡出公众视野。本研究选取消散期中连续5个统计时段内信息量为0的点,选择其中最后一个点作为分析结束时的点(此案例中涉及刑事案件,审讯周期长,考虑到突出研究重点以及计算开销,分析结束时的点即视为危机事件舆情消亡的点,后续相关的跟进报道不在此讨论)。

鉴于“丽江女游客被打”事件在现实中造成的消极影响以及网络环境中的负面报道,微博舆论场中负面情绪的特征和演化过程是本研究的重点,由于积极情感和中性情感占比较少,并且传播特征与消极情感相似,其对理解危机事件在线上的传播与演化特征并无帮助,因此在后续分析过程中仅保留了负面情感分析部分。

4.3 危机事件的情感分析与话题演变

通过比较负面情感强度值的变化情况以及微博话题的分布,发现危机事件负面情感强度在时间上的变化与微博信息扩散趋势基本一致,结合信息扩散的时序特征,梳理话题事件的发展脉络,具体结果如图6所示。

第一,舆情话题在时间线上的发展存在纵深和横向扩散两种趋势。网民受事件情绪波动影响自发跟进以及网络媒体对新闻价值深度挖掘推动舆情话题发生变化,“丽江女游客被打”事件从舆论爆发到消亡延续25天,事件话题围绕#丽江恶性毁容抢劫#向纵深方向发展,舆论关注点集中在被打女游客伤情鉴定、嫌疑人是否被拘捕、作案人数等与案情直接相关的信息上。随着事件的深度报道和信息逐步公开,#琳哒是我遗书#、#警方通报女子丽江被打案:已刑拘6名嫌疑人#、#丽江被打毁容女子:我真的没有骂过丽江#等话题相继出现。

与此同时,一些与此次事件非直接相关的负面消息相继曝光,并且牵扯出近期发生在丽江的3起打人事件,引发了更大范围的声讨。受害者不断涌现,舆情话题开始横向扩散。围绕#女游客丽江遭打毁容#话题引发出#石家庄网友再爆2015年在丽江遭遇毁容抢劫经历#、#张若昀父子曾在丽江被围殴#、#郑渊洁给丽江市长郑艺的信#等新的舆情话题,话题间相互耦合,舆情环境更为复杂。

第二,舆情话题总是伴随波峰出现,新一轮的波峰也会带来新的舆情话题,负面情绪聚集的高地也是舆情话题爆发出现的集中点。危机事件曝光后网友和网络媒体相继推送转发,随着事件调查进展不断公开,公众情绪到达高峰,互联网上围绕危机事件持续展开讨论,舆情话题相继产生,此时的舆情话题主要围绕危机事件的纵深发展。

危机进入冷却期,线上舆论逐渐收稳,但依旧维持着一定关注量,网友爆出事件发生过程中的各种版本,如光棍节约炮言论、女子诋毁丽江等,对受害者带来了二次伤害的同时加剧了舆论的复杂性,网络情绪极度不稳定。此阶段任何内部或外部因素的刺激都可能激起网友对危机事件的重新回忆,引发次生危机事件。在此次事件中,由郑渊洁因质疑古城维护费而引起的舆情话题#郑渊洁给丽江市长郑艺的信#使得网友评论与危机事件关联,微博信息量重新攀升,危机事件引发的负面情绪形成新的高潮。此阶段的舆情话题主要由危机事件的横向扩散引发。

第三,云南丽江市公安局作为危机事件的核心攸关方,在危机事件的应对措施中并未起到修复组织声誉、平息舆情的积极作用,反而由于应对失当,使公众对舆论的质疑进一步加深。#致云南丽江警方公开信#、#警方通报女子丽江被打案:已刑拘6名嫌疑人#等话题不仅未起到消减负面情绪的作用,甚至让舆论扩散到危机应对本身,对当地政府公信力造成严重影响。

5 结论与讨论

5.1 研究结论与理论意义

公众情感是测度舆情危机的有效手段,舆情话题的发生、衍化、迁移,反映了舆情诉求的变化。本文基于公众情感与负面事件舆情危机的映射关系,将负面情绪视为舆情危机的测度工具,通过在线数据爬取、提取关键词、计算情感极性强度和分析舆情危机话题,得到以下结论:

第一,公众心理存在“放大效应”[31],对危机事件的评价更容易被舆论场中最突出的行为特征所掩盖,而忽视事件自身客观规律,导致以点概面的评价结果。由于旅游业属于“精神层面的消费”,对各类危机事件更加敏感,负面舆情历史易被挖出,从而引发“放大效应”,公众对一个旅游地的形象评价会被扩展到整个旅游城市甚至旅游省份。政府在应对危机事件时稍有不当,极易使“应对行为”本身成为新的危机,损坏当地政府公信力。

第二,事件引发的舆情话题存在纵深发展和横向扩散两种演化方式,并衍生出新的话题,新的舆情话题伴随着负面情绪的波峰出现。在危机事件生命周期的不同阶段,舆情话题衍生发展的倾向也不同。在热议期,舆论主要围绕与案情直接相关的信息发展,此时出现的衍生话题由危机事件的纵深发展产生。在冷却期,旅游地的其他负面新闻一旦被曝光,这些负面新闻与危机事件本身并无联系,但易唤起公众对危机事件的重新回忆,舆论场会自发与危机事件关联,并且认为如果旅游地在公共安全上存在问题,说明其他管理方面同样存在问题,由此引发新的舆情话题。此时出现的舆情话题主要由危机事件的横向扩散所产生。

第三,由公共安全引发的旅游舆情危机突发且易逝,事件生命周期长度具有显著的不确定性,与现实中案情调查进展、政府应对及信息公布和突发新闻等影响因素密切相关。案情调查进展的公布能引导舆情诉求发生变化,消解疑虑,防止疑惑心理转为负面情绪,合理的公布方式以及应对措施有助于加快渡过危机,使事件得以平息。突发新闻为危机事件带来不确定因素,应对不当容易引发次生灾害,导致危机生命周期弛豫时间延长。由危机造成口碑和声誉上的损失则与事件本身的社会危害性和旅游地的舆情历史等因素有关。

本研究的理论意义如下:

第一,拓展了传统旅游业危机的外延,对旅游舆情危机這一概念进行了明确定义,一定程度上扩宽了旅游业危机管理研究涉及的内容和范畴。以往对于旅游危机的研究多是在沿用WTO对旅游危机的定义下,围绕自然灾害事件和公共安全事件展开,而旅游市场的舆情危机同样符合WTO对旅游危机的定义,但又与传统的旅游危机存在性质上的区别。本研究从网络舆情的视角定义了旅游舆情危机这一概念,并将其视为旅游危机的一种重要类别。对未来的旅游业危机管理研究有重要借鉴意义。

第二,将情感分析理论框架引入旅游业的危机管理中来,一定程度上丰富了旅游危机管理领域的研究方法和技术手段,为此类研究的后续发展提供了一种新的视角。本研究选择2017年持续时间较长,影响力较大的旅游舆情危机事件“丽江女游客被打事件”作为典型案例,为其构建了领域情感词典,通过关键词分析、话题挖掘和情感分析等技术手段初步窥探了旅游舆情危机的演化特征。研究也为在社交网络高度发展的今天如何开展旅游危机预警与舆情治理提供了启示。

5.2 管理启示

本研究以公众情感传播作为切入点,初步窥探了旅游舆情危机情感演化的一般性规律。研究结论对旅游产业的舆情治理及旅游危机管理的相关实践工作具有一定指导意义。一方面,旅游行政管理部门应该重视所在地区游客的申诉,并积极展开维权措施。案件发生后,受害者首先是向当地的维权部门进行申诉,当申诉无果,或相关部门的处理未达到游客申诉的目的或心理预期时,才会转而向线上求助舆论关注。根据研究结果,旅游舆情危机的整个生命周期中并未历经明显的“潜伏期”或是“成长期”阶段,而是在短的时间内爆发直接进入热议期,因此将危机遏制在萌芽阶段的“最佳应对时期”观点已不再适用于新环境下的旅游危机管理。在案件发生后(现实中的刺激事项)到危机发展至线上(旅游舆情危机的起点)存在一段时间差。本案例中,案件发生时间是2016年11月11日,而受害者将自己的遭遇发布至线上的时间是次年1月25日,旅游行政管理部门应当充分利用这段时间积极处理引导,重视游客诉求,而不是推诿或者拖延。

另一方面,旅游舆情危机发生后,事件的核心攸关方应当积极展开调查,及早公开案情进展,面对各方舆情诉求应予以回应,并尽可能合法公开案情细节,防止疑惑心理转为消极情绪。研究结果表明,对“真相”的诉求是旅游舆情危机中公众展现出最明显的情感特征,在诉求不被满足的情况下,舆情话题则很可能发生横向扩散,与该地区其他的负面新闻相关联,进一步加深舆情危机的发展。在本案例中,作为事件核心攸关方的云南丽江市公安局并未及时召开线下的新闻发布会详述案情细节,而其通过线上官方微博进行的两次案情通报则因内容疏漏、不具针对性而未能平息舆论,反而使质疑加深,此后接连曝出多起发生在丽江的恶性案件,严重影响了当地政府部门的公信力。

5.3 局限性与后续研究工作

通过理论梳理,发现由负面事件引发的旅游舆情危机与网民情感具有映射关系,基于这种映射关系,本文将负面情绪视为舆情危机的测度工具,对其进行度量和分析,然而,这种映射关系还需要进一步探讨加以确认。另外,在本文的研究案例中,危机信息量第一次到达顶峰后,于2017年1月26日晚上雪崩式下降,而次日正是我国重要传统节日除夕,“假日效应”是否对危机事件的演化造成了影响,这些都将作为我们后续的研究工作。

致谢:诚挚感谢瑞典卡罗林斯卡学院(Karolinska Institute)吕欣博士(Dr. LYU Xin)对文章英文摘要的修改完善。

参考文献(References)

[1] DENG Bing, WU Bihu, CAI Liping. A summary of crisis management studies at home and abroad[J]. Tourism Science, 2004, 18(1): 1-8. [邓冰, 吴必虎, 蔡利平. 国内外旅游业危机管理研究综述[J]. 旅游科学, 2004,18(1): 1-8.]

[12] YIN Xicheng, ZHU Hengmin, MA Jing, et al. Coupling network model of the topic diffusion of micro-blog public opinio[J]. Information Studies: Theory & Application, 2015, 38(11): 82-86. [尹熙成, 朱恒民, 马静, 等. 微博舆情话题传播的耦合网络模型——分析话题衍生性特征与用户阅读心理[J]. 情报理论与实践, 2015, 38(11): 82-86.]

[13] HE Tao. Reaearch on the Method of Factor Analyzing and Measuring Topic Influence in Online Community[D]. Hefei: Hefei University of Technology, 2012. [贺涛. 网络社区话题影响力因素分析及度量研究[D]. 合肥: 合肥工业大学, 2012.]

[14] WANG Shoujin, QIAN Ying, LI Wenhui, et al. A study of spreading mode and features of microblogging based on topics[J]. Journal of Intelligence, 2013, 32(6): 176-180. [汪守金, 钱颖, 李文慧, 等. 基于话题的微博传播模式与特性研究[J]. 情报杂志, 2013, 32(6): 176-180.]

[15] ZHAO W X, JIANG J, WENG J, et al. Comparing twitter and traditional media using topic models[C]//CLOUGH P, FOLEY C, GURRIN C, et al. European Conference on Advances in Information Retrieval. Dublin: Springer-Verlag, 2011: 338-349.

[16] POWERS D M W. Applications and explanations of Zipfs Law[J]. Advances in Neural Information Processing Systems, 1998, (4): 595-599.

[17] XU Wenxia. Zipfs Law and Chinese word frequency distribution mechanism[J]. Information Science, 1986, (1): 29-36. [许文霞. 齐普夫定律与中文词频分布机理[J]. 情报科学, 1986, (1): 29-36.]

[18] MITROFF, I I. Crisis management: Cutting through the confusion[J]. Sloan Management Review. 1988, 29(2): 15-20.

[19] FINK S. Crisis management: Planning for the inevitable[J]. American Management Association, 2002, (3): 875-876.

[20] ALFONSO G H, CORNELIUS B P. An integrated symmetrical model for crisis-communications management[J]. Journal of Public Relations Research, 1996, (2): 79-105.

[21] HE Zhengchu. Enterprise Crises Management: A Perspective of Arganization and Organization Management[D]. Changsha: Central South University, 2004. [贺正楚. 企业危机管理: 组织与组织管理的视角[D]. 长沙: 中南大学, 2004.]

[22] ZHAO Dingtao, LI Bei. Dynamic management mode of corporation crisis based on the system theory[J]. Journal of Management Science, 2005, 18(3): 8-15. [赵定涛, 李蓓. 企业危机动态管理模式[J]. 管理科学, 2005, 18(3): 8-15.]

[23] WANG Feng. Comprehensive Crisis Response Management based on Organizational Reputation Restoration[D]. Heifei: University of Science and Technology of China, 2013. [汪峰. 基于組织声誉修复的综合危机应对管理研究[D]. 合肥: 中国科学技术大学, 2013.]

[24] WANG Feng, WEI Jiuchang, ZHAO Dingtao. Comprehensive crisis response model building and organizational reputation restoration: A study based on two cases[J]. Journal of Public Management, 2013, 10(3): 63-74; 140. [汪峰, 魏玖长, 赵定涛. 综合危机应对模式构建与组织声誉修复——基于两个案例的研究[J]. 公共管理学报, 2013,10(3): 63-74; 140.]

[25] Chinese Academy of Social Sciences. Research report on Chinese social mentality(2016)[EB/OL]. http://sky.cssn.cn/zk/zk_zkbg/201612/t20161223_3355907_1.shtml, 2016-12-23. [中国社科院. 中国社会心态研究报告(2016)[EB/OL]. http://sky.cssn.cn/zk/zk_zkbg/201612/t20161223_3355907_1.shtml, 2016-12-23.]

[26] Peoples Network. Peoples network tourism 3.15 complaint platform data report [EB/OL]. http://travel.people.com.cn/GB/236434/359205/index.html, 2018-01-10. [人民网. 人民网旅游3民网旅投诉平台数据报告[EB/OL]. http://travel.people.com.cn/GB/236434/359205/index.html, 2018-01-10.]

[27] SHI Congying, XU Chaojun, YANG Xiaojiang. Study of TFIDF algorithm[J]. Journal of Computer Applications, 2009, 29(b6): 167-170. [施聪莺, 徐朝军, 杨晓江. tfidf算法研究综述[J]. 计算机应用, 2009, 29(b6): 167-170.]

[28] CUI Anqi. Study on Public Sentiment Analysis of Events in Microblogs[D]. Beijing: Tsinghua University, 2013. [崔安颀. 微博热点事件的公众情感分析研究[D]. 北京: 清华大学, 2013.]

[29] Peoples network. Peoples network tourism 3.15 complaint platform data report [EB/OL]. http://travel.people.com.cn/GB/236434/359205/index.html, 2018-01-10. [人民网. 人民网旅游3民网旅投诉平台数据报告[EB/OL]. http://travel.people.com.cn/GB/236434/359205/index.html, 2018-01.]

[30] LI Yong, CAI Mengsi, ZOU Kai, et al. Influencing factors and differences of the online and offline emotional spread of social network users: “Female Driver Beaten by A Male Driver in Chengdu” Case as an example[J]. Journal of Intelligence, 2016,35(6): 80-85. [李勇, 蔡梦思, 邹凯, 等. 社交网络用户线上线下情感传播差异及影响因素分析——以“成都女司机被打”事件为例[J]. 情报杂志, 2016,35(6): 80-85.]

[31] ZHU Guangxi, WANG Zhaoming, WAN Ximei, et al. Government image and government crisis public relations in crisis[J]. Journal of Public Management, 2006, 3(2): 40-48. [朱光喜, 王趙铭, 万细梅, 等. 危机事件中的政府形象和政府危机公关[J]. 公共管理学报, 2006, 3(2): 40-48.]

The Evolution Characteristics of Tourism Opinion Crisis based on

Emotion Mining and Topic Analysis:

A Case Study of the Incident of "Female Tourist Attacked in Lijiang"

LI Yong1,2, JIANG Guanwen2, MAO Taitian2, JIANG Zhiyi3

( 1. School of Economics and Management, Changsha University, Changsha 410000, China; 2. School of Public

Administration of Xiangtan University, Xiangtan 411105, China; 3. Xiangtan University Library, Xiangtan 411105, China)

Abstract: The popularity of mobile social network platforms, such as Sina Weibo, WeChat, etc., have substantially changed our way of living and communication. As an area closely connected with Internet news media, tourism industry is facing with unprecedented opportunities as well as challenges. Tourism opinion crisis events under the environment of Internet, such as "Fenghuang (Phoenix) Ancient Town charges for residents", "Qingdao shrimps with high price", and "Female tourist attacked in Lijiang", etc., have raised widespread attention with the facilitation of online social network platforms, and have made a great impact on the image of tourist spots and the development of tourist activities. However, tourism opinion crisis, as the outcome of the development process of platform economy virtualization, has received less attention in the study of tourism crisis management. To amend this gap of knowledge, this implements the following research.

First, a novel classification rule for tourism crisis is proposed, on the basis of combing domestic and foreign literature concerning tourism crisis management and network public opinion. The concept of tourism opinion crisis, which is the research subject in this paper, is expounded from the perspective of network public opinion. Taking the “Female tourist attacked in Lijiang” incident as an example, the webpage data crawling tool is used to extract relevant news reports and user comments data from Sina Weibo. And the final event-related corpus is obtained after data preprocessing.

Second, through crisis keywords extraction, lyric topics identification, and emotional intensity calculation, a comprehensive analysis was carried out with respect to the life cycle of the tourism opinion crisis. It is found that: (1) There exists an "amplification effect" in public psychology. Public evaluation of crisis events is more easily leaded by the most prominent behavioral characteristics of public opinion and it usually ignores the universal evolution law of the events, which results in one-sided evaluation results. (2) Two evolution patterns of public opinion topics are found, i.e. deeply developing and transverse diffusing. New deriving topics are often accompanied by peaks of negative emotions. (3) The tourism opinion crisis caused by public security is emergent and perishable, and the life cycle length of crisis events has significant uncertainty.

Lastly, some targeted suggestions are proposed for tourism crisis management. The research not only reveals the dissemination characteristics of tourism opinion crisis under the environment of Internet, but also offers valuable insights for the supervision departments to improve public opinion management.

Keywords: tourism opinion crisis;emotion analysis;topic analysis;evolution characteristics

[責任编辑:王    婧;责任校对:吴巧红]

猜你喜欢

情感分析
面向应用比较的用户评论挖掘工具的设计与实现
基于word2vec扩充情感词典的商品评论倾向分析
基于语义的互联网医院评论文本情感分析及应用
基于双向循环神经网络的评价对象抽取研究
基于SVM的产品评论情感分析系统的设计与实现
基于词典与机器学习的中文微博情感分析
在线评论情感属性的动态变化
歌曲《我的深情为你守候》的情感分析与演唱诠释
文本观点挖掘和情感分析的研究