APP下载

基于微博文本挖掘的体育赛事网络舆情研究

2021-04-18沈昕怡徐成龙

新闻研究导刊 2021年23期
关键词:文本挖掘网络舆情

沈昕怡 徐成龙

摘要:奧运会作为热门公众事件,极易产生网络舆情。对东京奥运会网络舆情进行研究可以探究大型体育赛事舆情管理的方式方法,并为北京冬奥会舆情管理提供建议。文章运用文本挖掘法的词频统计和情感分析方法,辅以文献资料法和个案分析法,通过挖掘微博热搜话题及对应的微博正文文本,对东京奥运会期间的体育赛事网络舆情进行研究分析。研究发现,网民讨论的奥运会相关话题主要为国家间的竞争、较具金牌竞争力的项目、运动员、运动队、教练员等。网民对赛事优异成绩、运动员优异表现、正面新闻表现出正面情感;对赛事不公、赛事遗憾、意外状况、负面新闻表现出负面情感。文章还通过现状调研总结体育赛事网络舆情的热度相关性、社会性等特点。最后,分别向微博管理层、微博网民、主流媒体、教练员、运动员、运动项目管理中心提出相关建议。

关键词:东京奥运会;网络舆情;微博热搜;文本挖掘

中图分类号:G206 文献标志码:A 文章编号:1674-8883(2021)23-0149-03

微博作为国内最大的简短实时信息发布平台,在国内社交媒体中具有巨大的影响力[1]。东京奥运会相关官方微博如国际奥委会、东京奥委会等运用微博为东京奥运会宣传造势;国内主流媒体如央视体育等也运用微博实时发布奥运赛事相关信息[2]。

同时,微博网民通过微博热搜及相关微博文本快速了解和讨论赛事相关话题。

在东京奥运会举办期间,微博平台上的网民关注赛事的哪些方面,网民对相关话题的情感倾向如何,网络舆情呈现出何种特征,对东京奥运会网络舆情进行研究能否为即将到来的北京冬奥会舆情管理提供相关建议,以上问题值得思考。

文章对东京奥运会期间微博平台的热搜话题数据及对应推文数据进行爬取,通过词频统计、情感分析的数据挖掘方法,辅以文献资料及个案分析法,了解网民在社交网络媒体中所关注的东京奥运会主题及情感倾向,归纳总结东京奥运会网络舆情所呈现出的特征,并提出适用于北京冬奥会舆情管理的相关建议。

一、研究方法与设计

(一)研究方法

文章主要采用文本挖掘法中的词频分析以及情感分析法、文献资料法以及个案分析法,通过对东京奥运会网络舆情的研究,得到体育赛事网络舆情的普遍规律和具有普适性的解决方法。

(二)研究设计

1.数据提取

综合已有的研究和实际情况考虑,笔者选择python语言(一种计算机程序设计语言)进行数据提取、分析及可视化的代码编写。

(1)通过微博热搜记录网站(https://weibo. zhaoyizhe.com)输入东京奥运会关键词,获取相关的历史微博热搜数据。在爬取数据时间选取上,选择了奥运会赛事举办期间,即2021年7月23日至2021年8月8日,共有微博热搜词条2633条。

(2)通过已获取的微博热搜数据,运用python对热搜标题进行整理[3],通过微博标题,获取微博热搜话题所对应的微博文本和相关的微博评论。通过数据采集,共获得微博文本信息70784条。

2.数据处理

(1)词频分析,运用python自带的词库及笔者补充的东京奥运会相关关键词词库,统计相关词出现的频率,生成话题相关的词频信息。

(2)情感分析,运用python先提取积极情感和消极情感的样本,通过机器学习提高准确性,再对所有数据进行情感分析,得到情感分析相关的图表[4]。

二、研究分析与讨论——微博文本词频分析

(一)微博热搜标题汇总词频分析

从对微博热搜话题进行可视化展示的词云图中可以看出,“奥运会”这个关键词出现得最多。同时,如下图所示,以下词语出现频率较高。

第一,在出现频率较高的词中,“中国”“日本”和“美国”同属于国家名称,中国是大部分微博网民的所属国,大家都关注本国运动员的表现情况,也为祖国奥运健儿的战绩感到自豪。日本作为本届奥运会举办国,运动员受关注度较高。美国在体育方面具有极强的实力,也与中美关系有关,美国队的奥运之旅较受网民关注。

第二,“晋级”“决赛”和“金牌”等关键词在一定程度上体现了微博网民对比赛结果的关注。结合微博热搜的热度以及点击量的数据来看,浏览量比较多的热搜多与中国队的赛程有关。与中国夺金点有关的赛程,决赛、半决赛以及女排等实力较强的项目更受人们关注,而比较冷门的一些项目关注人数则较少。

第三,在选手方面,“马龙”“苏炳添”“全红婵”等运动员出现频率较高,其都是我国热门的实力选手,除比赛成绩外,运动员的过往相关视频也受到关注,网民们由此了解到了运动员们的学历、家庭背景,以及训练和过往比赛的有趣故事。

第四,刘国梁、郎平作为明星人物,一个代表着中国乒乓球的辉煌历史,一个延续着女排精神,受到了媒体和网民们的广泛关注[5]。

(二)微博热搜话题下微博正文文本词频分析

在微博正文的发文来源上,微博热搜话题下的微博正文来自多方,既有发起话题的重量级微博账号、东京奥运会相关官媒,也有来自五湖四海、背景各异的普通网民,反映了网民们围绕某个话题讨论的核心和重点。

第一,微博网民的微博文本大部分围绕“奥运会”和“中国”展开。

第二,“中国女排”“马龙”“孙颖莎”“全红婵”“杨倩”“伊藤美诚”等都是讨论次数较多的对象,这些队伍和运动员集中于较受国人关注的项目。

第三,网友们的讨论主要围绕比赛的结果,尤其是好的结果进行。例如,“金牌”“决赛”“夺金”“夺冠”等词语均与赛事结果相关,并且获得冠军的项目和运动员的热度普遍更高。

第四,从“女子”“女团”及“男子”可以看出,网友围绕女子运动员的讨论更多,这也许与东京奥运会中国代表团参赛运动员男女人数比例有关。本次奥运会,男子运动员133人,女子运动员298人,女子人数约为男子人数的两倍。

第五,“戰胜”“VS”(对阵)等词多用在团体或个人对抗性强的项目上,如国乒女团VS日本女团、中国女排VS日本女排、马龙VS樊振东等等。对抗型项目相较于竞速型项目等,持续时间更长,随着比分的上升,人们会愈发紧张和兴奋,急需情感的宣泄,由此出现了更多对对抗型赛事的讨论。

第六,参与讨论的全国网友都为中国奥运代表团加油和祝贺。“加油” “恭喜”出现次数较多,表现了中国网民为祖国健儿加油的热情。

(三)微博文本情感分析

对微博正文文本进行情感分析发现,微博热搜话题下的微博文本整体呈现积极态势,但相对于微博热搜主题,微博文本仍有较多消极情感[6]。

第一,微博积极情感文本主要针对两个方面。一是为中国队助威,如“#第四金!恭喜#施廷懋王涵女子双人3米板摘金#中国跳水队取得东京奥运开门红的同时,也实现了在该项目五连冠壮举!恭喜姑娘们”。二是讨论运动员相关事件,或感动或搞笑,如“中国选手孙一文险胜罗马尼亚选手,夺得山东第一金,现场一片沸腾”。

第二,微博消极情感文本主要针对三个方面。一是针对中国队赛事表现表示遗憾或愤怒,如“只会越来越菜了”。二是针对外国运动员的表现,如“张本智和无缘八强”。三是针对赛事相关的争议、裁判判决争议,如“心疼我们的运动员,奥运会四年一届啊”。

综上,可发现微博消极情感文本大多表达了遗憾、难过、愤怒、不满,多是针对赛事;微博积极情感文本大多表达了兴奋、愉快、激动等正向情感,多出于对赛事的助威和对运动员性格、成绩、生活的赞扬。

三、研究结论

(一)热度相关性

通过微博热搜相关词频分析和情感分析数据,可以得到以下与热度有关的结论。

一是中国具有夺冠实力的项目和奥运会较受关注的个人、团体及项目有更高的讨论热度。二是比赛结果更易引起网友的讨论。三是女子项目讨论热度更高。四是对抗性强的项目更易引起讨论。

(二)社会性

1.信息汇聚

社会化媒体信息传播的便利性,使得网民对各个事件的各种态度和观点得到了充分的表达和传播。网民的各种情绪也包含在其对事件的评价中,这就极大加快了信息汇聚的速度。

人民日报在此次东京奥运会中是影响力最大的官媒之一,仅2021年7月31日发布中国女排提前无缘八强的消息,微博转发量就达4000,评论量1万,点赞量23.3万,体育赛事网络舆情瞬间完成信息汇聚过程。

体育赛事的网络关注度很大程度上取决于体育赛事的结果,如“中国女排提前无缘八强”与“苏炳添百米第6”话题下的微博评论相比较,“中国女排提前无缘八强”消极情绪的占比相较于“苏炳添百米第6”较大,但由于近些年网民观念改变,“唯金牌论”观念渐淡化,网民虽有消极言论但仍持包容态度。

2.族群意识

体育赛事是一种跨国家、跨地域,全世界可以共享的媒介文化。若在全球范围内分析各国家的体育赛事网络舆情,可以发现舆情在信息汇聚的过程中具有族群意识。通过文本词频分析可以发现,无论是整体分析还是针对单个话题的微博评论文本分析,“加油”“不错”等积极情绪词汇占比较高,同时,“中国”“美国”“日本”等涉及国别的词汇出现频率也很高。

(三)明星化

运动员们在奥运会上大放异彩,随着微博的实时跟踪报道,运动员的知名度不断提升。网民会随着新媒体相关的衍生报道,进一步了解体育明星,例如,全红婵在三跳满分的情况下夺得奥运会冠军后,通过衍生微博热搜“全红婵的故事是部小说吧”“红婵练习跳水的原因令人心疼”等,网民了解到了奥运军团最小的选手全红婵家境较差,母亲生着病,甚至有网民自发前往全红婵家乡探望,也有企业想要给她的家人捐赠房屋。

四、建议

基于文章对东京奥运会舆情的分析以及对东京奥运会舆情特征的总结,笔者对未来大型体育赛事舆情管理的各参与方提出相关建议。

运动项目管理中心、教练员应把握运动员商业化明星化程度,维护其正常训练生活。相关管理者、运动员家属等,应对运动员运动水平、个人性格等有充分了解,合理控制曝光度,保证运动员的训练质量。

媒体应将运动员取得好成绩的舆情进一步向好的方向延伸,面对运动员未取得理想成绩的信息也应实事求是,寻找原因,予以鼓励,引导大众宽容地看待结果。

在网络信息碎片化的时代,网络信息不完整或表达方式片面都会使舆情与实际脱轨。微博管理员应加强舆论正面引导,控制负面舆情,引导网民理性思考,弥补信息碎片化的不足。

运动员应对自身定位和社会发展有清晰认知,对自己的人生和运动生涯合理规划,合理运用知名度,可以利用自己的知名度为自己的运动项目带来关注,也要明白知名度具有双刃剑,能为自己带来名利,也会带来灾祸,从而放平心态,走向成熟。

微博网民应理性发表见解,宽容对待运动员在赛场上的发挥。不盲目跟风发表过激看法和言论,实事求是,不过分追捧运动员、教练员,尊重运动员、教练员的私人生活。

五、结语

网络舆情对社会的影响力不断加大。大型体育赛事尤其是奥运会这类国际性大型赛事,极易产生网络舆情。文章通过对东京奥运会的舆情分析,探究了大型体育赛事舆情管理的方式与方法,并为即将到来的北京冬奥会的舆情管理提供建议,助力北京冬奥会成为对外展示中国形象的窗口,成为人民大众满意的体育赛事。

参考文献:

[1] 何文捷,王泽峰. 2020年东京奥运会日本备战措施与启示[J].沈阳体育学院学报,2019,38(5):1-6.

[2] 郭成根,施文海,全哲平,等.疫情下中国体育代表团2020年东京奥运会竞技形势及备战策略[J].中国体育教练员,2020,28(4):35-37,41.

[3] 沈伟,刘利.中国女排备战2020东京奥运会前瞻:基于2018女排世锦赛单项技术统计分析[J].吉林体育学院学报,2019,35(2):41-47.

[4] 魏然. 2020年东京奥运会城市形象国际传播策略及启示[J].体育文化导刊,2017(3):30-34.

[5] 陶玉洁,凌永哲. 2019年女排世界杯网络舆情媒体议程分析[J].声屏世界,2020(14):93-95.

[6] 王晓晨,关硕,于文博,等.体育赛事网络舆情的传播特征研究:基于2019年女排世界杯的文本情感分析[J].成都体育学院学报,2020,46(5):74-81.

作者简介 沈昕怡,本科在读,研究方向:体育大数据。徐成龙,硕士,讲师,上海体育学院经济管理学院实验中心负责人,研究方向:体育大数据。

猜你喜欢

文本挖掘网络舆情
数据挖掘技术在电站设备故障分析中的应用
基于LDA模型的95598热点业务工单挖掘分析
文本数据挖掘在电子商务网站个性化推荐中的应用
从《远程教育》35年载文看远程教育研究趋势
数据挖掘技术在网络舆情管理中的研究
“互联网+”背景下高校平安校园建设研究
浅析网络舆情治理
基于社会稳定视角的网络舆情预警机制构建的思考
突发事件网络舆情的演化规律与监控
慧眼识璞玉,妙手炼浑金