APP下载

基于信息形式的微博舆情传播模型研究*

2018-01-19曹金璇

通信技术 2018年1期
关键词:舆情形式用户

吴 谦,曹金璇

(中国人民公安大学,北京 102600)

0 引 言

随着社交网络的不断发展与完善,越来越多的网民开始将微博﹑微信等社交平台视作发布和获取各类信息的主要渠道,而短时间内迅速聚集的各类信息也使得这些社交平台成为舆情传播的重要途径之一。国内首家微博网站新浪微博在2009年创立,随后微博便开始在我国得到爆炸式发展,其中以新浪微博的使用最为广泛[1]。近年来,随着信息传播形式的大量丰富﹑移动网络终端的迅速发展和微博自身版本的不断提升,当下网民通过微博获取和传播信息的途径更为多元化。相比于微博发展的早期,仅以文字或图片为基础的信息传播方式已经逐渐演变成文字﹑图片﹑视频﹑超链接甚至网络直播为载体的多元化信息传播方式。由于用户数量众多﹑信息传播速度快等原因,微博平台容易迅速形成较强的舆论压力,可能对事件的发展和结果造成不可逆转的重要影响,甚至导致一些较为严重的现实后果。

1 研究现状

1.1 基于群体状态的传播模型

1.1.1 传染病信息传播模型

信息传播领域最广为人知的理论模型是基于现实传染病传播的传染病模型。借鉴传染病模型的思想,将社交网络中的节点划分为不知道消息的人群(S)﹑知道并继续传播消息的人群(I)以及知道消息但失去传播兴趣的人群(R)。通过不同状态间的变化,研究信息的传播。随着研究的深入,一种名为SEIR的社交网络传染病模型被提出并被广泛认可。如图1所示,它加入了潜伏状态E(Exposed),用以表示受到感染的个体以一定的概率发病。

图1 SEIR传染病模型

1.1.2 影响力传播模型

影响力传播模型假设信息扩散的过程由个别节点的影响力掌控,通过对节点影响力进行评估而预测信息传播趋势。该模型定义节点u的影响力函数Iu(x),表示在u被影响x个时间段后其粉丝提及该信息的数量。定义函数V(t),表示t时刻系统中提及某个信息的节点数量。假设V(t)为所有已受影响的节点影响力函数之和:

其中,A(t)表示已受影响的节点集合,节点u在tu时刻被影响(tu≤t)。

该模型可描述如下:节点u﹑v﹑w在tu﹑tv及tw时刻被影响,之后各自产生一个影响力函数Iu(ttu)﹑Iv(t-tv)和Iw(t-tw)。t时刻,系统中提及某信息的量V(t)为这三个影响力函数之和。

1.2 基于信息特性的传播模型

已有的社交网络信息传播模型大多假设信息不受网络外的影响,仅沿着社交网络中的边在节点之间传播[2]。然而,现实世界中,社交网络中的用户可通过多种渠道获取信息。这时可以用函数λext(t)来描述某用户受外部影响获得的信息量。若其邻接节点已发布过相关信息,则会对该用户产生基于链接的内部影响λint(t)。函数η(x)描述用户接触到信息而发布有关微博的概率。最终,用户或者受到影响发布相关微博,或者不再对该信息产生反应。节点i受到的总影响为:

其中,Λi(nit)表示节点受到内部影响获得信息的期望值,Λext(t)为节点所受外部影响获得信息的期望值。

最终,用户i受到影响发布有关微博的概率为:

其中,函数η(x)描述用户接触信息而发布有关微博的可能性。

2 模型构建

2.1 理论基础与研究假设

2.1.1 理论基础

在实际的微博网络舆情信息传播过程中,舆情话题的传播过程往往受到多方面影响[3]。例如,某一个话题在经过意见领袖如微博中拥有大V称号的博主转发后,由于这些意见领袖的粉丝众多,作为舆情传播网络的重要节点之一,就有可能加快舆情在社交网络间的传播速度。另外,舆情话题在微博中被评论或者转发时,评论者或转发者的情感倾向也会对舆情传播造成一定影响。例如,当某一话题引起较多人产生强烈正性或负性情感共鸣时,原本对事件保持中立的网民就有可能受到这种情感倾向的影响而加入到舆情话题的传播和讨论中,从而进一步影响舆情本身在网络中的传播。除了以上两点,舆情信息本身的形式也会对其在微博网络中的传播产生重要影响。

微博平台中发布的信息大致分为以下几种。

(1)短文本信息。短文本信息主要由一段简短的文字﹑表情或符号组成,通常不足以成为舆情话题,或者缺少作为舆情信息传播的丰富性和可靠性。这类信息主要作为个人情感因素的表达或者简单的评论以及对某一事件的简单描述[4]。

(2)长文本信息。自2016年以后,新浪微博开始取消对发布微博内容字数的限制,将原来140字的字数限制改为2 000字,并且经过对会员的开放试用到所有用户取消限制,如今最新版本的微博平台已经可以发布篇幅较长的文本信息[5]。长文本信息的内容较之短文本而言更丰富,可以较为全面和清晰地描述某一事件,但由于缺乏类似图片﹑视频或者其他超链接的支持,其舆论影响效力一般。

(3)图片信息。微博平台中的图片信息主要分为单张图片﹑多张图片﹑长图片以及GIF图片几种形式。其中,GIF图片是将一些连续的图片通过处理连接成一小段GIF格式的小视频(通常仅为几秒),然后发布在微博上的一种较为新颖的信息传播方式[6]。和视频不同,GIF图片往往较为简短,其中大多只包含与主题有关的内容信息,但这类信息格式的传播成本低﹑传播速度快且内容比一般图片更加丰富。

(4)视频信息。目前,最新微博版本中除了可以发布文字﹑图片信息外,还可以发布视频内容。这一更新较之以往的版本对各类舆情话题的传播无疑起到了重要的推动作用。视频往往最有能力还原事件真相,因此相比于前几种信息形式,当某一舆情话题中包含一段相关视频内容后,往往更容易引起网友的关注。另外,当一些舆情事件还处在发酵阶段时,如果微博网络上出现了类似的视频内容,那么将很有可能影响甚至推翻之前的舆情话题,产生新一轮的舆情爆炸事件。

(5)超链接信息。超链接信息也是微博舆情信息传播中的一种重要形式。大多数舆情话题在经过微博博主发布后通常会附上一段超链接,当微博用户对话题产生兴趣并点开这些链接时,链接转向的网页内容中就可能包含以上的任意一种或几种信息形式,从而使用户对话题产生兴趣以及正性或负性的情感倾向,最终影响舆情话题在微博网络中的传播[7]。

2.1.2 模型假设

根据媒介丰富性理论及以上理论基础,本文认为微博中舆情话题的信息形式会对舆情的传播产生影响,并据此提出以下假设:

H1:舆情话题的信息形式会正向影响微博转发H2:舆情话题的信息形式会正向影响微博评论以上猜想的依据是由于仅以文字形式传播的舆情信息缺乏说服力,有可能导致受众小﹑传播速度慢﹑不易在微博网络中发生话题效应,对微博用户的吸引力较小。相比之下,同时包含图片和文字两种信息形式的舆情话题更容易引起微博用户的兴趣而产生关注,也更加具备一定的说服力和话题性。而当一个舆情话题信息中能够包含详细完整的视频内容及其他形式的信息作为补充时,该话题的说服力和影响力较之前两张形式更为强烈。由于视频信息中不仅包含了声音和图像,还能详细完整地还原话题事件发生的经过,因此更能使用户产生强烈的情感倾向和对话题的参与热情,从而影响舆情在网络中的传播。

2.2 数学模型的构建

2.2.1 研究变量

依据样本数据特征,本文将微博舆情话题的信息形式细分为文字信息﹑图片信息﹑视频信息以及超链接信息四个虚拟指标。同时,考虑到舆情传播过程中可能受到意见领袖[8]的影响,增加一项以话题微博发布者及微博转发者的粉丝数量为基础的解释变量,以保证实验的变量控制原则,消除可能带来的影响。

被解释变量:

Fi(Forward)转发数:样本中第i条微博获得的转发数量;

Ri(Reply)评论数:样本中第i条微博获得的评论数。

解释变量:

Wi(Word)文字形式:虚拟变量,表示样本中第i条微博中是否包含文字形式的信息内容,包含标记为“1”,不包含标记为“0”;

Pi(Picture)图片形式:虚拟变量,表示样本中第i条微博中是否包含图片形式的信息内容,包含标记为“1”,不包含标记为“0”;

Vi(Video)视频形式:虚拟变量,表示样本中第i条微博中是否包含视频形式的信息内容,包含标记为“1”,不包含标记为“0”;

Hi(Hyperlink)超链接:虚拟变量,表示样本中第i条微博中是否包含超链接形式的信息内容,包含标记为“1”,不包含标记为“0”;

2.2.2 回归假设检验模型构建

本文考虑将微博内容的转发数量和对微博内容的评论数量作为参考依据,用来表示该微博舆情话题的传播程度和传播效果,以研究微博话题的信息形式对舆情传播过程产生的影响[9]。所构建的原始回归模型如下:

模型(a):

2.2.3 样本选择

考虑到数据来源的权威性和全面性,本文选取国内最大的微博网络平台——新浪微博,作为样本数据的获取平台。

考虑到事件的关注热度和社会影响,本文根据权威网站人民网在2017年上半年发布在社会蓝皮书上的《2016年互联网舆情报告》中的内容,选取位列2016年互联网舆情热度首位的“杭州G20峰会”作为研究案例。

3 数据分析与讨论

3.1 数据收集与预处理

根据上文给出的数据变量和采集要求,本文利用Python自编网络爬虫工具对微博上的相关数据进行收集[10]。首先通过在新浪微博主页的搜索项中输入关键词“杭州G20峰会”得到相关微博信息,然后运行爬虫程序,对2016年8月1日至2016年9月31日两个月内的相关微博数据以及信息形式进行采集和挖掘,并根据表1中给出的判断标准对数据进行清洗和预处理,最后将数据导出到数据库中,得到如表2所示的初步统计结果。

表1 样本分类

表2 样本数据初步统计结果

3.2 数据分析与讨论

3.2.1 相关分析

在输入以上收集的数据信息后,输出结果如表3﹑表4所示。

表3 模型(a)的相关数据分析结果

表4 模型(b)的相关数据分析结果

本文利用Pearson相关系数对各解释变量进行检验。若显著性检验概率值(P值)大于0.05,则表示变量间没有显著相关性。通过分析得到,除文字形式Wi和超链接形式Hi以外,其他解释变量的P值均小于0.05,由此得出以下结论:

(1)文字信息形式作为微博舆情传播的解释变量和被解释变量之间并没有显著相关性[11],这可能是由于收集的所有微博舆情数据信息中几乎都包含了文字信息内容;

(2)其他四个解释变量与被解释变量间都具有显著相关性[12],可以进行较为准确的回归分析,同时粉丝数量与评论数之间的相关性最为明显,而视频信息形式与转发数和评论数之间的相关性最为明显,这也初步验证了前文结论,即视频信息比文字和图片信息形式更能引起微博用户对舆情话题的反应。

3.2.2 回归分析

首先采用原始回归模型对舆情话题的信息形式和样本微博传播的效果之间的关系进行分析,其中原始模型(a)对应转发量数据,原始模型(b)对应评论量数据,相关系数为正表示正相关,反之为负相关[13]。从表3和表4不难看出,两个模型容差值均大于0.1,VIF值均小于10,说明变量间不存在多元共线问题,数据的多重共线性检验指标符合要求[14]。

根据表3和表4所示的回归结果,表明在微博舆情话题传播过程中,图片信息形式﹑视频信息形式和节点的粉丝数量三个因素,对舆情话题微博的转发量和评论量均有显著正向影响[15];而超链接信息形式对舆情话题微博的转发量和评论量具有显著的负性影响。由此可以验证上文提出的假设:即信息形式会对微博舆情的传播产生正向影响,且视频信息形式对舆情传播的影响最大。此外,由于现有的微博信息几乎全部包含文字信息,即微博内容一定含有文字,所以在这几类信息形式中,只有文字信息对舆情的传播几乎没有影响。

同时需要注意,超链接信息形式与微博舆情话题中的评论量呈现显著负相关关系,原因可能是:

(1)本文研究的案例中含有超链接信息形式的微博多来自用户对官方所发布微博内容的转发,很多信息出现了重复,降低了用户对该类博文的兴趣以及转发和评论的可能性;

(2)当微博用户点开超链接查看舆情话题的详细内容信息时,很有可能会从微博平台跳转至第三方网站,易造成微博用户在查看完信息内容后往往不再愿意回到微博原文的页面上进行评论或者转发,而是经过超链接转向的网页进行评论和转发。

4 结 语

本文在国内外专家学者的研究基础上,以国内最受欢迎的新浪微博为舆情研究平台,提出基于信息形式的微博舆情传播模型,构建并验证了以信息形式为解释变量的原始回归方程,最后通过数据分析验证了模型的有效性和正确性。实验结果表明,现有的不同信息形式特别是视频信息会对舆情话题信息的传播产生重要影响。相比于传统的文字或图片信息形式,视频信息独有的吸引力和表现力,更能够抓住用户眼球,降低用户对舆情话题的参与成本,提高用户对舆情话题的参与意愿,从而对舆情话题在微博网络中的传播产生影响。

由于受数据量﹑技术条件和研究方法的限制,本文仅选取了新浪微博作为研究平台,且只针对“杭州G20峰会”这一舆情话题进行了有限时间范围内的数据收集工作,有可能导致样本不具有足够的普遍性和说服力。后续研究中,可以通过提高样本数据的数量﹑维度以及平台多样性,针对性地选取样本数据收集的时间条件,进一步对信息形式可能产生的影响以及这些影响间的内在联系进行更加深入的研究和分析。此外,除了信息内容的形式,舆情话题信息的其他特征也可作为今后值得关注的研究方向。

[1] 邓夏玮.基于社交网络的用户行为研究[D].北京:北京交通大学,2012.

DENG Xia-wei.Study on User Behavior based on Social Network[D].Beijing:Beijing Jiaotong University,2012.

[2] 吴增海.社交网络模型的研究[D].合肥:中国科学技术大学,2012.

WU Zeng-hai.Study on the Model of Social Network[D].Hefei:University of Science and Technology of China,2012.

[3] 高娴子.近年来我国社交网络发展研究[D].广州:暨南大学,2011.

GAO Xian-zi.Research on the Development of China’s Social Network[D].Guangzhou:Jinan University,2011.

[4] 李林容.社交网络的特性及其发展趋势[J].新闻界,2010(05):32-34.

LI Lin-rong.Social Network Features and Development Trend[J].Press Circles,2010(05):32-34.

[5] 张彦超.社交网络服务中信息传播模式与舆论演进过程研究[D].北京:北京交通大学,2012.

ZHANG Yan-chao.Research on Information Dissemination and Opinon Evolution in the Social Networking Services[D].Beijing:Beijing Jiaotong University,2012.

[6] 张彦超,刘云,张海峰等.基于在线社交网络的信息传播模型[J].物理学报,2011,60(05):1-7.

ZHANG Yan-chao,LIU Yun,ZHANG Hai-feng,et al.The Research of Information Dissemination Model on Online Social Network[J].Acta Phys. Sin,2011,60(05):1-7.

[7] 廖福生,江昀.微博客的信息传播模式及其发展分析[J].宁波广播电视大学学报,2010,8(02):4-6.

LIAO Fu-sheng,JIANG Yun.An Analysis of Microblogging Information Dissemination Model and Its Development[J].Journal of Ningbo Radio &University,2010,8(02):4-6.

[8] 王晓光.微博客用户行为特征与关系特征实证分析——以新浪微博为例[J].图书情报工作,2010,54(14):66-70.

WANG Xiao-guang.Empirical Analysis on Behavior Characteristics of Micro-blog Users——Take SinaMicroblog for Example[J].Library and Information Service,2010,54(14):66-70.

[9] 袁园.微博用户转发意愿的影响因素[D].南京:南京大学,2013:52-53.

YUAN Yuan.Research on Influence Factors of Microblog Users’Forwarding Intention[D].Nanjing:Nanjing University,2013:52-53.

[10] 陈远,袁艳红.微博信息传播的正负社会效应[J].信息资源管理学报,2012(02):48-54.

CHEN Yuan,YUAN Yan-hong.The Positive and Negetive Social Effect of Microblog Information Dissemination[J].Journal of Information Research Management,2012(02):48-54.

[11] 吉祥.基于观点挖掘的网络舆情信息分析[J].现代情报,2010(11):46-49.

JI Xiang.Analysis of Net-Mediated Public Sentiment Information Based on the Opinion Mining Technology[J].Journal of Modern Information,2010(11):46-49.

[12] Chang Y W.Influence of Human Behavior and the Principle of Least Effort on Library and Information Science Research[J].Information Processing&Management,2016,52(04):658-669.

[13] Zhang W,Ye Y Q,Tan H L.Information Diffusion Model Based on Social Network[C].In Proceedings of MCSA 2012:145-150.

[14] Liu Z,Liu L,Li H.Determinants of Information Retweeting in Microblogging[J].Internet Research,2012,22(04):443-466.

[15] Yan Q,Yi L,Wu L.Human Dynamic Model Codriven by Interest and Social Identity in the Microblog Community[J].Physica A:Statistical Mechanics and Its Applications,2012,391(04):1540-1545.

猜你喜欢

舆情形式用户
2022 年本刊可直接使用缩写形式的常用词汇
小议过去进行时
微型演讲:一种德育的新形式
搞定语法填空中的V—ing形式
数字舆情
数字舆情
消费舆情
关注用户
关注用户
关注用户