APP下载

基于动态贝叶斯网络的舆情预测模型研究

2016-11-28柯赟

统计与决策 2016年20期
关键词:贝叶斯突发事件舆情

柯赟

(1.武汉工商学院;2.湖北网络社会发展研究中心,武汉430074)

基于动态贝叶斯网络的舆情预测模型研究

柯赟1,2

(1.武汉工商学院;2.湖北网络社会发展研究中心,武汉430074)

随着新兴媒体的出现,为了提前并更加准确地判断突发事件网络舆情的发展演化方向,以便做出比较合理的预测监控。文章基于动态贝叶斯网络模型,建立了关于突发事件的网络舆情预测监控模型。通过关联概率的计算,对动态贝叶斯网络中存在因果关系的节点变量进行预测。并以分析2014年上海踩踏事件为例,确定此事件对象中的节点变量,并通过10位专家评分的方式给出了对突发事件网络舆情进行预测的具体操作方法,得到比较合理的预测结果,证明了该方法的可行性和实用性。

网络舆情;预测;突发事件;动态贝叶斯;专家评分

0 引言

与传统的社会舆情相比,随着计算机网络的迅速普及以及网民规模的滚动式增长,网络上的言论日益频繁,其中,网络环境中突发事件的“羊群行为”影响趋势扩大,包括影响的传播速率以及扩大规模。因此,近年来在舆情中,一种新的表现形式——网络舆情也随之出现。网络舆情主要是指一些事件发生的前后凭借网络媒介传播后,人们对于这些事件的评价、认知方向、行为趋势等反应回馈形成的集合。鉴于其突发性、爆发性以及实时性等特点,若无法对网络舆情实施适当准确的引导并监管,则将导致其负面性对社会公共安全造成很大影响。

基于此背景下,对于突发事件的网络舆情进行提前、准确的预测监控显得越来越有必要,并成为当前研究的一大热点问题[1]。目前国内外关于网络舆情方面的研究文献,侧重点已经从定性研究开始慢慢向定量和定性相结合的趋势发展。

本文基于动态贝叶斯网络模型,对突发事件的网络舆情建立演变模型,并且利用特定的关联概率公式计算来进行实时预测,给国家政府提供管理突发事件网络舆情情况的参考价值。

1 舆情预测模型的构建

1.1 突发事件网络舆情演变分析

分析突发事件网络舆情的演变情况,关系着如何采取有效的措施以最大程度的减小其对社会的影响,从而给政府相关部门充分的时间,在突发事件网络舆情高潮来临之前做好各种合理的处理预案。如张一文[2]将突发事件网络舆情对社会的影响分为了四个阶段:潜伏期、明显期、高潮期以及消退期。本文在参考一些文献的基础上,认为其具有一定时期的潜伏期,为了在突发事件网络舆情到来时有足够的预备措施,必须在此阶段对其做好合理的预测分析。

因此,本文将突发事件网络舆情的发展主要分为三个阶段:潜伏期、发生期和演化期。其中,政府相关部门需要在潜伏期做好合理准确的预测分析,从而做好相应的预处理方案,采取有效的措施对其发生进行处理,并引导突发事件网络舆情平稳的度过演化期。

1.2 动态贝叶斯网络概念

动态贝叶斯网络模型是指跟随时间动态变化而演化的模型[3],相对于静态贝叶斯而言,其主要增加了一个时间要素,从而形成了包含对于时序数据具有处理能力的一个新的随机模型。其中,“动态”是指变量随着动态变化的时间取值,而非其网络结构发生动态变化[4]。

1.3 突发事件网络舆情预测建模

根据动态贝叶斯的概念可知,基于其描述的突发事件模型具备时间上的动态性,并且事件前后关联,满足突发事件发展、变化的规律。动态贝叶斯网络主要采用概率计算和统计的方法,结合专家评价、收集已有资料和数据进行分析计算,具备信息时间累计的能力,相比静态贝叶斯网络描述,在很多情况下,更具备合理性。动态贝叶斯网络主要由两部分组成:(1)初始状态,即初始贝叶斯网络N0;(2)两个或者两个以上时间片段的贝叶斯网络N。具体如图1所示。

由图1所示,可以看出此推理过程在很大程度上契合突发事件的发展变化规律。本文采用动态贝叶斯网络模型来建立突发事件网络舆情的关键情景,并对其主要要素进行分析。总体来说,动态贝叶斯网络的概率计算必须遵循如下规则[15]:动态贝叶斯网络参照贝叶斯网络,同样采用概率积分来表述不确定性,并且对于概率积分,最基本的规则为采用关联事件的概率:

式(1)中,P(A,B)表示事件A和B发生的实际概率,P(B)表示事件B的绝对概率,P(A/B)表示给定事件B发生的情况下,事件A发生的条件概率。P(A/B)可由式(1)变换为表达式(2):

其中,P((Mi)为先验概率,即所有量测之前的状态i的概率。是对于某一状态i给定测量向量e的条件下的概率。

图1 动态贝叶斯网络示例

注意事项:

(1)在对突发事件网络舆情进行监控预测建模之前,首先需要把握任意两节点变量之间的关系;

(2)在对(1)中节点变量之间关系的确定过程中,本文采用如下方法:第一步,通过相关领域专家分析舆情的关键因素点,并以评分的形式给定一个阈值r。若实际评分值大于r时,则对应的要素为关键要素;相反,若实际评分值小于r时,则需要丢掉;第二步,整合前面确定的关键要素点,并按照一定的逻辑顺序连接起来。

(3)根据确定的节点变量关系,构建有向无环图,也就是通过有向边将每个节点的相互关系呈现出来。

2 实例分析

2014年12月,上海市黄浦区外滩陈毅广场发生群众拥挤踩踏事件。政府对这一重大网络舆情突发事件作出了迅速回应,考虑到其仍然社会影响极其恶劣,本文以此为例,进行网络预测分析。

2.1 确定节点变量

针对上海踩踏事件网络舆情对象,将这些对象作为网络的某一个节点。在突发事件中,主要利用主观数据和客观数据来分别对末级指标进行量化,这些数据的来源大部分从各种现代传播媒体、交互工具以及政府等获得。而在此事件中,本文选用如下五个节点作为贝叶斯网络节点:网民X1、传统媒体(包括电视新闻、报纸等) X2、新兴媒体(官方微博、管方微信等)X3、政府(包括官方日报、电视会议等)X4、民间传播(公众、休闲场所等传播)X5。

2.2 确定网络节点的关系

通过相关领域专家对某一节点给出评分,从而确定节点间的因果关系,进一步通过式(4)计算出当前节点变量的概率值X。然后,给出此突发事件中当前节点的一个信度阈值r,若前面计算出来的估算平均值大于r,则表示存在因果关系,否则,为不存在。对于存在因果关系的节点变量构建有向无环图,用箭头连接,从而建立此事件的整个贝叶斯网络。假定此事件合理性阈值为0.7。

本文选用10名专家对节点X1、X2、X3、X4、X5进行分析评分,利用式(4)求得各个节点的算术平均值。具体情况见表1所示。

表1 变量X1、X2、X3、X4、X5的节点变量因果关系专家评分值

图2 简化后的贝叶斯网络图

2.3 条件概率确定

本文假定此突发事件的网络舆情某一节点变量G必定发生,因此它的True(记为T)为1、False(记为F)为0。其他贝叶斯网络节点的条件概率则由10名专家根据网络舆情的发展变化规律分析给出。当G=T时,若10名专家对X1[1]为T进行打分分别为0.8、0.8、0.9、0.9、0.8、0.7、0.95、0.9、0.9、0.9,则计算出其平均值为0.855,从而其为F时,F=1-0.855=0.145;当G=F时,若10名专家对X1[1]为T进行打分分别为0、0、0、0、0、0、0、0、0、0,因此其为T的算术平均值为0,F=1-0=1。X1[2]、X1[3]、X1[4]、X1[5]的取值方法与X1[1]相同。本文只给出网民X1条件概率的确定值,具体情况见表2,传统媒体X2、新兴媒体X3、政府X4、民间传播X5的计算方法与X1类似,这里只给出结果。

表2 X1的X1[1]、X1[2]、X1[3]、X1[4]、X1[5]时段的条件概率

2.4 状态概率计算

根据上述专家评分,利用关联概率计算出某一节点变量是否发生的概率。如X1的状态概率P(X1)为:

P(X1[1])=P(X1[1]/G=T)×P(G=T)+P(X1[1]/G=F)×P(G=F)

可以预测网民X1、传统媒体X2、新兴媒体X3、政府X4、民间传播X5在时间T2的动态。从而进一步根据T2五者之间的动态预测T3的动态,递推到整个事件结束为止,完成预测。本文只对X1在X1[1]、X1[2]、X1[3]、X1[4]、X1[5]这五个时间段进行计算,具体结果见表3。

X2、X3、X4及X5的计算方法类似X1,得出X1[1]的T为0.855、X1[2]的T为0.752、X1[3]的T为0.787、X1[4]的T为0.787、X1[5]的T为0.861。同样可以计算出其余各个节点的关联概率T均大于0.7。

结果说明,当本文所列举的事件发生时,各媒体、网民、民众等对这一事件的关注度会增加,不会呈现出保持不变或减弱的趋势。因此,给相关部门对这一突发事件网络舆情预警监控提供了依据。

表3 X1节点在X1[1]、X1[2]、X1[3]、X1[4]、X1[5]时间段的状态概率

3 结论

本文采用动态贝叶斯网络建立突发事件网络舆情监控预测模型,通过时间的动态变化可以很直观的从网络图中看出事件中定义的各个节点的发展趋势,从而可以更加准确合理的做出预测,为政府相关部门舆情控制提供有效的参考。另外,通过专家分析评分来确定事件发展各个阶段的条件概率,把定性问题定量化,可以有效的实现两者的结合,因此经过计算得出的结果会更具有科学性。理论上,相关领域越权威的专家给出的评分更加具有参考性以及实际价值,同时专家数量的规模需要根据突发事件的实际情况确定。

最后,本文以上海踩踏突发事件为例,分析并预测了其网络舆情变化。可以看出,本文方法可以应用到具体事例中,并尽可能从多方面相关渠道收集详细的调查数据进行分析,从而做出更加准确合理的预测。随着国内网络舆情预测体系的不断发展完善,这一方法将能够为政府分析突发事件网络舆情起到一定的参考价值。

[1]Schydel v R,Triklel A,Osbome C.A Digital w atermark[C].Procedding of International Conference on Image Proceeding.Texas:IEEE, 1994,(2).

[2]张一文,齐佳音,方滨兴等.非常规突发事件网络舆情热度评价指标体系构建[J].情报杂志,2010,(11).

[3]史志富,张安.贝叶斯网络理论及其在军事系统中的应用[M].北京:国防工业出版社,2012.

[4]郦能敬.预警机系统导论[M].北京:国防工业出版社,1998.

[5]孙兆林,杨宏文,胡卫东.基于贝叶斯网络的态势估计方法[J].计算机应用,2005,25(4).

(责任编辑/亦民)

G530

A

1002-6487(2016)20-0026-03

湖北省社会科学基金重大项目(国信办委托项目)(2012w T007)

柯赟(1978—),女,湖北武汉人,副教授,研究员,研究方向:网络传播、危机管理、舆情导控。

猜你喜欢

贝叶斯突发事件舆情
基于贝叶斯解释回应被告人讲述的故事
基于动态贝叶斯估计的疲劳驾驶识别研究
数字舆情
数字舆情
消费舆情
突发事件的舆论引导
清朝三起突发事件的处置
基于互信息的贝叶斯网络结构学习
突发事件
IIRCT下负二项分布参数多变点的贝叶斯估计