APP下载

网络舆论数学模型构建与实例分析

2019-04-19谭励彦史毛馨

新课程·中学 2019年2期
关键词:数据驱动

谭励彦 史毛馨

摘 要:网络舆论是民众在互联网上社会中某种现象或问题所表达出的信念、态度、意见和情绪等表现的总和。首先分析并优选了网络舆论代表性的影响因素,并利用AHP层次分析法分析出各个因素的权重,建立出网络舆论指数的方案评价函数模型。然后,研究了网络舆论指数随时间的变化关系,从理论上推导一阶自治微分方程,得到了指数函数形式。最后,结合新闻事件和数据研究了网络舆论的函数形式和传播规律。研究得出,网络舆论指数函数是由线性函数、指数函数、二次函數构成的分段函数,网络舆论在发展中包括潜伏期、传播期、消散期三个阶段,具有各自的特征及其判定方法,实现了对网络舆论的态势的客观表述。

关键词:网络舆论指数;AHP层次分析;分段函数拟合;数据驱动

互联网成为新闻、观点、民声的集散地。当持有、接受、表达某种相同、相似的观点的人在网络人群中所占的比例超过一定的阀值,此时就上升为网络舆论。

网络的开放性和虚拟性决定了网络舆论具有突发性、扩散性、马太效应、偏差性等特点。社会上的一些敏感问题出现在网上而引起一些人的共鸣应是一种正常现象,但是由于各种复杂因素使这些敏感问题向热点演变为舆论。某些网络舆论如不及时引导控制,甚至会引起社会群众的违规和过激行动,影响到社会安定。由于某些网络舆论爆发“内容威胁”的形式对社会公共安全形成威胁,查明网络舆论的形成、明晰网络舆论传播扩大的因素、依照舆论势态进行合理引导,将成为营造长期和谐稳定的网络氛围和社会治安的必要条件,也必将成为互联网进一步发展的必然

趋势。

近年来,部分学者以关键字“互联网”为核心,界定了网络舆论的概念,如王天意定义为公众依托互联网这一现代工具,针对某一件或者某些焦点事件,发表的带有明显个人倾向且具有一定影响力的看法、言论的情形。而在百度百科中,网络舆情被定义为在一定的社会空间内,通过网络围绕中介性社会事件的发生、发展和变化,民众对公共问题和社会管理者产生和持有的社会政治态度、信念和价值观。结合前人的观点,给出网络舆论的定义:它是较多民众在互联网上关于社会中某种现象或问题所表达出的信念、态度、意见和情绪等表现的总和。

一、网络舆论影响因素

丁菊玲等人提出网络舆论的影响因素应当分为外在、内在两部分,并深入分析了网络版主、新闻线人、媒体记者、点击量、跟帖数等因素。结合前人结论以及实际经验,本文得出网络舆论指数的影响因素如图1所示。本文认为内在因素能够直接反映出网络舆论的影响力,并挑选出最具有代表性的因素,包括网页相关链接数量、点击阅读量、评论回复量、关注人数(粉丝量)。外在因素则是抽象的概念,包括管理尺度、传统媒体、名人吸引、网络媒体评论角度。

外在因素和内在因素这两种准则共同决定了网络舆论指数。其中,对于外在因素,由于它的相关数据无法量化(例如,内在因素中,某时刻某舆论的点击量可查得的,而名人吸引的力度不可得到具体数值),而且内在因素的数据可以反映外在因素的影响,所以本文在网络舆论指数的评价函数中仅考虑内在因素的数据。此外,对于网页相关链接数量,若选取网页所有链接量作为数据,链接的数量显示在浏览器上仅精确到万位,该数据在短时间内的变化量不明显,可以看出舆论影响并不是明显的影响因素。综上所述,本文选择将收集关注人数、评论回复量、点击阅读量的数据作为数学建模的数据支持。

二、网路舆论指数模型

1.网络舆论指数评价函数模型

网络舆论指数(Q)是反映网络舆论变化的一个指标或参数,如何构建网络舆论指数的评价函数模型是重要的研究内容。经过分析,评论数(D)、新闻阅读量(R)、关注粉丝量(F)这三个影响因素尽管均可对网络舆论指数产生影响,因此选择这三个内在影响因素作为衡量网络舆论的指标。但是,它们的影响力度不同。因此,本文选择使用AHP分析方法,并适当基础简化,分析出各个因素的对网络舆论指数影响的占比或权重。

研究中作如下基本假设:“浏览过新闻的人一定点击了新闻;关注此新闻的人一定浏览了该新闻;参与讨论的人一定关注了此新闻”。

首先,本文通过网站网友参与人数、网站相关性等因素分别对两两统计量间进行重要度赋值,如表1所示。

经过计算,CR=0.003185,即一致性比例处于(0,0.1)之间,表明信息无损失,说明上述判断矩阵各项赋值合理。

2.网络舆论指数微分方程

在网络舆论指数(Q)评价函数模型确定后,研究网络舆论指数随时间的变化规律可以用于分析网络舆论的“扩散性”,以此来判定、解释和预测网络舆论指数的变化情况。本文选择使用微分方程来描述这一关系。论文给出的网络舆论指数微分方程为:

可以看出,网络舆论指数的总体上随时间增长,在前期和后期增长较慢,在中期增长较快。网络舆论指数的变化率随网络舆论指数的增加而增加。显然,当网络舆论指数越大时,其造成的社会影响也越大,该影响导致其增长越来越快。网络舆论指数的变化率随网络舆论指数接近峰值而变小。不难理解,当网络舆论发展到一定时间后,由于更多的人已经对此事件有了相关的了解和认知,该事件的热度会逐渐下降,新闻头条被其他事件所取代,其网络舆论指数变化逐渐趋于平稳并保持在某一稳定值。

3.案例数据分析

为了验证上述评价网络舆论指数(Q)评价函数模型及其随时间的变化规律是否正确,利用2016年发生的“魏则西事件”案例进行深入分析。

对于数据的采集,本文选取1天为一个时段,从点击阅读量、评论回复量和关注人数这三个影响网络舆论指数的因素,选择各大主流媒体,统计该事件在网上的舆论发酵程度。首先统计百度贴吧关于该事件关键词的总回帖数、搜狐网页上该新闻的阅读量及回复量。新浪微博话题的关注量、360热搜的数据,如表3所示。统计发现,各大媒体的数据量不同,数据反映的信息意义也不同。研究发现,百度贴吧总回帖数、搜狐阅读量和新浪微博话题关注量这三类数据数据级较大,这反映网民参与数较多,且数据权威性高。这三类数据来自不同的网站,但阅读量、话题关注和回帖这三类数据从不同层面客观地反映网民对该网络新闻重视网民、参与程度。利用归一化方式,可将三类数据视作来源于同一网络平台。

综上所述,选择百度贴吧总回帖数,搜狐阅读量和新浪微博话题关注量这三方数据作为建模数据来源。对于舆论指数的计算,假设网友评论、阅读、关注的人数比例不变,相对于舆论指数的权值相同,故沿用每项数据的权值(λ),根据评价函数计算出每一时间段的舆论指数,计算结果如表3所示。

图4(a)为一个月内网络舆论指数变化规律。可以看出,一个月中不同时段网络舆论指数的变化规律不同:前半部分函数基本以指数规律上升,而后半段函数则以二次函数增长的同时趋于平稳。需要指出的是,在前半段函数一开始变化趋势比较平稳,前4个时间符合线性规律,因此证明网络舆论指数初期的变化的确是由平稳发展再到快速增长的,如图3(b)所示。当第6天到9天范围内,舆论指数Q呈指数规律上升,如图3(c)所示。当10天以后,舆论指数Q曲线轻微波动并逐渐趋于平稳,考虑到其凹凸性,选择二次函数进行拟合,结果较为满意。舆论指数的确是随着时间推移逐渐接近于最大值的图3(d)。当舆论指数基本保持不变时,该新闻的热度基本消散,关注的人逐渐散去。

综合上述分析,得出了一个完整新闻的网络舆论指数关于时间的分段函数Q(t)。

Q=0.0264t+0.0511,0

根据分段函数看出,一个完整新闻的舆论指数变化分为三个阶段,潜伏期(一次函数阶段),传播期(指数函数阶段),消散期(二次函数阶段)。而且,该分段函数也验证了通过微分方程解出来的在某一阶段Q(t)为指数函数的正确性。

再通过分段函数的拟合之后,本文尝试使用通过微分方程构造的函数再次进行拟合,比较拟合效果。

通过代入魏则西事件的相关数据对2.2中得到的网络舆论指数随时间的变化函数Q(t)进行拟合之后,得到的函数为

不难发现,这两种拟合方式都能很好地体现出网络舆论指数关于时间的变化关系。

此外,我们还对另外一些新闻事件的数据也进行了研究,在初始时间内确实符合线性增长的规律,函数斜率的差仅为0.001。对于不同的新闻事件,函数的形式是相同的,均呈现出潜伏期、传播期和消散期三种不同的函数形态,很好地描述网络舆情的发展变化趋势,不同的是函数的系数或指数是不同的。

本文从理论和数据双方面驱动建模,利用AHP层次分析描述了各准则层对目标方案的权重占比,灵活有效地完成了数学建模工作,并以实例分析了网络舆论指数随时间的变化规律,对于网络舆论态势表述与指导舆情控制具有重要意义。

(1)基于评论数、新闻阅读量、关注粉丝量三因素的AHP层次分析法能够实现网络舆论指数评价模型,有较高的科学依据,而且计算结果准确。

(2)从微分方程与数据拟合两个角度,分析了网络舆论指数随时间的变化规律。数据分析指出了網络舆论包括潜伏期(一次函数阶段)、传播期(指数函数阶段)与消散期(二次函数阶段),在传播中期网络舆论指数呈指数上升趋势,与微分方程所表达的指数函数形式是一致的,实现了“数据驱动”方法。

当然,AHP层次分析中确定权重之间的相对重要度时带有一定的人为设定,并且不够直观,需要进一步研究。

致谢:研究中朱浩楠老师在思路上给予了耐心的指导和支持,杨礼嘉、王颖初两位同学积极参与了讨论和帮助,在此表示衷心的感谢。

参考文献:

[1]王天意.网络舆论引导与和谐论坛建设[M].人民出版社,2008.

[2]丁菊玲,勒中坚.网络舆情危机事件形成因素分析[J].情报杂志,2011.

[3]王莲芬,许树柏.层次分析法引论[M].中国人民大学出版社,1990.

作者简介:谭励彦(2001—),男,现为北京十一学校高二学生,参加数学建模培训和比赛多次,先后获国际奖项1次、国家奖项2次、省部级奖项4次。

编辑 杜元元

猜你喜欢

数据驱动
基于网络与数据智能化的数码印花产品设计定制模式研究
数据驱动理念在大学英语课程中的应用
数据驱动导向高校多维度教育信息系统开发研究
大数据的局限性