APP下载

舆情评论与新闻报道的话题识别及其主题关联分析

2018-08-11王曰芬许杜娟杨振怡罗浩

现代情报 2018年6期
关键词:社会现实关联分析新闻报道

王曰芬 许杜娟 杨振怡 罗浩

〔摘 要〕[目的/意义]针对同一事件新闻报道与舆情评论既相互依存又偏离的现象,通过话题识别与主题关联分析,探索新闻报道引发的舆情评论在主题内容与时间阶段上的异同,拟为研究以舆情评论表达的舆情事件和以新闻报道表达的社会现实之间的共振与偏离,进而为探究社会舆情传播规律提供参考,为服务政府科学决策提供依据。[方法/过程]以拉斯韦尔(5W)模型、LDA主题模型和Python工具为基础,设计研究思路和流程,从腾讯新闻和知乎平台上抓取新闻报道和评论的数据,经过处理加工过后加以分析挖掘。[结果/结论]研究发现:舆情事件主题会一定程度偏离社会现实主题,衍生出更多隐性主题;舆情事件与社会现实的发展走向较一致;此外,社交媒体相较于新闻媒体所衍生的舆情事件主题更多,而两者反映的社会现实主题类似。

〔关键词〕舆情评论;新闻报道;主题发现;舆情事件;社会现实;关联分析

DOI:10.3969/j.issn.1008-0821.2018.06.001

〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821(2018)06-0003-08

〔Abstract〕[Purpose/Significance]Regarding to the phenomenon that news reports and public opinions of the same event were interdependent and also deviated from each other,the paperexplore the differences and similarities of public opinions triggered by news reports in subject content and time phasing by topic detection and subject association analysis.This research planed to study the resonance and deviation between public events reflected in public opinions and social reality reflected in news reports,which would provide a reference for exploring the communication rule of social public opinions and offer a basis for government to make scientific decisions.[Process/Method]Based on Lasswells 5W communication model,LDA model and Python,the paper designed research ideas and process,crawled the corpus of news reports and their corresponding comments from Tencent News and Quaro and deeply analyzed the processed corpus.[Results/Conclusion]The research results indicated that more derivative latent subjects would be found in public opinions events which partly diverged from the subjects of social reality;the developing trends of public opinions events conformed with that of social reality;in addition,subjects of public opinions events reflected in social media were more than news media,while the subject content of social reality seemed similar on these two platforms.

〔Key words〕public opinions;news reports;topic discovery;public opinions events;social reality;association analysis

舆情被认为是公众对于现实社会及社会中各种现象、问题所表达的信念、态度、意见和情绪表现的总和,是实现社会调控必不可少的制约力量[1]。而舆情事件是指在一定时期、一定的社会空间内,被公众广泛关注的事件,通常通过某种中介(一般是媒体)扩散,促使公众产生某种具有广泛影响力的倾向性,并非所有的事件都必然成为舆情事件[2]。同时,新闻是对现实社会的建构[3],是对社会现实事件的表达与反映。新闻报道经过传播后,引发社会公众反响,当反响的社会影响力较大时会产生舆情事件。伴随着网络传播即时性、扩散性和社交媒体交互性、多元性的发展,通过网络平台传播的突发或者重大新闻报道通常会迅速引发社会公众舆情评论的喷涌。同时,社会现实与公众认知的断裂、輿情反响与政府应对的冲突等,加大了政府决策与管理的难度[4]。舆情评论与新闻报道导致的舆情事件与社会现实关联,作为一种现象或问题,影响网民对社会事件的认知和媒体的报道策略,并影响着政府或者涉事主体的行为选择。因此,在单一热点社会现实事件演化过程中,新闻报道引发的网民评论会牵扯出更多相关主题,这些衍生主题又会成为社会关注的新热点。那么,一旦新闻报道之后,在主题内容和时间上会激起哪些舆情评论以及如何发展,舆情评论主题的偏离现象与共振衍生状态怎样,是深化社会舆情传播研究中值得探索的。

通过前期的调研,发现相关研究主要集中在舆情关联、舆情信息扩散及其研究方法两个方面。在舆情关联及其研究方法方面,王国华等[5]认为舆情关联是指网络热点事件舆情通过主体、主题、情绪等要素发生联系生成舆情簇或者舆情集,从而影响舆情演化的现象。王国华等[6]发现网络热点事件舆情关联是由信息的眼球经济效应媒体的协同过滤和议程设置以及网民的群体记忆等多种因素而促成。马晓姝[7]提出一种基于LDA模型的聚类算法来发现新闻话题,以此来达到将相同新闻聚类并将聚类结果表示出来的目的。陈京民等[8]针对网络舆情关联规则挖掘的特点,设计了一种快速有效的基于XQuery的網络舆情关联规则挖掘系统。林萍等[9]根据网络舆情事件时间性强、话题与时间关联度单一的特征,提出了基于LDA模型抽取话题,分别使用后离散时间型话题模型与先离散时间型话题模型来研究话题热度变化和话题内容迁移,以此来体现话题演化路径。唐晓波等[10]根据微博的数据特点和信息论中信息量的观点,提出了微博热度的概念并将其引入到LDA模型的热点挖掘研究中,构建了基于微博热度的LDA模型;在舆情信息扩散及其研究方法方面,Yu等[11]基于舆情信息扩散过程中的用户交互过程,考虑到用户的交互历史与相互作用的类型和频率,提出了一种有向树模型,该模型可以描述信息的扩散,更精确地表达舆情传播的影响,在数据集中识别垃圾邮件更有效。石晶等[12]证实了LDA模型能够进行准确有效的文本分割来提取关键词。而将新闻主题按照时间顺序提取出来,会发现一个事件可能演化发展成几个相关但独立的主题。普林斯顿大学Blei[13]等提出的语料库生成概率模型广泛应用于新闻主题识别和追踪,以此来发现主题扩散与演化的规律。

综上所述,舆情关联与舆情信息扩散已经得到学者的关注,在模型构建与方法上产生了不少很有价值的研究成果。为了深化与扩展相关研究,针对社会发展需求和所提出的问题,本文拟以新闻媒体报道来表达社会现实事件、以公众评论来表达舆情事件为研究的前提,以腾讯新闻平台为主、知乎平台为辅,以“山东辱母杀人事件”这一事件为研究案例,采集该事件数据,利用LDA模型对新闻内容和评论内容的主题进行提取,进而从评论数量、发展阶段与不同媒体3个角度对主题建立关联并加以分析。

1 研究设计与数据处理

1.1 研究的理论基础与方法

1.1.1 拉斯韦尔(5W)模型

在传播学的诸多模式中,拉斯韦尔的5W模型是最基本和最为人们所熟知的模型。它主要通过5个要素,即:“谁(who)”、“说了什么(say what)”、“通过什么渠道(in which channel)”、“对谁说的(to whom)”、“产生了什么效果(with what effect)”,用以描述一个传播行为,具体如图1所示。

1.1.2 LDA模型

LDA(Latent Dirichlet Allocation)是一种文档主题生成模型,也称为一个三层贝叶斯概率模型,包含词、主题和文档三层结构。

LDA模型认为每篇文章是由多个主题组合而成的,而每个主题又是由多个词语概率所表示的。它可以将文档集中每篇文档的主题以概率分布的形式给出,从而通过分析一些文档并抽取出它们的主题出来后,便可以根据主题进行主题聚类或文本分类。同时,它是一种典型的词袋模型,即一篇文档是由一组词构成,词与词之间没有先后顺序的关系。LDA能够根据给定的一篇文档,推测其主题分布。因此在LDA模型中,要生成一篇文档,该文档中每个词语出现的概率为:

用在本研究中,其主要思想是将每条评论看作所有主题的一个混合概率分布,而将其中的每个主题看作在单词上的一个概率分布。

根据所提出的研究问题,借鉴已有的研究成果,本文将拉斯韦尔模式和LDA模型结合,针对传播要素及其之间关联关系进行分析与深度挖掘,突出不同舆论会话在要素层面上的语义关联和深度聚合研究,以揭示社会舆情信息的主题、传播特点和演变规律,为舆情信息分析和决策支持提供重要支撑。

1.2 研究框架

在研究设计中,根据前述的研究前提,在新闻媒体的选择上,以腾讯新闻为主要研究平台,并辅以社交媒体知乎平台为辅助;在案例事件的选择上,以“山东辱母杀人事件”新闻报道与舆情评论为实证对象。并拟定舆情事件指的是由新闻报道(或知乎提问)中有关社会现实所产生的评论(或知乎回答),而社会现实指的是新闻媒体所报道(知乎提问)的基于事件本身的描述。所设计的分析流程如下:首先,分别从腾讯新闻与知乎上获取新闻、评论和提问的数据,进行话题识别;然后,对这些话题进行LDA建模和主题抽取,以此来确定显性主题;最后,从评论数量、发展阶段与不同媒体不同角度,对这些显性主题进行舆情评论与新闻报道之间的关联,辅以社交媒体与新闻媒体的对比,以分析舆情事件与社会现实之间的差异,并发现得到某一舆情事件的隐性主题。具体研究框架如图2所示:

1.3 数据采集与处理

2017年3月的“山东辱母杀人事件”引发了网民的热烈讨论,关心的面较宽、关联的话题较多。因此,本文在腾讯新闻与知乎的搜索栏输入“辱母杀人”检索相关新闻(提问)与评论(回答),根据事件的进展,首先,利用Python爬虫爬取2017年3月24日至2017年3月30日的腾讯新闻与知乎平台上有关此事件的数据,数据包括:腾讯新闻内容和评论以及知乎上有关此话题的提问和回答,得到24篇新闻报道和93 190条相应评论以及知乎平台上51条提问和相应的回答。然后,将所爬取的这7天相关新闻与评论数据进行分词和去停用词处理,最后,将处理结果保存到TXT文档中并分别存放在以相应日期命名的文件夹中。

2 基于LDA建模的话题识别

在对所采集数据进行处理之后,为发现以舆情评论(知乎回答)所代表的舆情事件与以新闻报道(知乎提问)所代表的社会现实之间关联的隐性主题,首先采用Python中的WordCloud包制作关键词云图来初步识别话题并对其分阶段处理与表示,而后基于LDA建模,从整体或分段两个层面对舆情评论(知乎回答)和新闻报道(知乎提问)进行主题提取。本课题的研究对象是新闻媒体所报道的新闻与它所对应的评论信息、知乎提问和它所对应的回答信息,在对两者数据进行数据预处理后,分别进行主题识别和基于LDA建模进行主题聚类,提取最能体现两者内容的主题,以探究舆情事件与社会现实之间主题的共振和偏离。本文设定显示词的最大个数为100。

2.1 舆情评论的话题识别

在对数据进行采集与处理后,对体现舆情的评论数据进行词频统计并制作云图,结果如图3所示(其中,由于2017年3月29日的暂无评论数据,因此未将该天评论数据爬取下来)。由图3可以看出,在前3天,评论的热点话题重点在于警察、法官。2017年3月27日至28日评论热点话题与“高利贷”、“银行”有关。2017年3月30日评论话题围绕侮辱行为、法律、是否应判无罪释放而展开。

2.2 新闻报道的话题识别

在数据采集与处理后,对体现社会现实的新闻报道数据进行词频统计并制作云图,结果如图4所示。由图4可以看出,前3天的热点关键词涉及涉案人员、案件性质与类型以及对于警察与法律的探讨。2017年3月27日至28日2天的新闻关键词体现了案件背景,对此案件背后所暗含的企业银行贷款以及高利贷进行了讨论。2017年3月29日新闻关键词为“检查、介入、案件”,报道最高检察院表示已介入此案件。2017年3月30日,新闻关键词为“于欢、于秀荣”,主要由于山东通知案件双方家人阅卷,又一次回顾案件。

从图3和图4的热点话题可以看出,“辱母杀人事件”的话题可被划分为3个阶段,第一阶段为2017年3月24日至26日,第二阶段为2017年3月27日至28日,第三阶段为2017年3月29日至30日。从评论与新闻关键词云图所反映的话题中,可以看出,舆情评论所反映的话题更加针对事件背后的问题和原因,而新闻报道所反映的话题主要针对事件本身,描述社会现实。

3 舆情评论与新闻报道之间的主题关联分析

新闻传播与舆情发展的时间敏感性很强,为了在后续主题研究中能够深入进行分析,首先考察新闻报道与评论数量随着时间的分布及其变化趋势。

3.1 評论与报道数量随着时间的变化趋势

3.1.1 腾讯新闻的相关评论数量分布与变化趋势

通过Python爬取腾讯新闻相关评论数据,统计并绘制腾讯新闻的评论数随时间的变化,如图5所示。由此可知,在2017年3月24日,在腾讯新闻上该事件已得到2万多人的关注与评论,可以看出人们对于该事件爆发初期的反应还是很大的,而民众的关注度在2017年3月26日达到顶峰,而后开始减弱,2017年3月30日由于山东省高级法院做出回应而评论量有些许回升。由图5趋势线可知,评论数量总体在前3天逐渐增长,在2017年3月26日之后下降。

3.1.2 腾讯新闻所报道的新闻数量分布与变化趋势

统计所爬取的2017年3月24日到30日期间每日所发新闻的数量,绘制新闻报道数随时间的变化,如图6所示。可以看到,新闻报道数量从2017年3月24日逐渐攀升,到26日报道数量达到顶峰,后面几天的报道数量逐渐减少,30日时新闻数量有小的增长。由图6趋势线可知,新闻数量先增后降,2017年于3月26日左右达到顶峰。

从图5、图6的趋势线可以看出,评论与新闻报道数量随时间变化的趋势大体吻合,新闻媒体与公众的关注基本是从2017年3月24日开始,关注度渐渐提升,至2017年3月26日达到顶峰后逐渐减缓。需要注意的是2017年3月24日虽然只是转载南方周末的一篇文章,但引起了大量的讨论。从此可看出舆情事件可能先由一篇报道发起,引发舆论关注后,关注度逐渐上升,直到达到一个顶峰,最后衰退。

3.2 新闻媒体的评语与报道的主题关联分析

本文采用LDA主题模型抽取主题词。在抽取主题前需进行主题数的确定,由于目前对于主题数的确定一直没有一个有效的方法。研究中主要采取反复实验的方法,观察实验效果以确定一个合适的LDA模型主题数阈值。首先设定主题数为5进行实验,之后主题数以5为单位叠加并进行实验,在经过4次实验后,发现当主题数设置为5时,不能完全展示主题,而当主题数设置为10以上时,提取出的某些主题缺少意义。因此,选择将抽取的主题数设置为10,并根据研究设计进行后续的研究。

3.2.1 基于整个时间段的主题关联分析

分别抽取腾讯新闻2017年3月24日至30日期间整体的新闻报道和相应评论的主题,并对两者进行对比分析。抽取的主题结果如表1所示。

从表1中所列的结果得知:围绕着高利贷、法律与警察,新闻报道引发了针对不同主题的评论,因而产生了不同的关联。如主题1关于高利贷,新闻报道所述的社会现实是高利贷引发暴力,而评论所反映的舆情事件是对高利贷是否违法做出的争论,以及呼吁国家管制惩治高利贷;主题2关于判决和主题5关于定罪,所述的是于欢对于一审无期徒刑判决进行上诉,而网民认为警察和法院不应作为黑色势力的保护伞,并支持于欢无罪;主题3和主题7关于法律,所述的是司法部门对于欢是否属于正当防卫进行判决及以故意伤害罪判处无期,而网民关注中国的法律能否保护人民权益以及辩论法律究竟是什么和它的意义何在,希望并相信法律公正;主题4关于借放贷和主题8关于侮辱,新闻报道主题是关于苏银霞和吴学占、赵荣荣当事人和催债者“骂人”,公众评论认为媒体把焦点过多放在借贷上是为转移民众对案件中警察渎职的关注,认为“骂人”甚至性侮辱所激发的于欢杀人行为应属于正当防卫。主题6关于警察职责,新闻报道的是警察与法院对“辱母杀人案”有责任,而舆情事件中人们更关注在于欢一家被逼债而报警的情况下,警察未采取解决措施从而一定程度上没有避免杀人案的发生,希望法律追究警察渎职的责任;主题9和主题10关于行业现状和借贷,所反映的社会现实是钢贸行业的借贷融资现状,苏银霞的源大工贸借款总数近千万,而舆情事件所关注的主题是在该行业发展不佳难以取得银行贷款的情况下,企业因此转向借高利贷,当地警察可能涉黑并包庇高利贷势力。同时,认为借款者儿子因为催债者侮辱母亲受到刺激而导致杀人。

通过上述主题关联分析,可以看出针对新闻报道所反映的社会现实,经过舆情评论后使舆情事件产生出更多探讨社会现实背后原因的主题,这些主题就是舆情衍生出的关联隐性主题,即与社会现实共振又有一定程度偏离,在效果上往往能够引发共鸣并得到广泛传播且影响更多人。

3.2.2 基于不同阶段的主题对比分析

由上述对话题的初步识别,将“山东辱母杀人事件”的话题发展按时间划分为3个阶段,第一阶段为2017年3月24日至26日,第二阶段为2017年3月27日至28日,第三阶段为2017年3月29日至30日。下面分别对这3个阶段的腾讯新闻报道和评论主题进行对比分析。

1)第一阶段

表2为第一阶段腾讯新闻的评论和报道的主题抽取情况,从中可以得出,新闻报道所反映的社会现实主题主要是陈述案件的起因经过、涉案人员、案件性质以及法律对于该案件的判决。而评论所反映的舆情事件主题主要是有关法律的公正性、法律对于案件的裁决、国家对于高利贷的管控、在辱母杀人案发生之前警察接到报警而未出警的失职行为、于欢因不堪其母被辱而刺死一人的行为的刑事属性以及对于所牵涉警方和法官公正执法的质疑。

2)第二阶段

表3是第二阶段腾讯新闻的评论和新闻的主题抽取情况,从中可以得出,所述的社会现实主要有关苏银霞所有公司源大工贸的借贷情况、负债情况、经营业务以及由源大工贸所反射的近几年钢贸行业的困境。而针对这些社会现实的主题,评论中舆情事件的主题演变为国家应扶持民营企业、推动经济发展、媒体记者转移舆论话题、暴力催债的道德问题、警察的不作为甚至涉黑问题,黑社会高利贷所引发的社会问题。

3)第三阶段

表4是第三阶段腾讯新闻的评论和新闻的主题抽取情况,从中可以得出,新闻报道所反映的社会现实主题主要围绕法院对此案件的受理、审查、裁决、回应展开,还涉及被刺死的催债者杜志浩家人的采访陈述。而评论所反映的舆情事件主题主要关于希望加大法律对高利贷的制约,希望法律公正判决此案件,认为于欢是正当防卫并支持其无罪释放、警方应為此杀人案承担责任、对于于欢为保护母亲而杀人的理解和对高利贷及死者杜志浩的谴责。

从上述3个阶段舆情评论和新闻报道的主题对比中可发现,第一阶段的新闻报道主要针对案件本身进行描述,其评论主题主要讨论案件中所涉及政府司法部门以及政府对于高利贷的管理,这些主题构成比较简单,相关主题延伸不够深入;第二阶段,新闻报道主要针对高利贷和案件的债权背景,期间的评论主题延伸到了新闻媒体转移舆论关注、道德问题、警察涉黑问题、国家经济发展问题以及黑社会高利贷的不良社会影响;第三阶段,新闻报道主要针对法院对于“辱母杀人案”进展的通报。这一阶段的舆论主题因此更为关注案件中的法律问题,比如放高利贷的合法性、法律公正性问题,呼吁法院裁决于欢无罪释放、警察渎职所需承担的法律责任。综上所述,三个阶段的舆情事件衍生的主题既有全新的,如媒体转移舆论话题,也有将前阶段主题再次联系和加深的。但总体来看,舆情事件主题大多是围绕社会现实进行延伸的,其中核心主题是对高利贷问题、警察执法、法院判决、政府管理以及侮辱行为的深入探讨。

3.3 新闻媒体与社交媒体的主题关联分析

为了从不同媒体角度进行分析,本文选择社交媒体知乎作以辅助。采用上述的数据处理与主题抽取方法,首先分析知乎平台上舆情事件和社会现实之间的主题关联,然后,对比分析新闻媒体和社交媒体之间的主题,并比较不同平台所衍生的主题。通过数据采集处理与LDA主题抽取后,得到如表5所示的知乎提问与回答的10个主题。

从表5中所列的结果得知:主题1反映的社会现实是“山东辱母事件”的起因,苏银霞的企业为了企业周转向吴占学借高利贷,但有群众举报吴占学其实是招揽黑社会从事高利贷和收款事物,而回答所反映的舆情事件是高利贷是否与黑社会有关;主题2反映的社会现实是法官对于欢的判决,回答反映的舆情事件是社会民众对中国法律的不信任和对英美法的比较;主题3的社会现实是济南公安发布一篇“大巴与驴”嘲讽意味的微博,反映的舆情事件是网民针对梁山革命、南宋王公衮辱母杀人案件等历史事件的讨论;主题4是于欢作为儿子看到母亲被侮辱想要为母亲复仇这一社会现实,其舆情事件表现在网友联想到“春秋决狱”,“徐元庆为父报仇”等一系列事件;主题5是从社会道德方面引发于欢的行为是否是正当防卫的思考,这也从侧面表达出网民对于法官的判决存在异议,也说明了社会民众现在并不是盲目的观看事件报告,而是对事件拥有了参与权并在积极行使这一权利;主题6反映的是新闻报道了一系列法律与伦理的新闻,引发了网民的新一轮的关注热潮,也让司法部门全力调查该案件;主题7是由于法官的判决引发了人民对政府的讨论,使得民众以后对该类问题高度敏感,思考政府是否还是官僚主义,造成民众政治冷漠;主题8是因为该案件引发的社会反应较大,一些网民就在知乎上提问或者回答别人的提问,也有网民想到如何将该案件变成高考素材、司考素材等其他;主题9是法律在该案件中的作用:让人思考平民遇到黑社会催债法律是否会一直这样判,中国法律是否能真正做到保护公民的利益;主题10是从法律保护阶段让人不得不思考法律是否会真正保护临时工、驴民等这些基层人民,这有可能已造成政府公信力下降,使得政府与民众的互动变得更加困难。

综上所述,在知乎平台上,网民在关注社会现实的情况下,也会加入自己的思考,由此衍生出一系列的隐性主题。在获得“高利贷”、“正当防卫”、“警察”、“法律”等显性主题后,经过舆情事件与社会现实之间主题关联分析,还获得“英美法”、“临时工”、“高考素材”等舆情事件的隐性主题。然后,通过将这些舆情事件的主题与上述对腾讯新闻媒体分析所得到的结论进行比较,得到表6所示的结果。

通过对比知乎与腾讯这两个平台的舆情事件主题,发现不管是知乎还是腾讯,评论者都对新闻报道所反映的社会现实问题关注度较高,尤其是国家法律方面和警察不作为问题等这些和社会民众现实生活密切相关的主题。同时,评论者也在思考该事件对自己生活的影响程度,是否有借鉴意义。但是,腾讯用户更多的是关注道德问题、媒体是否故意引导并转移舆论关注、社会不良风气和势力等,其衍生的主题偏离度不高。而知乎上的评论者由该事件法院的判决联想到国外法律是怎样保护被害人的权益,由该“辱母杀人案”联想到“古代辱母(父)杀人案”,小部分网民还联想到“高考素材”、“司考”等。

综上所述,即使平台不同,针对某一类现实事件其社会现实主题大都类似,大都是对该事件的描述。在“山东聊城辱母事件”事件中,评论者普遍关心的还是该案件会如何判决,法律与道德之间到底怎样才能协调好,但由于平台类型的区别,腾讯更多的是新闻发布及其评论,知乎更多的是评论者共同讨论,所以导致在知乎这一平台上所衍生的舆情事件的主题更多,这对舆情事件和社会现实主题关联问题的深入研讨,准确把握舆情时间的发展变化规律有着更大地帮助。同时,有助于了解评论者的认知水平和对事物的判断能力,分析与判断因评论者影响的舆情事件的走向。

4 结 语

通过研究,本文得到如下的结论与思考:

1)从新闻报道数与舆情评论数随着时间变化来看,腾讯新闻通过对某一社会现实的报道,引发评论者关注以此形成舆情事件,随着报道该社会现实事件的关注度逐渐上升,评论数量也在逐渐上升,达到舆情事件的高潮阶段后随着时间的推移逐渐回归平淡。由此可见,新闻报道数量与舆情评论数量之间存在着一个正向线性关系。

2)从腾讯新闻的新闻报道和评论主题的关联来看,新闻媒体报道的社会现实经过时间的发酵,舆情事件的主题在一定程度上偏离了社会现实的主题,而衍生出一些隐性主题。

3)通过对比分析腾讯新闻不同阶段新闻报道和评论的主题,得出同一事件在不同的时间段内其主题是不断地变化的,即社会的关注点随着时间的推移也在不断地变化。

4)通过对比分析新闻媒体(腾讯新闻)和社交媒体(知乎)所反映的舆情事件与社会现实的主题,发现不同平台针对某一社会现实其评论者关注点大部分是类似的。但不同于新闻媒体的是,由于社交网站的交互性更强,其衍生的舆情事件主题往往更多。

综上所述,本文的研究对于深化舆情内容分析、把握舆情事件发展的特点与规律,对于政府决策和管理,将提供一定的理论参考与依据。在后续的研究中,还需要具体研究主题之间的关联程度并挖掘潜在的语义关联。

参考文献

[1]徐晓日.网络舆情事件的应急处理研究[J].华北电力大学学报,2007,(1):89-93.

[2]高宪春.新媒体环境下舆情事件互动机制分析[J].当代传播,2011,(6):50-53.

[3]盖伊·塔奇曼.做新闻[M].北京:华夏出版社,2008.

[4]陈必坤,王曰芬,廖海涵.大数据时代社会舆情分析与决策支持研究的现状及其发展趋势[J].情报科学,2016,(10):8-14.

[5]王国华,曾润喜,方付建.解码网络舆情[M].武汉:华中科技大学出版社,2011.

[6]王国华,邓海峰,王雅蕾,等.网络热点事件中的舆情关联问题研究[J].情报杂志,2012,31(7):1-5.

[7]马晓姝.基于LDA 模型的新闻话题发现研究[D].長春:东北师范大学,2014.

[8]陈京民,张振.一种基于XQuery的网络舆情关联规则挖掘系统[J].中国制造业信息化,2009,38(9):68 -70.

[9]林萍,黄卫东.基于 LDA 模型的网络舆情事件话题演化分析[J].情报杂志,2013,32(12):26-30.

[10]唐晓波,向坤.基于LDA模型和微博热度的热点挖掘[J].图书情报工作,2014,58(5):58-63.

[11]Yu M,Yang W,Wang W,et al.Information Diffusion and Influence Measurement Based on Interaction in Microblogging[M]Social Media Processing.Heidelberg,berlin:Springer Berlin Heidelberg,2014:129-140.

[12]石晶,范 猛,李万龙.基于LDA模型的主题分析[J].自动化报,2009,35(12):1586-1592.

[13]Blei D M,Ng A Y,Jordan M I.Latent Dirichletal Allocation[J].Journal of Machine Learning Research,2003,(3):993-1022.

(责任编辑:马 卓)

猜你喜欢

社会现实关联分析新闻报道
浅析如何在新闻报道中彰显以人为本
基于随机函数Petri网的系统动力学关联分析模型
历史齿轮上的累累伤痕
深化“走转改”在新闻报道中践行群众路线
如何让新闻报道鲜活起来
新闻报道要求真实的细节描写