APP下载

茧房效应与新闻消费行为模式

2019-12-09陈华珊王呈伟

社会科学 2019年11期

陈华珊 王呈伟

摘 要:随着移动互联网的兴起,新闻客户端已经成为人们主流新闻阅读方式,与之相伴的算法推送也可能会造成用户信息获取时的茧房效应。在个体层次上,对不同新闻的阅读构成了一个时间上连续的离散事件序列,个体的新闻阅读行为一方面有其过往阅读习惯的路径依赖,另一方面则受到最新发生新闻的影响。因此,基于读者接受信息的动态模式研究和对注意力竞争的研究可以让我们进一步进解茧房效应的复杂性。通过使用事件序列模型,以新闻客户端用户在时间维度上连续消费的新闻主题序列为研究对象,研究发现:用户在“硬新闻”消费过程中更容易表现出持续型和游走型的两种行为模式:当热点事件爆发时,偏好消费“软新闻”的用户会更容易参与到热点事件的讨论之中。

关键词:茧房效应;回音室效应;事件序列模型;新闻消费

中图分类号:C913.4 文献标识码:A 文章编号:0257-5833(2019)11-0073-15

作者简介:陈华珊,中国社会科学院社会发展战略研究院副研究员、中国社会科学院社会景气研究中心主任;王呈伟,哥伦比亚大学量化社会科学项目研究生 (北京 100732)

在移动互联网时代,通过新闻客户端阅读新闻已经成为人们的主流新闻阅读方式。根据第42次CNNIC《中国互联网络发展状况统计报告》,截至2018年6月,我国网民规模达到8.02亿,互联网普及率为57.7%。而其中,手机用户规模达到7.88亿,占网民总数的98.3% ,并且,网络新闻应用的网民使用率占82.7%。艾媒咨询的数据显示,截至2017年第四季度,中国手机新闻客户端用户规模高达6.36亿人,超七成受访用户每天使用手机新闻客户端。伴随着客户端新闻浏览习惯的兴起,根据用户阅读内容偏好以及兴趣标签推送内容的新闻推荐模式也成为了一个现象。这种有偏的信息获取过程所造成的信息茧房效应及其后果成为学界关注的热门话题之一。

一方面,研究者们对于互联网与算法推送过程中是否存在茧房效应的争执暂未停歇;另一方面,关于算法和人的趋同性中哪一个才是茧房效应产生的真正原因也尚未有定论。在各类研究中,不同的研究对象和不同的测量方法都影响着他们的结论。同时,在研究视角上,大部分研究只能局限于静态计算读者阅读内容的多样性,而缺乏对时间维度上的读者行为模式进行深入讨论。但这种微观动态视角对于那些希望进一步探索茧房效应的研究者而言是不可缺少的。因此本文采取微观动态的视角来分析具体情境中,在茧房效应中的读者们所表现出的行为模式。

一、问题提出

(一)信息茧房与回音室效应

2006年,Sunstein出版《信息乌托邦》一书,在书中他对于互联网背景下的信息获取、处理过程及其结果进行了详细的描述。Sunstein重新叙述了信息时代的“回音室效应”(echo chambers),通过引用Nicholas Negroponte的个人日报(the Daily Me)概念,他认为每个读者都在主动或被动地接受一份完全按照自己兴趣定制的新闻报纸,在其中每个人都能选择自己喜欢的话题和角度。而这一做法的结果是信息茧房效应的产生:人们在传播世界中只能听到他们自己所选择的和让自己舒服开心的内容。

虽然Sunstein提出了信息茧房的存在,但他更倾向于认为这种现象在真实生活中更为常见——人们会在现实世界(工作场所、学校、邻居交往)中,花费大量的时间沉浸在他们的“个人日报”里,以NASA/CIA等机构为例,Sunstein指出,其组织领导人和整个组织都生存于信息茧房之中,不愿意去接受少数人的意见或者倾听来自异见者的声音。而互联网世界中,以“我们日报”(Daily Us)为特征的信息传播与交流模式正在不断更新,并打破人们在传统交流时会陷入的茧房,以维基为代表的信息更新与积累过程正在打破茧壁。

但是,Sunstein在观察博客和搜索引擎时,发现信息茧房效应在不断加强。一些搜索结果会产生同质的观点:个性化搜索确保了谷歌能够给用户一些符合其兴趣的内容。这就造成了有着不同的搜索记录的用户能够自动接收对于相同搜索关键词的不同答案。而一些购物网站或是内容贩卖网站(例如Amazon与Netflix)正在利用协同过滤(collaborative filtering)等算法,根据用户的喜好为他们设置独特的推荐内容,这种推荐方式运作颇具效果但容易进一步加深茧房效应。在博客世界中,也存在同样的问题:人们走向极端仅仅是因为他们只看那些和自己有着一样价值观的博客内容。这种现象产生的效果即是人们能够更加方便地生存在自己的回音室之中。博客与博客之间存在着区隔,读者与读者之间也出现鸿沟。

(二)现有研究

在现有对于回音室效应或者是茧房效应这类有偏信息选择过程的研究中,一个关键问题是这种效应是否真实存在。因为这种信息有偏选择行为会造成意识形态极化、读者相互区隔、假新闻泛滥等一系列负面影响,因此担忧民主制度及其危机的研究者们将政治信息的获得过程作为他们的研究对象。例如, Colleoni等人对Twitter内容分析发现,按照政治立场来划分推文内容,可以将用户划分为民主党派和共和党派,这两派人在内容选择的同质性上有显著差异。Jacobson等人对于Facebook上保守派和自由派对应的新闻页面中人们所发送的链接进行研究,发现这些链接所指向的网站大部分不重合,并且自由派的人更喜欢链接到自由派的网站,而保守派则更喜欢链接至保守派的内容,因此他们认为Facebook上存在回音室效應。同样,Flaxman等人对于新闻网站的检索记录(仅限于硬新闻——政治性新闻而言)的分析发现,整体上的意识形态区隔呈现一种微弱的存在,并且大部分人都只喜欢选择自己喜欢的内容,虽然一些持有极端意见的人阅读对立面的新闻的概率增加了。

在政治信息获取研究领域,也有研究者认为茧房效应或其类似现象并不存在。Reese等人通过对博客文章中所添加的外部链接的分析,发现大多数的博客内容都会引用传统的专业新闻报道,而这些报道通常是政治中立的,因此他们认为回音室效应在博客世界中并不存在。更进一步的是Dubois和Blank的研究,他们利用受访者自我汇报的新闻消费习惯作为研究数据,研究个人在媒体接触过程中所产生的回音室效应。他们通过是否阅读对立面新闻、检测新闻消息源的习惯和新闻阅读后的观念改变等五个维度对回音室效应进行测量。在这项研究中,他们发现大部分人都对政治话题感兴趣和/或使用多种媒体。这两点能够减少人们陷入回音室效应的可能性。因此他们认为回音室效应是一种被夸大的现象。

一些学者虽然承认回音室效应/茧房效应存在,但是他们认为互联网的出现没有增大这种效应。也有学者认为互联网世界中虽然存在着这样的效应,但相比于传统的信息传播方式,这种效应是被减弱的。

除去政治信息等硬新闻之外,研究者对其他内容的消费过程也进行了茧房效应研究。Fleder等人的研究发现在音乐选择过程中,不同用户在启用算法推荐之后,两两用户之间的购买内容重叠性变高,由此可以判断推荐系统增加了内容消费同质性,因此推荐系统被认为是一种帮助人们拓展兴趣点的工具。此外,Goldie等人发现在教育政策讨论过程中存在着回音室效应。

对上述不同类型内容消费的回音室效应进行比较,Hosanagar承认不同类型的内容消费之间存在差异,在政治内容的消费中更容易表现出茧房效应。同理,由于综合性的新闻内容网站之中存在着各种类型的新闻——政治类的硬新闻、娱乐类的软新闻——只讨论其中的任何一类都会造成对用户的新闻阅读行为的理解有偏。例如,有研究发现人们在阅读硬新闻时,阅读多样性会更加丰富,但是当他们消费软新闻时,所选择的内容会更加单一。

除了对茧房效应是否存在的争议,还有学者关注茧房效应的起因。研究结果可以大致分为两类:一类研究结果认为算法推送将人们关入过滤气泡(filter bubble)之中,另一类研究则认为算法推送本身不会影响人的选择,而是人本身的趋同性导致他们选择性地获取信息。

Pariser认为新一代互联网过滤器会研究用户过去的行为从而判断用户的类型,并预言其喜欢的事物,这种预言引擎将会为每一个用户创造一个独特的信息世界,最终改变他们遇见观点和信息的方式。这种个人独有的信息世界被Pariser称为“过滤气泡”。过滤气泡作为概念比茧房效应和回音室效应更有针对性,它特指互联网中由算法造成的信息选择性接触。具体而言,以协同过滤为例,算法推荐机制的过程在于分析数据。通过文本内容中关键词的相似度进行匹配,从而找到与用户相似的用户或是与用户选择过的物品相似的商品,并推送至每位用户的浏览界面。Pariser认为这样的算法推送有三种特有的机制:用户独自身处其中;过滤气泡是肉眼不可见的;用户无法选择只能进入气泡之中。因此,他坚定地认为算法定制会导致人们进入过滤气泡——即出现茧房效应。

综上,我们可以看出:目前学界对于茧房效应的存在与否和它的起因为何这两个问题,尚未有统一的定论。这种困境一方面是因为研究者在研究的过程,选择的研究平台和研究内容不同。目前在对新闻阅读的研究中,既有对Google News类似的新闻集成网站进行研究,也有对Facebook、Twitter等社会化媒体的研究。另一方面,不同研究运用的数据和测量回音室效应的方式都相差甚远,比如Jacobson等计算的是不同派别的网站所用的链接的政治倾向,认为民主派更喜欢民主派的内容就是回音壁效应,但是在Reese的研究中,虽然民主派引用更多民主派的信息,但是他们引用更多信息,因此Reese等人认为不存在茧房效应。Dubois和Blank则是利用人们自我汇报的新闻阅读相关行为进行分析,以及其他针对新闻网站内容的多样性进行计算的研究。对于不同领域(政治、娱乐等)所展开的研究也会得到截然不同的结论。因此,这些研究虽然都针对有偏向性的信息选择行为,但却因上述原因而难以进行对话。

除此之外,这些研究也存在一些共同的问题。首先,某些讨论太过于宏观而难以看到微观上信息茧房效应的具体生成机制。例如Lazer等人只以某个固定的时间截面上的政治博客连接行为对人们的政治倾向进行分析,而Sunstein的结论也是在宏观角度上对于信息获取行为进行的观察。

在另一些研究茧房效应的文献中,研究者们将自己的关注点放在互联网背景下,对于算法推送的内容进行研究。这种研究视角虽然能够提供给人们一个好的描述,使人体会到算法推送技术呈现给它的内容消费者的客观世界是如何的,但却难以展现人们在面对这种环境时所采取的行动和策略。例如Haim等人对Google News推送的新闻内容加以记录、分类,并计算他们的推送频率与分布,来证明这种新闻集合网站的算法推送并没有出现茧房效应。通过理论探讨,喻国明等人指出算法正在过滤并正反馈处理用户偏好,对新闻信息的类型、题材等方面加以限制,使得用户的媒体接触被自己的兴趣固化。由此,这种基于计算机的新中介取代传统媒体,利用用户的浏览记录为用户设置议程。

上述这些研究视角以客观信息环境的全貌取代了人真正做出的信息选择,因此不能完全解释茧房效应的存在与机制问题。所以也有研究者选择针对内容消费者自身的选择行为进行研究。例如以每人每天的阅读各类新闻的数量和阅读概率为依据,计算个人的新闻消费多样程度,Zhang等人发现人们在软新闻(轻松娱乐类新闻)上的多样性要低,即存在着茧房效应。另外,他们还发现女性比男性更倾向于同质化阅读。Bakshy等人除了对Facebook的推送内容进行记录外,同时比较每个用户的点击行为(即个人从自己所暴露的信息环境中选择阅读的内容),以比较并确认与算法相比,人的趋同性是真正导致他们自己陷入茧房效应的原因。

以上研究中,有些计算了算法推送的内容界面的多样性,有些则将人们的点击记录中的内容多样性进行分析,但都只限于對静态的、固定的行为结果进行研究。而在真正的新闻阅读中,个人的阅读行为则是连续的,一位用户如果陷入茧房效应之中,那么他在阅读完一条新闻之后,应该因为算法推送或是自己兴趣的原因,在短时间内再次选择类似主题进行阅读;或者他经常性地浏览某一个主题的内容。这样连续的或是有规律的新闻阅读序列应当是一种有助于理解茧房效应的测量指标。况且,这种在时间维度上的动态选择过程,已经被不少学者在阐释茧房效应(或是回音室效应)时提及。例如,喻国明认为茧房效应是在算法技术不断学习人的历史浏览记录并将这种学习结果以内容推荐的形式返还给读者的过程之中,“久而久之”生成的;Sunstein也认为茧房效应是社会动力学意义上的结果,在回音室里“人与人之间不断传播”,不断放大一种声音,最终形成了茧房。由此可见,在时间维度上或行为序列上对茧房效应进行探索是精准理解茧房效应必不可少的一部分,我们不应在讨论信息有偏选择行为时忽视人们在时间序列上产生的连续信息流。

因此,本文将在时间维度上探索读者接受或选择信息时的动态行为模式,以便了解读者在面对某个客观环境时,做出的选择在时间维度和行为序列上的模式和特征。

在针对互联网带来的信息茧房和回音室效应的其他讨论中,另一对矛盾也被持续关注:究竟互联网中的信息海洋使得人们更加充分地得知并参与这些讨论,还是互联网与算法将人们的偏好心理更进一步扩大了。Colleoni等人认为Twitter作为一种新闻媒体,实现了公共领域的功能,而公共领域指的是“一系列社会中的传播空间,无论何种政见的人都被允许在其中以各种各样的形式传播信息或想法、相互辩论”。Brundidge认为网络加速了人们不可逆地暴露在各种政治意见中的过程,即使他们自己并不愿意,因而网络提高了政治讨论的异质性,达成了一种公共领域。

但在另一些情况下,互联网被认为是加速了信息的选择性接受,回音室效应使得人们日益加强了自己的政治倾向。如此茧房效应应当会引起的公共领域和全民共有话题的消失。

但是不可否认,引起全民热议的热点新闻事件正在持续发生。全民热议的热门事件与个人信息茧房内的新闻类型存在着某种注意力竞争关系。有研究表明,虽然人在阅读新闻时呈现出同质化阅读的趋势,但整体信息世界的多样性会正向影响个人阅读的多样性。不过这一矛盾中的竞争机制尚且没有得到详细解释。

作为信息的使用者,在注意力有限的情况之下,如何在自己熟悉的话题和全民热议的话题之间进行注意力分配是我们理解茧房效应在微观表现的不错样本。因此,研究这种矛盾的竞争关系在读者阅读行为层面的表现有助于我们进一步理解信息茧房的复杂性。

综上所述,本文提出以下两个问题:(1)身处茧房之中的读者接受或选择信息时的动态行为模式是什么样的?(2)在热点事件与茧房效应发生注意力竟争时,这两者之间的关系反映在读者阅读行为上是怎样的?为了解答这两个问题,本文设计了两个研究过程分别进行讨论。

二、数据处理与研究设计

(一)数据获取与处理

本文分析的数据是2017年1月1日至3月31日我国某大型新闻门户网站的用户评论数据,对在这段时间内进行过评论的用户随机抽样,共抽取40000个用户及其所有评论记录421776条。为确保用户是活跃并且是真实的,排除了三个月期间仅回复1条新闻的用户和回复数量超过200条的用户(以排除机器人账户),由此最终分析样本为23279位用户,222056条评论记录。

由于综合性新闻客户端中所包含的新闻题材广泛且复杂,因此只对所有用户的数据进行笼统地描述难以使人从更细致的角度去深入理解用户的茧房效应表现;并且,人在不同领域的内容上可能存在着不同的茧房效应程度,因此,我们首先将新闻数据分为几种不同的类型,并对读者在不同类型的新闻内容上的茧房表现进行探讨。为了对新闻内容进行整合再分类,本文运用文本主题模型(Topic Model)将所有新闻分为300个主题,阅读每个主题内前30个关键词并结合主题间文本相似度,再将300个主题进一步聚合,形成六大类主题:民生、娱乐休闲、生活、时政、科技文化、财经。按照新闻主题的严肃性,我们大致将前三者归类为软新闻,而把后三者归类为硬新闻。

其次,为了测试信息茧房效应的表现程度,我们计算用户的话题偏好程度。我们以每位用户在六大类主题上的不同回复概率作为新闻消费偏好指数,即每位用户同时拥有六个新闻消费偏好指数,分别为民生类、娱乐休闲类、时政类新闻类、生活类新闻类、科技文化类以及财经类新闻消费偏好指数。而这六个新闻消费偏好指数作为信息茧房效应的一种测量方式,表现每一位用户在每一个新闻主题上的茧房效应强弱。在某一话题上回复概率越高的用户,越偏好消费此类新闻,他在这一类主题上的茧房效应也就越强。

(二)研究设计

1. 茧房效应与读者的阅读行为模式

在对茧房效应的已有研究中,我们发现有两种机制会导致茧房效应的出现:一种是算法推送导致的信息偏向性获取,另一种是因为人本身固有的趋同性导致的信息偏好式获得。虽然表现出相似的结果,但是这两种原因导致的茧房效应表现在人们选取信息的动态行为时存在着差异。

在算法推送导致的回音室效应之中,信息茧房是一种在其中只能够听到我们所选择的和让我们舒服开心的内容的传播世界,我们可以预计当一个人在浏览新闻时,算法学习了他的浏览记录并且预计其兴趣,从而不断地为其推送相似话题的内容,因此表现在用户的行为模式上是不间断地消费相同类型的新闻内容的过程。本文把这种行为模式称为持续型行为模式。

在因为个人的习惯而导致的茧房效应之中,我们首先假设个人会从自己最喜欢的话题开始阅读,之后由于网络世界的信息多元且丰富,人们会游走于这样的信息海洋中,巧合性地遇见一些新闻事件。最终他们会通过搜索引擎等方式把自己的行为集中在自己最感兴趣的问题之上。这被Savolainen归结为一种日常生活中的信息搜索理论,他认为个人拥有布迪厄所提出的“惯习”,并且形成了一种生活方式。因此这种由人的本性所驱动的茧房效应表现为游走于信息之间最终又回归自己的兴趣点的新闻消费行为模式。在本研究中,将这种行为模式称为游走型行为模式。

在本研究中,新闻内容被分为六个主题类型,分別标记为A、B、C、D、E和F。用户的每一次新闻阅读,则可表示为不同长度的事件序列,例如:民生-娱乐-娱乐-财经(ABBE)。因此以上两种行为模式在具体的新闻消费之中,表现为以下新闻主题之间的序列排列模式。具体如下:

当一个用户在主题A之上形成茧房效应时,如果其受到算法推送的影响较大,那么表现出的持续性行为模式为持续不断地消费A主题下的新闻,例如:AA,AAA,AAAA新闻,其中A的数量并不确定。而这种持续型行为模式表现在主题消费序列之上时,统一写作:A+A。

同样,当一位用户因为自己的心理偏好而主动产生茧房效应时,他应当表现出游走型行为模式,而在这种模式之下,他的行为记录应当在主题序列排序中表现出诸如以下特征:ABA,ABCDA,AFDA……,即AXA,其中X为通配符,表示其他非A主题。AXA表示用户正在浩渺的信息海洋中进行游走,但最终会归于其所偏好的主题A。我们将这种行为模式统一标识为“inter A”。

并且,由于不同的新闻主题有内容和话题上的差异,人们在不同主题中应当会表现出不同程度的茧房效应;而新闻消费偏好作为一种测量茧房效应强弱的指标,与这两种行为模式的出现概率应当存在正相关关系。即个人在某主题上的茧房效应越强,其在该主题上的偏好指数越大,且在该主题上表现出以上两种行为模式的概率也越高。

而女性通常来说会比男性在某些内容上更容易出现茧房效应;年龄也会影响一个人在信息选取时的多样性,Sunstein认为互联网中的信息积累和信息更正能够帮助一个人摆脱茧房效应,因此可以预测年轻人可能比年长的人更容易出现茧房效应。因此,我们提出以下假设:

H1.1:不同的新闻主题之中会出现不同程度的茧房行为模式。

H1.2:同一主题内,新闻消费偏好指数越高,出现两种茧房行为模式的概率就越大。

H1.3:在某些内容领域,女性比男性更容易出现茧房效应。

H1.4:年轻人比年长的人更容易出现茧房效应。

2. 热点事件与茧房效应的注意力竞争

信息茧房效应的存在违背了人们对于互联网作为一个公共领域的想象,但这种效应与时常爆發的引起全民热议的热点事件又存在着矛盾。从茧房效应的角度来讨论人们参与热点事件的情况,可以看到茧房效应在微观上竞争读者注意力的运作机制。

在热点事件爆发时,如果该事件本身属于读者自身的偏好话题之中,那么这些读者们可能更容易关注到该事件;但是,当热点事件不属于读者自身的偏好话题之内时,那么茧房效应越强的读者越不可能参与到这些热点事件的讨论中。

另一方面,读者本身的偏好指数高低及其所表征的茧房效应的强弱将会影响到他们对于热点事件的参与情况。当读者的偏好指数偏低时,他们将更容易参与到热点事件的讨论中;相反,当他们的偏好指数高,茧房效应高时,他们将更慢地参与到热点事件中, 甚至不参与其中。因此我们假设如下:

H2:新闻消费偏好越强的人,越不容易参与到热点事件的讨论中。

(三)事件序列模型

为了考察上述所提的持续型行为模式和游走型行为模式在茧房效应中的表现,本研究构建了不同的事件序列,并纳入相关事件模型(Relational Event Model)框架中来考察人们的新闻消费行为模式以及两种行为模式的效应:

1. 持续型行为模式:这一行为模式指的是在A事件之后继续评论A事件的概率模型。例如,运用该模型可以计算出评论完娱乐休闲话题之后继续评论娱乐休闲话题(娱乐休闲+娱乐休闲)的概率,即对某话题的持续关注行为。

2. 游走型行为模式:这一行为模式指的是在讨论完事件A之后,转而讨论其他事件B,之后再转回事件A讨论的概率模型,例如讨论完娱乐休闲话题后讨论时政类新闻内容、财经类新闻内容,继而重新讨论娱乐休闲话题的概率(娱乐休闲-X-娱乐休闲),即对于话题的忠实度。

这两种行为模式是在现有条件允许范围内,对于信息茧房效应的两个具体化表现。另外,我们还考察读者的新闻消费偏好指数与两种新闻消费行为模式出现概率的关系,因此一共有三组模型,即整体模型、年龄分组模型以及性别分组模型。

三、研究发现

(一)茧房效应与读者的阅读行为模式

在表1的模型结果中,我们可以看到持续型行为模式的系数高于游走型行为模式的系数,可见两种导致茧房效应的因素中,算法推送造成的茧房效应强于用户的惯习所造成的结果。其次,新闻热度的系数不显著,表示新闻热度本身对人们的新闻消费行为影响不大。

1. 持续型行为模式

表1固定效应模型部分的结果表示用户整体上在不同主题新闻阅读数量的分配。可以看到,大部分的新闻主题系数都为正效应,只有科技文化和财经类新闻的系数为负效应,这意味着在移动互联网上,用户更大程度上愿意消费民生类、娱乐休闲类、时政类和生活类新闻,而更少关注科技文化类新闻和财经类新闻。

但是在持续型行为模型的模型结果中,虽然科技文化类和财经类新闻的受众面比其他类型新闻窄,但是它们的读者却比其他读者更有可能持续参与这类内容的消费之中。首先,财经类新闻的系数最高,模型所得的对数发生比(log odds)值为1.23,这说明对于某一位已经评论了某一条财经类新闻的用户而言,继续评论另外一条财经类新闻的概率比转向其他类型新闻的可能性要高很多。科技文化类新闻的系数虽然小于财经类的,但是依然是显著正效应,说明对于关注科技文化类新闻的用户而言,持续关注科技文化类新闻的概率要高于转向评论其他新闻。在系数为负值的四类新闻中,除了时政类新闻之外,民生类、娱乐休闲类、生活类新闻都属于软新闻范畴,对于这类新闻的消费,用户通常会表现出非持续关注的行为模式。

但是与期待有所不同的是时政类新闻的系数为负,说明评论一条时政类新闻之后,用户评论其他新闻类型的可能性显著高于时政类新闻。这一点在中文语境下能够被理解:Zhang对于中国移动新闻端的研究同样也发现人们对于政治的兴趣正在下降。因此,总体而言,可以认为硬新闻内容消费者比软新闻消费者存在更多的持续关注行为模式。

2. 游走型行为模式

从表1的游走型行为模式结果来看,有且只有财经类新闻的系数显著正向。这说明对于那些参与过财经类新闻的读者而言,即使他们在这之后参与讨论了其他主题的新闻,最终回归参与财经类新闻的讨论的可能性仍然要高于讨论其他新闻主题。由此可见,财经类新闻的内容消费者对于这一类型的新闻有很强的偏好,他们不仅持续参与财经类新闻的消费,并且还能够在参与其他新闻主题之后重新回到同类主题进行讨论。

另一方面,与持续型行为模式的结果相比,科技文化类新闻的系数在游走型行为模式中呈现为显著负效应。这说明,虽然这一类型的内容消费者会持续消费这一主题的新闻内容,但是他们不太可能会在转移注意力之后再重新回到这一主题之上。而时政类新闻的系数同样也为负,并且绝对值大于科技文化类,说明时政类读者比科技文化类读者更不可能回到原新闻讨论中。

但是在对系数按大小排序后,我们发现,三类硬新闻(时政、科技文化和财经)的系数要大于软新闻(民生、娱乐休闲和生活)的系数。这也就意味着,即使硬新闻中的游走型行为模式出现可能性不高,但是与软新闻的消费者相比,他们依旧是更有可能回到同一主题的新闻讨论中去的。

总而言之,硬新闻读者在任何一种行为模式的发生可能性都要高于软新闻读者,并且硬新闻读者更容易表现出持续型行为模式,而软新闻读者更容易表现出游走型行为模式。

3. 两种行为模式与新闻消费偏好交互效应

在表1的第四部分为读者在各类新闻主题上的偏好指数与两类行为模式的交互效应。这一交互效应所代表的意义即对某一个特定的用户而言,当他在某一类新闻主题的偏好指数增加时,叠加在特定行为模式上的效应。表1中的交互项系数均为正数,这意味着无论对于什么主题的新闻而言,人们对特定主题的偏好会强化他们持续型行为模式和游走型行为模式特征。这从侧面证明了用户行为层面的茧房效应确实可以表现为这两种形式。

其次,将持续型行为模式和游走型行为模式的结果对比来看,持续型行为模式的系数在每一个新闻主题内都高于游走型行為模式,这与上文的几个结果发现是一致的,人们的茧房效应更大程度上会体现在持续型的参与行为之上,他们虽然也表现出游走型行为模式,但出现概率受到茧房效应的影响会低于持续型行为模式。

在软硬新闻的对比中,我们也发现与上文结果类似的现象:无论在哪种行为模式中,硬新闻的系数都明显大于软新闻的系数,这也就意味着茧房效应对于这两种行为模式出现的概率的影响在硬新闻上要更大,有强茧房效应的人更容易在硬新闻的消费中表现出这两种行为模式。此外,硬新闻中持续型行为模式的系数排序结果也与之前的结论一致,财经类新闻中,人们的偏好指数对于行为模式的出现概率的影响是最大的,科技文化次之,时政类新闻再次之,但其系数均高于软新闻。

4. 性别组间差异

表2为针对男女性别分组模型的结果与总体模型的差异比较。女性消费硬新闻时的持续型行为模式系数均为正数,并且都高于男性的系数(以及总体系数)。此结果看似和其他研究中的发现相悖(女性通常被认为更关注软新闻,而男性更多关注硬新闻),但事实上并不矛盾。因为这一模型结果的含义是:对于那些已经评论过一条财经类新闻的女性而言,她们继续评论财经类新闻而非其他主题的新闻的概率是高于同类男性的,这就意味着关注财经类的女性具有更强的持续型行为模式,对时政类新闻、科技文化类新闻而言都是同理。这一结果也验证了女性比男性具有更强的信息茧房效应这一结论。

另外,单就消费硬新闻的女性读者而言,其系数排序也与男性读者的结果以及总体结果相似:财经类新闻消费中出现持续型行为模式的概率高于科技文化类,也高于时政类,并且硬新闻的系数高于软新闻。这一方面的发现,在男性内容消费者的结果中也相同,只是男性读者在时政类新闻中出现持续型行为模式的可能性不高(系数为负)。

游走型行为模式的结果中,女性在科技文化类和时政类的系数不显著,但是其在财经类新闻消费行为出现游走型行为模式的可能性高于男性和总体,这意味着对于那些参与过财经类新闻的女性而言,她们比男性更有可能在注意力转移之后重新回到财经类新闻消费中。

而男性在生活类新闻上表现出了强游走型行为模式,他们在参与生活类新闻之后,会参与其他新闻主题的讨论后继续消费生活类新闻。

而在交互效应的考察中,女性的系数都是远高于男性,除了在娱乐休闲类新闻和财经类新闻部分二者系数差不多之外。因此,整体而言,女性的新闻消费偏好能够比男性更大程度地影响她们表现出这两种行为模式的概率。这也符合之前本文关于女性更有可能陷入茧房效应的论断。

5. 年龄组间差异

表3是年龄组之间模型结果对比。由表中的比较可知,首先与总体模型结果相同,几乎所有年龄组给予财经类新闻的注意力都具有强持续性。从财经类持续型模型的系数大小来看,年龄低的组别,系数越高;除此之外,18岁以下组的注意力同时对科技文化类新闻表现出强持续性,而其他年龄层都没有特定持续性偏好,甚至不出现对财经类新闻的兴趣。因此,我们可以判断年纪越轻,表现出的持续型行为模式越明显,且主要体现在财经类新闻与科技文化类之上。

从游走型模型结果来看,只有25岁及以下的人表现出对财经类新闻的忠实度,而且系数随着年龄增加而下降,由此来看,游走型的茧房效应与持续型的结果在年龄分组中没有太大差别,具体表现为年轻人更容易在财经类上有明显的茧房效应。

从第四部分的交互项结果来看,所有系数都为正数,并且持续型行为模式的系数都明显高于游走型行为模式,硬新闻的系数高于软新闻的系数,可见在不同年龄组之中,个人的偏好指数对于两种行为模式出现的概率都有着相同的影响。

其次,除了民生类和时政类新闻之外,年龄的增加会导致系数基本呈现增长趋势,从整体来看,随着年龄的增加,个人的偏好指数对于行为模式出现的概率的影响是上升的(只有个别情况下系数有所波动或是趋于平稳)。这说明,虽然整体年龄趋势下,年纪越轻的用户越有可能出现茧房效应的两种行为模式,但是对于茧房效应程度本来就比较强烈的人而言,大龄读者比青年读者更可能出现这两种行为模式。

(二)热点事件与茧房效应的注意力竞争

为了考察热点事件与茧房效应的注意力竞争关系,本研究选取了回复数超过200条的新闻共20篇作为研究对象:热点事件。并根据用户对于这些热点事件的参与考察两个因素:1)用户是否回复该热点新闻;2)用户回复时间与热点事件发生(新闻发布时间)的时间间隔。在自变量的选择上,我们选取了用户在六大主题中的新闻消费偏好指数作为茧房效应的强弱指标。

最终对于读者是否回复热点新闻以及回复该类新闻的时间间隔建立Cox回归模型,以考察新闻消费偏好所表征的茧房效应强弱如何影响读者在热点事件中的参与情况。

虽然在模型结果(表4)中,我们的假设(茧房效应越强的人越不容易参与热点事件的讨论)没有得到直接证实,但是由模型结果可知,科技文化类、财经类、时政类新闻消费偏好对于热点事件参与度的影响不存在显著效应,这也就意味着对于这一类硬新闻的忠实读者而言,他们的个人喜好难以影响他们对于热点事件的参与程度,他们参与热点事件的情况,无论高低,都受别的因素影响。

而对于更偏好消费娱乐休闲类、民生类、生活类这类软新闻的读者而言,新闻消费偏好越高,对热点事件的参与度越高。综合前述事件序列模型的结果,我们认为软新闻的忠实读者首先本身不具有明显新闻主题茧房效应,而是更容易受竞争类事件影响参与热点事件新闻的讨论中去。

四、总结与讨论

本文从两个方面对茧房效应现象进行研究,一方面我们研究茧房效应这个现象下微观层面上读者消费新闻的动态行为模式,另一方面,我们探索茧房效应与热点事件之间的注意力竞争关系在消费者行为模式上的呈现及其影响因素。

首先我们认为信息茧房效应在信息流层面上表现出两种形式,一种是人们受到算法推送的影响,持续性地参与类似的新闻话题,即持续型行为模式;另一种是人们在自己的兴趣偏好的影响下,浏览并选取自己感兴趣的新闻内容,这种行为模式被称为游走型行为模式。我们利用相关事件模型框架对这两种事件序列行为模式的出现概率和影响因素进行分析,研究主要发现:

1.在总体数据层面,茧房效应所表现出的两种新闻消费行为模式确实存在,具体表现为持续型的行为模式和游走型的行为模式,并且这两种类型只是在部分硬新聞的参与中显著存在。财经类新闻中这种效应最强,表现为读者持续不断地消费同类新闻的行为,以及用户在参与了其他事件之后再回到该类话题之上的消费行为;而科技文化类新闻次之,表现为读者倾向于持续地消费这一类新闻。

2.两种行为模式会随着人们的内容消费偏好指数增加而出现概率增大,又因为偏好指数是茧房效应的直接表现,因此,当一个人茧房效应越强时,他出现这两种行为模式的可能性就越大。并且硬新闻消费中的持续型行为出现的可能性最大。

3.从性别分组来看,特定话题(时政、科技文化与财经类新闻)中,女性的茧房效应要强于男性;从年龄分组来看,年轻一辈更容易在财经类新闻上产生茧房效应。但是茧房效应强的人之中,这两种行为模式的出现概率与年龄成正比。

从茧房效应与热点事件的注意力竞争过程之中,我们可以看到,茧房效应在更为轻松的软新闻如娱乐休闲类、民生类、生活类新闻之中表现得不明显,也就是说,读者越偏好这类新闻就越容易参与热点事件的讨论。但是在专业门槛较高的硬新闻类型中,热点事件参与度并不受其新闻消费偏好的影响。

本文在以下两个方面为后续研究提供方向。首先,我们从分析影响茧房效应的原因入手,认为内容消费者具有主观能动性,将时间维度引入到对人们的新闻消费行为的分析之中。我们将新闻内容消费者的消费内容序列作为主要的分析对象,并将茧房效应在行为模式方面具像化为两种不同的行为模式,这两种行为模式相对于其他更为松散的行为模式而言,更有可能为后续研究提供研究选择性偏好的新思路。

另一方面,我们将互联网时代的媒体消费问题中的一个矛盾点——即互联网促进了公共领域还是加固了茧房效应具体化为热点事件的参与度与人们自身存在的茧房效应之间的竞争关系。通过这种具体化的研究,我们在微观层面上发现公共领域讨论和信息茧房竞争并夺取内容消费者注意力的过程。

本文的贡献在于发现了茧房效应在读者阅读过程中出现的两种新闻消费行为模式:一种是持续消费同一类型新闻的行为模式,另一种是不断在喜欢的主题和其他主题之类往复的游走行为模式,在此基础上,我们通过分析影响这两种行为模式出现概率的因素,展现不同的读者群体有偏向地选择新闻内容的不同行为轨迹。此外,本文通过分析热点事件与茧房效应的具体注意力竞争过程,来进一步探讨茧房效应在真实情境中的具体表现。本文的创新点在于不再局限于将静态的读者阅读内容分布或是多样性作为分析对象,而是对其消费的信息流进行研究,这使得我们的研究更加贴近真实的读者新闻消费体验,也更有利于后续研究对茧房效应以及相关的信息有偏接受过程的理解。

受研究素材所限,本研究所用数据只局限于单一新闻客户端平台,它的用户在年龄、地理位置等一系列人口学变量上的分布并非无偏。并且,因为数据限制,我们无法检测用户是否有跨平台阅读和检索新闻的行为,也无法全面分析人们在线上、线下接触新闻的全过程,因此不能够完全解释通过多媒体获取信息的消费者们的行为模式。但是,如果只考虑该研究中的新闻平台与其用户行为,以及后续的结果和影响,本文的结果依然有很强的适用性。当然,我们也期待在后续的研究过程中,对此主题有兴趣的研究者能够继续寻求跨新闻平台上读者阅读行为的模式,以为本文结果提供横向比较。

(责任编辑:薛立勇)

The Echo Chamber Effect and the Patterns of

News Consumption on Mobile Apps

Chen Huashan Wang Chengwei

Abstract: With the rise of mobile Internet, news client apps dominate the gateway of information retrieving. As a result, the accompanying algorithm of news recommendation has also caused research concerns on echo chambers. At the individual level, the reading of different news articles constitutes a sequence of discrete events in time, and the individual's news reading behavior is the path-dependent effect of its past reading habits as well as affected by the latest news. By using event sequence model, this paper takes the topic sequence of news read by client users in the time dimension as the research object, and finds that users are more likely to show two kind of reading patterns named continuous process and wandering process in hard news consumption. Also, users who prefer to consume soft news are more likely to participate in the discussion of hot news events when they erupt. Therefore, this research show the micro dynamic pattern of the echo chamber effects in the process of news consumption, which is also helpful to the follow-up studies to have more understanding of the echo chamber effects in news consumption.

Keywords: Echo Chamber;Relational Event;News Consumption