APP下载

社交网络信息传播影响力研究范式

2016-06-13毋建军

长沙大学学报 2016年3期
关键词:社交网络信息传播

毋建军

(北京政法职业学院信息技术系, 北京 102628)



社交网络信息传播影响力研究范式

毋建军

(北京政法职业学院信息技术系, 北京 102628)

摘要:随着社交网络的快速发展,社交网络信息在传播介质、传播源、传播类型等方面都发生了很大的变化,社交网络信息传播规律的研究逐渐成为社交网络研究领域的一个重要方向,已取得许多研究进展,但它仍然存在许多挑战及问题。通过对信息传播基本问题进行厘清及分析其形成原因,构建了社交网络信息传播过程模型,分类综述了社交网络信息传播研究进展,并对其未来管控及发展方向进行了探讨和展望。

关键词:社交网络;信息传播;传播介质;媒介分析

一引言

近年来,随着社交网络的广泛应用,微博、微信、QQ群等社交网络载体在加速信息传播、影响力扩大化的过程中扮演了非常重要的角色[1]。从大规模的社交网络用户中发掘少数具有特殊影响力的意见领袖或关键人物,不仅是生物、医学、社会学、物理学、计算机等多学科在社区发现、网络和社会信息传播、疾病传染、舆情、信任传播、公共健康等领域的研究热点,也是广告定点投放、病毒式或口碑营销等推广方式实现以最小化成本、最大化扩散产品影响效应的重点。

通过影响力及传播的基本属性,分析和对比现有的影响力及传播的研究范式和成果关联,并构建其框架,本文将介绍影响力问题、形成因素及过程模型构建,分析社交网络模型的研究及其优劣,探讨研究的方向趋势及面临的问题。

二社交网络影响力问题

(一)影响力及传播问题

传统影响力分析假设的前提,是网络信息传播中总能找到一小部分人,把它们作为信息传播的起始种子用户,能使信息在网络中的传播实现最大化的效应,即影响力最大化(IM)。

Jessin[2]认为传统影响力分析中没有考虑普通用户在信息传播中的作用,虽然种子用户对信息本身的影响力、触发信息级联的机会比普通用户大,但它们对信息的传播过程贡献并不明显,对传播过程起作用的主要是网络本身的属性,而不是小部分用户。目前影响力最大化分析工作大部分还是基于传统影响力的假设。大部分社交网络影响的工作,主要围绕以下几个问题展开:影响力信息的起源及追溯;对影响力产生作用的因素有哪些;如何才能最大化影响力,能够对最大化影响其关键作用的用户如何选取。

(二)影响力传播过程模型

影响力、传播涉及因素众多,大多数工作把影响力工作集中于图1抽象的影响力传播过程模型中人的要素上,如Merton提出意见领袖概念、Bakshy根据用户属性及转发URL的行为特点,评分提取影响力用户;Watts发现驱动影响力事件级联传播的人,并不是人们通常所想的社会意见领袖,而是普通的大众用户等。

当前虽然大多数影响力任务相似或相关,但由于介质、特征、维度选择的不同,导致社交影响力模型构建、影响力测量、影响力评价方法比较杂多,没有统一可解释的标准模型。本文在前人工作的基础上,把影响力传播抽象为人在物化的介质上传递信息的过程,包含三元要素和时间因子,三元要素为:人、介质和信息。信息在介质中随着时间进行传播,信息传播的过程是影响力形成的过程,介质的两端是人,人具有影响力,信息自身也具有影响力,信息的传播过程是不可逆转的线性过程,其影响力传播过程模型如图1所示。

图1 影响力传播过程模型

影响力分析数据跨越多个学科,早期有疾病、农业、生物基因、协作网络、论坛、博客等面向不同领域的小数据,近年社交网络数据海量增长,有基于Facebook、Twitter、Google+等的大数据,不同的数据源有着不同的特征,测试数据来源方式主要有免费公开和自行采集两种方式,免费公开的测试数据通常只有节点和边的特征;而自行采集的数据特征较多,对基于内容和属性的特征建模较为适用。

(三)社交影响力传播结构构建

社交影响力传播的介质载体通常映射为图结构形式处理,图顶点可以表示用户、站点、推文或进行自定义含义,边通常表示节点之间的关系,既可以是显式的也可以是隐式的,显式边表示节点之间明确的链接关系,隐式的边表示节点之间在话题、讨论内容、兴趣、爱好地理位置、信仰、观点等方面的关联关系,边上可以以权值的方式表示顶点之间的链接强度或疏远、相似程度。

早期衡量介质结构中节点重要性的方法是中心性(centrality),社交网络中一个节点的中心性越高,表示这个节点的影响力就越大,节点中心性值可以用节点的度简化表示,分别统计以这个节点为起点的路径,Freema以平均最短路径即紧密中心性和节点中介性(betweenness)来评价节点的影响力,节点有可能成为局部或全局社交网络信息流瓶颈,形成网络结构洞或网络桥[3],删除桥节点,网络就散分。节点属性是节点影响力的标志之一,比如加V、知名人士、意见领袖、领导人等,通常都代表着潜在的影响力、关注度。

社交网络中边通常用同质性(homophily)、异质性(Heterogeneity)、互惠性(Reciprocity)等来度量。有边并不代表有很强的关联关系,边分有向的(Twitter为代表)、无向(Facebook为代表),边的链接关系强度及紧密程度与介质本身的结构形成有很大的关系,也就是说与测试数据直接相关,如互惠性在Twitter中并不明显,但在Flikr中相对较多。影响力传播与边的单向、双向关联性目前并不清楚,尚待探索,但在介质结构中单向的更容易形成星型结构,双向的更容易形成团状结构。格兰诺维特在《弱连接的优势》中认为,研究者更容易关注强连接的影响,往往忽视了弱连接的作用。强连接可以使人们之间产生信任,降低不确定性,加速信息在熟悉的圈子中快速传播,但弱连带有利于推动消息在更广的范围内传递扩散,它实现了强连带所不具有的功能。因此基于链接关系的强弱,主要的社交网络可以分成以下两类:

强关系:Facebook,人人网,Google+等。信任度高,由于都是熟人,互动性高,由于在环境中都是真实的朋友,他们愿意互动、交流、分享信息;信息的传播速度快,但传播局限于朋友圈子内,传播范围有限。

弱关系:Twitter,新浪微博、Plurk等。信任度低,互动性低,名人或意见领袖的作用更为明显,在粉丝数量足够大的情况下,会有非常好的广播效果,可以达到一定的广度和深度。

三社交网络影响力评价模型

(一)基于网络拓扑结构的评价方法

网络拓扑结构是人们交互信息过程中社交影响力扩散的结果,其节点属性和边显式链接关系的形成、采集都比较直接,转化为图的结构后,引入图度量方法测量节点和边的影响力[4]。Alan[5]对四种社交网络Flickr、LiveJournal、Orkut、YouTube及Web介质结构的路径长度、半径、直径、出度和入度的关联性进行了分析,发现除了节点度具有幂定律之外,边链接具有对称性(symmetry),同配性(Assortativity)、出入度强相关,高度的节点倾向于连接其他高度的节点具有相同传播对象,高度节点连接具有反对行为的低度节点,通过联合度分布(JDD)的无标度行为标准和同配性计算连接相关性。但单独对节点和边影响力的测量方法,并没有考虑社区介质结构的时间特性,只对某一时刻的社区结构进行节点和边影响力的测量,而用户实际影响力会随时间的变化而发生变化,节点和边的影响力是一个动态变化的过程。Girvan等[6]也对介质结构中节点和边影响力测量方法进行了分析和总结。

(二)基于用户行为的评价模型

用户所能发生的行为与所应用的网络拓扑结构直接相关,确定社交网络拓扑结构,是用户行为评价的前提。用户之间的网络拓扑结构形成是用户行为活动的结果,在形成过程中,用户个体的行为、个体与个体的交互行为、个体与群体的交互行为是行为表现的主要方式,它们都与介质的特性具有很大的关系,如Blog用户在Blog空间中的行为只能有留言、评论等,但并没有进行点赞,而Facebook用户可以发生点赞的行为。Xiang[7]在用户之间有更强的关系、一定类型的交互行为有更大概率发生的基础上,把用户行为的测量转化为对用户关系和用户留言板贴文动作的统计。利用联合概率和EM(Expectation Maximization)算法,通过学习模型参数,评估用户之间的关系强度。Amit[8]等把用户发起行为的原因归结于用户或家人影响、外部事件影响、自身是活跃用户三个方面,通过对用户受影响的行为数量和用户所有的行为数量的比值来计算用户的影响力。Tomoharu[9]研究了用户采用事件触发行为受先前事件的影响,设计了强度函数,模型化用户u在时间t采用条目i受用户 在时间 采用条目i的影响,与Kazumi[10]CTIC算法采用了最大似然模型化用户影响力、排序用户影响力,EM求解一样,迭代及计算时间复杂度高,并不适用于实时大规模网络计算。

上述用户影响力的传播与社交网络拓扑结构所联系的领域紧密耦合,它们在用户行为特征、拓扑结构、时间特性方面的都有很大的不同,其中用户行为在不同的拓扑结构其产生的社会影响力也仅限于特定领域,但所有的社交网络平台都具有网络的基本特性,具有用户(顶点)和链接关系(边),所以用户行为的影响力测量、预测潜在都是是基于特定社交网络平台、面向特定领域的影响力的测量及预测。用户行为测量与基于介质结构的影响力测量使用特征更多,精度相对较高,但从模型采用的数据可以看出,用户行为获取及应用(限于用户隐私保护,必须数字化处理)有着较大的局限性。

(三)基于信息扩散效果的评价模型

最大化信息扩散的效果、获取信息传播中自发形成的群体以及对信息快速传播起关键作用的人物,是信息扩散影响力测量的主要问题,针对它们的测量模型有影响力最大化、社区影响力、意见领袖发现三个类别。影响力最大化测量研究起源于市场决策、商业管理,主要以新产品的用户口碑营销、病毒式市场营销应用为主。

影响力最大化测量模型的首要关键是初始种子用户的优化选择问题。在信息传播的初期,假设所有的用户都处于非活动状态,初始种子用户的选择,最简单的测量方法是启发式模型,通过节点的度中心性、节点间最短距离或度折扣方法计算节点的影响力,方法简单但在实际社交网络中节点影响力与启发式测量方法具有较大的偏差。为了准确度量种子节点,Kempe[11]把选择影响力种子用户的问题转化为离散优化问题。通过线性阈值模型和独立级联模型,来促进信息的传播,但其缺陷是种子节点的选择评估处理运行时间长。此外,模型中的阈值受许多因素影响,对行为聚合结果有影响。

预测影响力模型与的线性影响力模型、独立级联模型、共享级联泊松处理(SCPP)等相比较,有独立性的假设,但在社交网络影响力传播过程中,用户的行为通常受周围用户的行为影响,所以独立假设实践中并不存在。

四总结及展望

由于社交网络结构本身具有异质性、复杂性、多变性等特点,在实际环境中,它并不是单一的、静态、固化的结构,借助社交网络用户散播信息、营销商品、追踪热点话题、发起活动、挖掘关系、人肉搜索,它已经成为影响力扩散的触角,深入和改变着用户的行为模式。本文通过社交网络信息传播影响力的起源、传播影响的因素、影响力评价模型分析,提出了影响力传播过程模型,在此基础上,梳理了现有的社交影响力传播模型,但同时也发现基于不同社交网络的信息传播影响力评价模型不尽相同,即使同一评价方法,也不一定适用于跨社交网络的影响力测量和评价,并没有统一的结构或标准来进行转化。因而,造成目前的大多细粒度精准模型基本都与网络拓扑结构紧耦合,如何实现不同社交网络的信息特征融合,影响力的跨网络评价将是下一步的工作。

参考文献:

[1]E Bakshy,I Rosenn,C Marlow,et al.The role of social networks in information diffusion[J].The International Conference of World Wide Web,2012.

[2]Y Jessie.A survey on influence analysis in social networks[J].Patterns of Influence: Local and Cosmopolitan,2011.

[3]R S Burt.Struturalholes:The social structure of competition[M]. Cambridge:Harvard University Press,1992.

[4]P Michel,C Michel.Survey on social community detection.Social Media Retrieval[M].Springer,2013.

[5]M Alan,M Masimiliano,G Krishna P. Measurement and analysis of online social networks[J].IMC’07,2007.

[6]M Girvan,M E J Newman.Community structure in social and biological networks[J].Proceedings of the National Academy of Science of the United States of American,2002,(12).

[7]R Xiang,J Neville,M Rogati. Modeling relationship strength in online social networks[J].In Proceeding of the 19th international conference on World Wide Web,2010.

[8]A Goyal,F Bonchi,L V Lakshmanan.Learning influence probabilities in social networks[J].In Proceedings of the 3st ACM International Conference on Web Search and Data Mining,2010.

[9]I Tomoharu,S Arnar,G Zoubin. Discovery latent influence in online social activities via shared cascade poissonprocesses[J].KDD’13,2013.

[10]S Kazumi,K Masahiro,O Kouzou,et al. Learning continuous-time information diffusion model for social beahaviors data analysis[J]. Proceeding ACML '09 Proceedings of the 1st Asian Conference on Machine Learning: Advances in Machine Learning,2009.

[11]D Kempe,J M.Kleinberg,E Tardos.Maximizing the spread of influence through a social network[J].KDD’03,2003.

(责任编校:余中华)

Survey on Influence Propagation Based on Information Diffusion through Online Social Network

WU JianJun

(Department of Computer, Beijing College of Politics and Law, Beijing 102628, China)

Abstract:Recently,social network service has become very popular by providing and sharing real-time information contributed towards various factors that are related to propagation media,information spreader,diffusion patterns,etc.A number of research efforts have been made for information diffusion modeling and influential spreaders identification. In this paper,we address the problem of information diffusion methods and propose a taxonomy that summarizes the state-of-the-art. Our comparisons show interesting and userful findings for researchers, offering future possible improvments channel or guiding principles.

Key Words:social network; information disseminate; propagation media;media analysis

收稿日期:2016-01-15

基金项目:北京政法职业学院课题“基于社交网络的舆情分析技术研究”,编号:KYZX201404。

作者简介:毋建军(1977— ),男,山西河津人,北京政法职业学院信息技术系讲师,硕士。 研究方向:社交网络。

中图分类号:G206

文献标识码:A

文章编号:1008-4681(2016)03-0119-03

猜你喜欢

社交网络信息传播
浅析人民网《图解新闻》栏目的信息传播实践
大数据时代社交网络个人信息安全问题研究
社交网络中的隐私关注及隐私保护研究综述
社交网络自拍文化的心理解读
网络舆论对公共政策制定的影响
媒介融合背景下对新闻记者素质的要求
如何进行突发事件中的舆情引导