APP下载

在线数字内容传播过程中社会影响作用的度量研究

2018-03-02刘臣安咏雪韩林

软件 2017年9期
关键词:变异系数社会影响易感性

刘臣+安咏雪+韩林

摘要:社会影响在数字内容的扩散中起着重要作用,从社会认知角度来看,认为社会影响源于个体对数字内容的认知不确定性,且不确定性越大社会影响的作用越强。在社会化媒体中,用户的评分是衡量扩散内容质量的重要工具,本文利用全体用户对内容评分的分散程度来代替个体的认知不确定性,衡量分散程度用变异系数指标。对Movielens数据集进行分析,结果表明,用户认知不确定性在扩散过程中有明显作用。在电影数据中,男性社会影响高于女性,中年人群的社会影响高于其他年龄段,农民的易感性高于其他职业。

关键词:社会影响;易感性;认知不确定; 变异系数

引言

互联网的出现改变了人们表达观点以及与他人交际的方式,随着Web2.0技术和网络信息技术的高速发展,社交网络蓬勃发展,用户规模与日俱增。根据中国互联网络信息中心(CNNIC)统计,截至2016年6月,中国网民规模达7.10亿,上半年新增网民2132万人,增长率为3.1%。我国互联网普及率达到51.7%,与2015年底相比提高1.3个百分点,超过全球平均水平3.1个百分点,超过亚洲平均水平8.1个百分点。网民通过社交网络沟通交流、分享信息,社交网络已成为覆盖用户最广、传播影响最大、商业价值最高的业务。社交网络成为人们日常交流、获取信息、发表观点的主要渠道和方式。社交网络用户规模的迅速壮大,为电子商务的快速发展奠定了潜在的用户群。在社交网络中,用户可以随时随地发布和获取信息,人们不再只是被动的信息接受者,同时还能积极参与到信息的传播过程之中,成为信息的发布者、分享者和传播者,变为网络内容的主要制造者。互联网已经成为人们表达观点、获取信息的重要途径。这种新型、灵活、快捷的交互模式为用户带来了海量信息,改变了信息的传播模式。用户通过社交网络的口碑相传和分享,直接影响了消费者的购买决策,利用趋众心理,最终带来消费者的直接购买行为。

社会化媒体是一类基于Web2.0思想和技术的互联网应用,它允许人们进行高度的交互,如创建、分析、交换数字内容等,对人类社会带来了普遍的、本质的影响。社会化媒体的实际形式包括微博和博客、社交网络站点(SNS)、虚拟社区、内容(视频、音乐等)分享站点、协作内容生产(如维基百科)等多种类型,但是他们之间的界限越来越模糊,功能越来越综合,成为一类重要的数字内容交互平台。人们可以在交易网站、论坛和博客上写下大量他们的评分和观点,消费者在购买产品或者服务前,通常会阅读与产品或服务相关的评价以对要购买的产品有一个粗略的认知,再来决定是否购买。通常这种影响是显著的,对潜在消费者有比较显著的影响,这种作用被称为社会影响。

社会影响是一个复杂的概念,维基百科将其描述为:当一个人的情感、观念或行为受到他人影响的时候,社会影响就出现了。社会影响分为信息性影响和规范性影响两类。信息性影响是指把他人是为指导行为的信息来源时的影响,规范性影响是指为获得他人的喜爱和接纳而从众时的影响。Godes等(2005)从营销的角度将社会影响定义为一种行为,由没有主动参与到产品或服务的销售中的个体所采取,且对其他人对产品或服务的期望造成影响。早期研究认为社会影响的作用主要源于个体对他人造成的影响力。社会影响在扩散过程中的作用建立在“影响者假设”( The Influentials Hypothesis)的基础上,即某些个体比其他个体更具影响力,他们在扩散过程中战友主导地位,也被称为意见领袖。但是Watts和Dodds( 2007)对影响着假设提出了质疑,他们的研究表明大规模的扩散不是由影响力驱动的,个体对数字内容的易感性更重要,而且易感者对其他易感者产生的影响在传播中占主导地位。更具说服力的是影响力和易感性共同作用的综合观点。Iyengar等(2011)观察到了社会影响和易感性( Suceptibility)在新产品扩散中的共同作用。Aral和Walker则通过实验研究,表明扩散过程由影响力和易感性共同决定,并将这种作用称为二元影响( Dyadic Influence),此外,这种双重作用机制表明受到来自作用者、被作用者的多种外生因素,例如性别、年龄、婚姻状况等影响。

综上所述,社会影响在数字内容扩散过程中起着重要的驱动作用,甚至从某种程度上决定着个体何时采纳何种内容。而要研究社会影响对扩散过程的驱动作用,就需要从社会影响对个体间的相互作用,扩展到个体对扩散内容认知的更深层次。但影响力与易感性很难通过具体的数据进行衡量,我们从社会认知的角度研究这种机制,认为社会影响源于个体对数字内容的认知不确定性,且不确定程度越大社会影响的作用越强。提出一种新的指标:认知不确定性,用认知不确定性来指代个体对数字内容认知不确定性,作为社会影响中的指标。

1 认知不确定性

1.1 认知不确定性概念

由社会影响驱动的社会化媒体数字内容扩散中,个体对来自他人的数字内容的易感性,源于对数字内容认知的不确定性。这是因为由于在线网络购物的发展,越来越多的人在线进行交易,由于是线上交易,用户不能精确地确定一件商品所能够带来的效用,或者确定一条消息的真实性。而在这种情况下,每个人都会受到来自于好友的影响,会由于好友购买某件商品而去关注甚至购买,也会因为别人相信了谣言而去相信他。因此,我们认为个体对数字内容产生的易感性源于对数字内容认知的价值不确定性或事实不确定性,而且不确定性程度越大表明个体越需要依赖于别人的行为来做出决策。

在社會化媒体中,用户对数字内容认知的不确定性有两种:价值的不确定性和事实的不确定性。价值的不确定性是指用户对数字内容能够带来多大的效用是不确定的,例如音乐、视频、商品信息等。事实的不确定性是指用户对数字内容中所包含的信息的正确性或真实性是不确定的,例如谣言、突发事件信息等。但是一般情况下两种不确定性总是并存的,几乎不可能相互区分开来,而且不论哪一种不确定性都是难以直接进行衡量的。因此,我们采用一种替代的方法对用户的不确定性进行度量。endprint

在社会化媒体中,用户的评分是衡量扩散内容质量的重要工具。特别是在各种个性化的信息推荐系统中,评分起着更重要、更客观的作用。随着互联网和信息技术的发展,在线评论和评分已经成为消费者获取产品信息的重要来源。其中,来自DoubleClick.com的调查指出,50%以上的消费者在消费前会使用搜素引擎搜索以往消费者对商品的评价信息。艾瑞咨询年月的网络调研也表明,81.8%的观众会通过互联网获取电影相关信息。由此可见,在线评论对消除消费者的不确定性,辅助其制定购买决策具有重要作用。

用户在在线系统上对商品进行打分评论,可以看作用户对商品认知的一个反馈过程,而评分则是消费者对商品认知的反馈的表现工具。综合考虑在线评论系统的实际情况,现有的评论系统多为“评分+评语”的模式,评分多采用1~5分的评分制。评分作为用户对商品整体的一个认知反馈,随着商品使用用户的增多,评分数据也逐渐增多,评分也会出现分散或集中的情况,而越集中则说明用户对商品的认知愈是统一。因此我们拟利用全体用户对内容评分的分散程度来替代个体认知的不确定性。打分的分散程度我们采用变异系数指标来衡量,由此得到的认知不确定性涵盖了两种了类型的不确定性。

1.2认知不确定性的衡量

变异系数又称“标准差率”,是衡量样本中各观测值的变异程度的指标,没有单位,其大小同时受平均数与标准差的影响,在比较两个或两个样本变异程度时,变异系数不受平均数与标准差大小的限制。变异系数是以相对数形式表示的变异指标。它是通过变异指标中的全距、平均差或标准差与平均指标对比得到的。变异系数可表示为标准偏差和平均值的比值,即:

使用变异系数作为衡量用户认知不确定的指标,是因为变异系数的最大优点在于它具有直观简洁的形式,容易由样本直接得到估计值。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。在分析数据时,有相同的結果出现时,就可以排除掉该原因。

对数据计算其分散程度时,采用计算如公式(1)(2)(3)所示:其中,MNx表示数据的平均值,SDx表示数据的标准差。

2研究方法

2.1实验数据

本研究选取电影为研究对象,主要由于电影为经验型产品,用户消费决策更多依赖在线评分。Nelson(1974爝产品分为两类:搜寻型产品和经验型产品。搜寻型产品的全面完整的信息可以在购买前获得;经验型产品的信息只有在购买使用后才可以获得,或者其信息的获得比搜寻型产品更难,需要花费很大的精力。Huang等学者在2009年提出网上零售企业可以通过开放评论功能或提供其他消费者的评论信息,增加阅读者停留在网页的时间,进而提升经验型产品购买意愿,Bae和Lee证实在购买经验型产品(比如电影)时,独立评论网站的消费者评论可靠性要高于来自企业开放的评论平台的信息,而购买搜索型产品(比如数码相机)时,结论相反。

研究所需要的数据来自 MovieLens(http://www.grouplens.org/)的数据集。MovieLens是历史最悠久的推荐系统。它由美国Minnesota大学计算机科学与工程学院的GroupLens项目组创办,是一个非商业性质的、以研究为目的的实验性站点。该数据集是由GroupLens Research采集的从20世纪90年末到21世纪初由MovieLens用户提供的电影评分数据。这些数据中包括电影评分、电影元数据(风格类型和年代)以及关于用户的人口统计学数据(年龄、邮编、性别和职业等)。我们使用的数据集共包含6040位MovieLens用户对3900部电影的1000209条评分数据。用户属性如表1所示。

电影属性如表2所示。

2.2实验结果

利用上述公式计算得到性别属性下的用户不确定性,以女性认知不确定性作为基准,结果如图1所示。横坐标表示电影类型,纵坐标表示数据的变异系数,即用户的认知不确定性。

从图中可以看出性别属性下,用户对商品的认知不确定性随横坐标上的电影类型变化整体是呈上升趋势的。性别属性对用户的认知不确定性的影响在某些类型电影中具有明显的作用,男性用户的认知不确定性整体是高于女性,而无论男性还是女性在所有类型电影中对纪录片、黑色电影和战争片的认知不确定性是最低的三类,但是在纪录片和黑色电影类型中女性的认知不确定性是高于男性的,分析原因在这两种带有纪传性质电影中女性用户更容易受到片中含有的情感关系所感动,造成女性用户对这两种类型电影的评分出现波动性变化,从而出现女性用户的认知不确定性在这两种类型电影中高于男性。女性用户和男性用户对犯罪片、剧情片和战争片的认知不确定性相对一致。

利用公式(1)(2)(3)计算得到年龄属性下的认知不确定性趋势图,以18岁以下的用户的认知不确定性为基准,得到结果如图2所示。

从图中曲线变化的趋势可以看出年龄在18到49岁之间的用户对各种类型电影的认知不确定性曲线具有比较一致的变化趋势;50岁以上的用户认知不确定性曲线变化趋势比较相符。18岁以下的用户的认知不确定性明显低于其他年龄段,分析其原因可能是18岁以下的评分用户数量较少,造成评分的集中程度较高,用户认知不确定性低于其他年龄段。在科幻片电影类型上45到49岁之间的用户认知不确定性明显高于其他年龄段。年龄属性下对各类型电影用户的认知不确定性最低的是黑色电影,最高为魔幻电影。

利用公式(1)(2)(3)计算得到职业属性下的认知不确定性趋势图,以其他职业或未标明职业的用户的认知不确定性为基准,得到结果如图3所示。

从图中各职业认知不确定性曲线的变化趋势可以看出商人或匠人和失业人群的认知不确定性波动频率明显高于其他职业人群。而农民的认知不确定性的波荡幅度明显高于其他职业人群,对纪录片的认知不确定性最低,对犯罪电影、冒险片及魔幻电影认知不确定性最高,分析原因可能因为数据集中该职业人群的数量较少,造成数据的集中或分散,而产生曲线波动幅度比较大。如图3所示主妇的认知不确定性与其他职业人群的认知不确定性曲线的整体呈上升的变化趋势相比有一个明显的下滑趋势。纵观各职业的认知不确定曲线可以看出,职业间没有一个明显的偏向性。

3 结论

本文从社会认知的角度研究社会影响的作用机制。提出个体对来自他人的数字内容的易感性源于对数字内容的认知不确定性,而且不确定性程度越大社会影响的作用就越强的假设,引入一个指标变异系数来衡量认知不确定性。首先对电影数据集进行属性分类。根据数据的结构形式,对数据集进行了三种属性分类,分别为性别、年龄和职业。其次,以各类型电影为基础,对分类后数据计算认知不确定性。最后,通过属性间认知不确定性的比对,研究属性在数字内容扩散中产生的影响。

实验结果表明,性别属性的影响主要表现在:男性用户不确定性程度整体高于女性,在扩散过程中的男性的社会影响高于女性。年龄属性的影响主要体现在:25-49岁间的用户社会影响大于其他年龄段的用户。职业属性的影响主要表现在:农民的易感性明显高于其他职业类型,在信息扩散过程中更容易受到他人的影响。endprint

猜你喜欢

变异系数社会影响易感性
NRG1-ErbB4基因多态性与局灶性癫痫易感性的关系
从莎士比亚笔下看文艺复兴时期的女性形象
中国区域经济发展差异研究
CD14启动子-260C/T基因多态性与胃癌易感性的Meta分析
α1抗胰蛋白酶基因多态性与肺癌易感性的研究
TLR9和VDR基因多态性与结核病易感性的相关性分析