APP下载

大数据时代的社会网络研究

2019-08-20

中国经贸导刊 2019年19期
关键词:节点研究

时间:2019年5月16日

地点:国宏大厦

主题:大数据时代的社会网络研究

主讲人:郑路 清华大学社会与金融研究中心主任、美国德克萨斯AIM大学社会学兼职教授

主持人:罗蓉 中国宏观经济研究院科研部副主任

点评专家:

杨宜勇 中国宏观经济研究院社会发展研究所所长

向 佳 国家发改委规划司经济结构处

参会嘉宾:来自中国宏观经济研究院、交通大学、北京师范大学等的研究人员

罗蓉:欢迎大家来到第三期国宏学术茶座,今天的主题是大数据时代的社会网络研究。社会网络是社会学重要内容,研究人与人之间的互动关系和社交模式。社会网络不仅能够解释社会行为,也能够解释我们身边的一些经济行为和方式。在大数据时代,人们的社交模式正在发生巨大变化,社会网络也呈现出一些新的特征。大数据时代社会网络研究在社会学、经济学中有了更为深刻的内涵和意义。今天请来清华大学社会学系的郑路博士做茶主,讲解大数据背景下的社会网络研究。郑路博士是社会学专家,有海外留学和任教的经历,毕业于美国斯坦福大学,现任清华大学社会与金融研究中心主任,也是美国德克萨斯AIM大学社会学的兼职教授。

今天请来的两位点评专家,一位是享受国务院政府津贴、资深社会学家杨宜勇研究员,他对社会保障、收入分配、劳动就业、老龄化都有比较深入的研究。另外一位是国家发改委规划司经济结构处的向佳博士。首先有请茶主郑路博士演讲大数据时代的社会网络研究。

郑路:谢谢邀请和罗老师的介绍。我今天的讲座从最基本的概念讲起,然后再介绍社会网络研究里一些比较重要的发现。

一、什么是社会网络?

网络是由节点和它们之间由于互动关系产生的连接所组成。节点可以是行动者、个人、组织、城市、国家,在生物网络研究里可以是神经元,在科学学研究里可以是论文。我们可以研究论文的合作网络和引用网络,在探索创新网络时,我们则非常关注专利的引用网络研究。

节点之间的相互关系和相互影响是社会网络研究的重点。如果节点是个人,我们会研究社交网络、讨论网络,甚至是过新年时中国比较有特色的拜年网络。网络还包括物理网络,比如互联网、道路网、高铁网、电网等。除了网络的形成和结构特征,我们还研究事物在网络里的传播,比如病毒的传播和刚才提到的专利引用。

社会网络分析就是关注节点间的互动结构。近年网络研究非常受到重视是因为很多问题都开始从复杂系统的视角来研究,不管是社会问题还是经济问题,包括金融危机,甚至人工智能,很多复杂系统都可以用网络的方式来呈现,用网络进行分析成为研究这些问题很重要的工具。我在讲这门课的时候,就把整个体系分成网络思维、节点的研究、节点和节点之间连接的研究和怎样描述一个网络的总体特征来讲解。在很多现象里我们观察网络动态机制,比如研究病毒是怎样传播的,一些健康的行为、好的观念怎样通过网络传播,这也是网络动态机制研究里最多的话题。

二、什么是网络思维?

网络思维可以分成三点,第一点,很多传统的学科研究都是关注节点的属性,而往往忽视节点和节点之间的联系,或者人与人之间的影响。经济学几乎把人看成是原子化的,追求最大利益的个体。实际上我们发现,人们99%的行为都受到周围人的影响,不管是营销学还是移动互联网都可以用个人网络数据做出精准的预测,这也是网络所产生的最大价值。比起以前所关注的個人的人口属性特征,例如年龄、性别、收入等,现在更加关注节点之间的相互影响、和谁产生连接对个人的影响。

第二点,我们每一个人的行为,不仅受到周围人的影响,而且会受到网络整体的形态和特征的影响。网络里面的连接是紧密还是疏松,我们处在网络中心还是边缘,都会对我们的行为产生影响。

第三点,我们发现网络和网络之间的竞争其实是动态网络的节点之间相互协作的结果,以及是否能够判断出对方网络里所存在的缺点,从而调动起网络的优势。很多商业性的竞争其实就是平台的竞争,这里面涉及到大数据的分析、二模网络的分析,例如商品和人之间建立起来的关系,这里边有很大的应用潜力和商业价值。

三、网络分析的几个应用

下面举几个网络研究的例子。互联网对人们的思维及对问题的关注度产生了重大的影响。当互联网刚刚产生时,我们认为这是一个非常开放的空间,能够让我们以非常便捷的方式接触到各种各样的新内容。因此,互联网的产生会让我们变得更加包容,更加多元化,不同意见、不同内容都可以关注到。近些年的发展让大家意识到互联网还有另外一个作用,就是能让我们非常容易的找到和我们政治意见、价值观相同的人,很容易找到我们希望看到的内容,所以出现了所谓的“信息茧房”。人们发现互联网可能让人的视野变得越来越狭窄,比如新闻客户端使用的推荐系统里,你喜欢读什么就给你推荐什么,这也有不好的效果。大家使用推荐系统越多,所看到内容的多样性就越少,关注的内容也越少,久而久之大家接触到的内容越来越单调,但使用这个平台的时间也会相应缩短。

我们也可以研究国际贸易和国际关系网络,比如以中国为关注点,可以看到中国这个节点在国际贸易网络里面是怎样慢慢地从边缘移动到中心的位置。在WTO成立以后,整个世界贸易网络的密度不断的增加,节点和节点之间的连接强度也在不断的增加。同时也可以看到,各国在国际贸易网络的位置与该国在国际关系或者国际政治里面的发言权、地位之间存在着一定的相关关系。

我们还可以用网络研究解释城市的兴起,对很多城市兴衰的研究都发现城市和它在贸易地图里的位置呈非常重要的相关性。城市的发展,取决于它在城市所构成的各种网络中的位置,比如一个城市在高铁网络里占的位置对其经济发展就会产生深远影响。在新经济时代,一个城市的发展与其在创新网络,例如在专利引用网络里的地位密切相关。

社会网络分析在很多领域都受到重视,并改变了传统思维,比如以往公共卫生和公共健康研究人员认为当传染病突然到来的时候,如果资源有限,只能把疫苗给少数一部分人,通常我们就会先保护老人和小孩,给他们注射疫苗,防止病毒传染。但是社会网络分析发现,如果要想更有效的防止疾病扩散,实际上是要把社交网络中最活跃的人先控制起来,把疫苗最先给他们是更有效的办法。

在研究孤独感是怎样在网络里传播、孤独的人是怎样在网络里聚集时,可以看到,孤独人群往往在社会网络里处于比较边缘的位置。从心理健康学角度出发,要改变一些人的抑郁症,改变其孤独感和精神不健康的状况,可以改变他们在社会网络里的位置,通过改善他们和人的交往来改善其心理健康。

四、小世界现象

世界上的人相互之间都有关联,但是人和人的距离到底有多远,陌生人通过多少次熟人介绍才会产生联系。这个问题一直困扰着很多社会学家、心理学家。1967年,第一次对这个问题进行探索的哈佛大学心理学教授米尔格莱姆,做了关于小世界研究的实验,一个住在内布拉斯加州的人给住在马塞诸塞州的某陌生人寄信,这封信需要在人与人之间传递多少次才能收到。结果显示,平均路径长度就是6,转了五个中间人后信被目标人收到。后来被演绎为六度分隔理论,即世界上任意两个人之间相隔五个人。世界上人和人之间的距离比想象的要短,社会是一个相互之间比较紧密的小世界。

大数据的出现对网络研究是一次革命,因为以前研究的都是小群体,现在可以提供由几百万人、几千万人、几十亿人构成的网络来检验之前的假想。到2006年的时候,因为有了微软即时通信软件MSN,可以用全网络图计算出用户之间的平均距离,算出来是6.6,中位数是7,佐证了六度分隔理论。后来发现,社交媒体出现以后,把人们的距离更加缩小了,以前传统的线下社会交往里,不管是强关系还是弱关系,每一个人所能联系的好友,可能是100人、150人,现在打开朋友圈可能有1000人甚至更多。脸书2011年发布的数据显示,其用户之间平均距离是4.74。而推特的这一数字是4.67。人与人之间从六度分隔下降为四度分隔。

研究者们从什么样的角度来解释小世界现象?研究者发现只要在规则网络中随意增加一些连接,就可以极大地缩短网络中节点之间的平均距离。从最规则的网络到随机网络,小世界现象就处在两者之间。我们这个世界上存在很多小圈子,人和人之间联系非常紧密,但是小圈子之间会有一些桥,把小圈子之间的距离缩的非常短,所以才会存在小世界现象。1999年“科学”杂志关于幂律分布发现显示,节点之间出现连接的概率如果是随机的话,节点的中心度,也就是节点和其它节点连接的数量,就会出现正态分布,但实际上我们在网络里面观察到的分布是幂律分布,比如,极少数的节点吸引了大部分的粉丝,城市的人口分布、财富、声望等,其实都是遵循幂律分布。

小世界现象,以及无尺度网络是怎么产生的呢?是因为网络里面存在一些超级节点,在整个网络的演进过程里,当有新节点加进来,它们会优先连接那些本身受欢迎的节点。这导致两极分化,即穷者越穷、富者越富的现象。在联系日益密切的当今世界里,很多现象都出现网络效应,以前我们认为很多社会现象符合正态分布,但在网络世界,更容易出现的是幂律分布。

五、网络影响

下面讲网络的影响力,有一本书叫做《大连接》,是哈佛大学和加州大学圣地亚哥分校两个跨学科的学者合作的,包括政治观点、精神健康、快乐程度、肥胖程度、体重等现象是怎样在网络中传播的。这些研究表明,我们每个人在网络里不仅受到直接相连的节点的影响,还会受到朋友的朋友的朋友,也就是三度之外的节点的影响,这在统计上都是显著的,而距离更远的那些节点可能会有影响,但是在统计上不显著。对上述不同现象的研究都发现,影响可以来自或达到三度以内的节点。

六、连接的强弱

刚才讲网络节点间的距离,网络的影响,接下来谈一谈连接之间的关系强度。连接有强连接和弱连接,强连接是与父母、最好朋友之间的联系,频率非常高,信任程度非常高,互惠程度非常高。弱连接一般就是认识的熟人,平时不怎么来往。强关系和弱关系的研究被引用最多的是上世纪60年代末,格兰诺维特的研究成果。他的研究结果和我们的常识不太一样,我们一般认为找工作时父母、亲朋好友肯定是最愿意帮助我们的,通过他们找到的工作应该是最好的。但格兰诺维特的研究表明强关系并不能给我们带来好工作,而平時不怎么交往的人,没有那么强关系的人反而能够给我们带来好工作。其中的原因,就是弱关系传递的是非冗余的信息。因为强关系的人和我们朝夕相处,处在同样的社会圈子里,而弱关系的人往往和我们处在不同的生活圈、来自不同社会阶层、不同领域,所以他们带来的信息可能是我们平时接触不到的,反而对我们找工作更有帮助。

对于企业来说,强关系和弱关系需要平衡,从强关系那获得的是信任、情感支持,还有在最危机的时候,能够获得无私的帮助。而弱关系带来的是有用的新鲜信息。

你也许会问,互联网对强关系和弱关系有什么样的影响,有了社交平台以后,我们可以维持的关系是否就可以变得很多呢?既然强弱关系这么有用,在数量上有没有什么边界?研究发现,我们通过互联网和社交平台能维持的弱关系确实增加了,但是维持强关系的成本非常高,需要花费很多时间和精力才能与他人进行高频率、感情投入很多的强关系的互动。因此,不管是有50个、150个或者500个朋友的人,能够真正保持双向的强关系的朋友,也就在个位数。

以往我们和他人保持联系,都要面对面的交往,所维持的人际关系数量是有限的,现在有了社交平台以后,我们可以把面对面的交往变成线上交往,其中很多弱关系变成潜伏的关系,一旦发生重大的事件,又能把潜伏的网络激活,信息一下子会在网络里面扩散开,在需要帮助的时候,大家就可以伸出援助之手。

最后讲一下结构洞。在网络里面有的群体之间可能没有联系,在他们之间有一个黑洞,黑洞的位置里如果出现一个节点,把他们联系起来了,我们就可以说这个节点占据了结构洞的位置。一个节点处在结构洞的位置时会给他带来很多优势,包括信息优势、创新优势、控制优势。所以对于公司中层经理的网络分析发现,提升得快的节点,往往都是跨部门的那些人,或者连接所属组织和外界其它组织的人。因为他处在边界的位置,可以从不同的部门获得各种各样新信息,让他学会怎样利用这些信息,以及平衡不同群体对他提出来的不同要求。

结构洞有信息的优势,可以把从不同领域得到新的知识以一种全新的方式进行组合,进行创新。现在最重要的科学发现往往都是跨领域的,常常是把不同领域已经存在的一些要素以一种全新的方式进行重新组合,或者把一个领域里面比较成熟的方法论运用到新的领域,推动另一个领域革命性发展。因此,一个含有丰富结构洞的人,可以通过控制不同群体间的信息交流、物质交换、资源交换等为自己牟利。在国外有很多做社会网络咨询的公司,专门为企业做这样的分析。

最后谈一下连接的同质性和异质性。人都有这样的自然倾向,就是发生社会交往的时候,我们会寻找相似的人建立连接。实际上不管从事科研还是创业,如果能拥抱多样性、异质性,都有更大的好处。不管生活还是工作中,大家都要有意识地突破同质性接连的自然倾向,建立更多的异质性、多样性关系。

我刚才还讲到网络世界的幂律分布揭示了富者越富、穷者越穷的现象,这对企图通过制定公共政策来减少收入差距的决策者来说会有一定的启示。对个人来说,由于网络是多重网络,在现有网络里面没有办法和已经是既定利益者、已经是超级节点的人竞争,就应该去寻找其他网络,在有未来前景的网络里找一个位置,成为新的网络超级节点。对每个人来说,成长的过程就是网络跨越的过程,不断的做网络穿越者才能在事业上、社会中发展得越来越好。

罗蓉:郑博士的演讲很精彩,一方面印证了常识性的观点,同时也颠覆了一些平常的认识。下面请杨所长做点评。

杨宜勇:这个报告让我们学到了很多知识点,学术性非常强。一是关于网络节点、节点行为、整体的结构性特征方面。二是关于非常独特的小世界现象。三是关于弱关系的强度。四是特别强调了结构洞、结构洞的三个优势,越是扭曲的地方强度越高,成为结构重要的支撑。五是关于社会网络对社会结构的影响。六是幂律分布使得两级分化越来越严重,而且幂律分布无法改变。

郑教授的报告让我们认识到,社会网络是一个非常重要的分析工具,社会学的这个概念在上世纪30年代,上次经济大危机之后就提出来了,上世纪60年代才开始兴盛。我认为从1930—1990年都属于传统数据时代的社会网络,从1990年以后BB机、MSN、QQ、微信等出现后才有资格称之为大数据时代的网络。社会网络自身构造在发生变化,社会网络分析的手段也必然发生变化。

大数据的发展无疑助推了社会网络的发展,更加有利于社会网络的研究,然而网络与现实不是决然隔離的,网络上所有现象都是现实社会真实的反映,比如网络大咖在现实中有影响力,网络空间中自然而然也有影响力。信息网络和技术网络中,能力强的人使用网络可以发展的更好,能力弱的人用网络发展是有限的。

社会网络的发展与交通革命、信息革命和生物革命截然不可分。比如随着生物技术革命和技术的发展,人和机器人的边界会变得越来越模糊,社会网络的发展,除了自身革命性的因素,还要以其他发展为前提。

最后我提两个专业内的问题,一是你对百度排名收费怎么看;二是校园贷对于没有信用、没有偿还能力的人,你认为有什么更好的解决办法。

罗蓉:下面请向佳博士点评。

向佳:郑教授的讲座让我收获很大,我想结合目前的工作请教几个问题。

第一个问题,政府部门提出的政策在社会中会因为社会群体之间的网络互动行为而可能会被扭曲,如何能够更好地预测网络对社会政策效果的影响,有没有比较成熟的理论在政策推行过程中更好的应用。

第二个问题,之前说的社会网络、社会互动还相对模糊,有没有一些更精细的模型或者分类,能让我们更深入理解社会网络之间如何互相影响、影响过程怎样、影响机制怎样。

第三个问题,包括脸书等的研究都是基于一些微观数据得出的结论,在针对全国、全世界的宏观层面上,结论是否有普适性,如何连接这两者,对此有没有更好的研究思路?

郑路:杨老师总结的非常好,也有很多引申。关于幂律分布是否能改变,这其实也是经济学界、政府经常讨论的问题,比如对富人,我们应该收遗产税、财产税还是进一步提高其收入税,更重要的其实还是对弱者该采取哪些措施。今后在人工智能等新的技术革命冲击下,总有一部分人要被时代所淘汰,他们在市场竞争里没有办法生存,对于这类个人和家庭,在社会低保方面实行什么样的政策。今后要考虑不是每一个人都能够随着时代一起进步,AI会取代50%的人工之类的情况对这部分人的冲击,这让大家反思未来怎么办。还有一种可能性,人工智能非常发达,可以像机器人一样植入一些芯片,这样省去了很多记忆、学习的过程,并根据需要进行定制化和组合,精确的帮助我们解决生活中各种各样的问题。

百度给我们提供搜索结果。未来,信息中介的定位会变得越来越弱,人工智能个人助理的使用,能帮助我们寻找到最有效的信息,根据个人需求来帮助我们获得相应产品或服务,这可能会让我们和这些大公司之间的关系发生很大的变化。就像电脑实现了个人的计算能力自主化,人工智能被每个人掌控和个性化定制后,也会出现所谓的人工智能的自主化。

关于怎么用金融的工具解决社会问题,这涉及到金融企业价值取向和企业社会责任的问题。金融能实现跨时空的资源配置,年轻人的消费需求可以通过金融手段来实现并提高其生活品质,他们未来的收益能力更大,但在求学和谈婚恋阶段的花费可能更大,这种资源和时间的错配,就可以通过金融工具实现。

校园贷之前有很好的政策改变,最早给学生发贷款是通过学校,后来发现90%的人毕业以后不还了,于是回到生源地发贷款,在老家信用社会和熟人社会里,家长怕丢脸,一下就把大学生贷款的偿还率提高了。这是利用社会网络来提高还付率的例子。但总的来说金融工具还是太少,需要更多的金融工具帮助大家解决生活里遇到的很多问题。

向佳博士的问题都是比较大的问题。关于更精细的模型,比如研究病毒扩散、创新扩散的时候,会考虑到网络里的密度、扩散的物质本身具有的特点会在扩散过程里产生什么样的影响,也会考虑节点本身的特征。不是每一个节点对任何一个新生事物的接受程度都是一样的,它们都有自己的门槛,可以用门槛模型来解释为什么有的事情扩散开了,有的事情没有扩散开,有的产生了,有的没有产生。

讲到网络机制,为什么有的信息产生扭曲,使效果受到影响,很多和网络特征、连接强度相关的研究发现,比如要让大家做起来比较困难,但是又有很多正向效果的行为观念传播开,我们能否做相应行为改变,是和网络里你所处的位置、周围和你产生连接的关系是强关系还是弱关系密切相关。难度比较高的行为改变需要多重的强关系施加影响。感谢二位的点评和问题!

罗蓉:感谢郑教授耐心细致回答了两位专家的提问。郑教授今天给我们讲了很多关于社会网络的概念和国内外的典型案例,我觉得很多社会和经济问题都可以从社会网络视角找到答案,非常感谢郑博士帮助我们打开新的研究视角,深受启发,同时也感谢各位能积极参与今天的话题。

(本刊记者 张振 唐仁敏 整理)

猜你喜欢

节点研究
基于移动汇聚节点和分簇的改进节能路由算法
CAE软件操作小百科(48)
基于点权的混合K-shell关键节点识别方法
车载网络中基于混合地理路由协议
公司研究
谁说小孩不能做研究?
我国FDI和OFDI对CO2排放影响的比较研究
我国FDI和OFDI对CO2排放影响的比较研究
Applications of Deep Mixing to Earthquake Disaster Mitigation
A Thought:What have We Learned from Natural Disasters? Five Years after the Great East Japan Earthquake