APP下载

COVID-19期间国家关系交互网络时空分析研究

2022-02-23瑗,秦昆*,关锋,罗萍,姚睿,漆林,周

地理与地理信息科学 2022年1期
关键词:聚类节点防控

朱 炤 瑗,秦 昆*,关 庆 锋,罗 萍,姚 博 睿,漆 林,周 扬

(1.武汉大学遥感信息工程学院,湖北 武汉 430079;2.中国地质大学(武汉)地理与信息工程学院,湖北 武汉 430074)

0 引言

目前,已有的国际关系网络时空演变研究多基于数年或数十年时间尺度分析国际关系网络的演化特征,较少针对某个突发性事件或某段事件发展时期分析短时间内国际关系网络演变;且在利用复杂网络方法分析国家关系交互网络时,主要利用现有的网络统计指标与方法,较少结合网络节点的空间属性分析网络演化特征。基于此,本文提出一种基于时间序列聚类与空间统计的国家关系交互网络演化模式探测方法。通过构建COVID-19疫情防控期间的国家对抗关系交互网络模型和国家依赖关系交互网络模型,结合时间序列聚类以及空间统计的相关方法分析疫情防控期间国家关系交互网络的统计特征、时序演化模式及其空间分布特征,以期为公共卫生危机事件中的国际关系研究提供参考。

1 实验数据与研究方法

1.1 实验数据获取与处理

GDELT是一个实时监测全球新闻媒体中的新闻并进行分析、编码、储存和发布的新闻数据库[15],事件库中数据共有58个字段,包含对所搜集新闻事件的文本分析结果,如暴乱、抗议、和平呼吁等。为深入研究COVID-19疫情危机对于国际关系的冲击,同时考虑到疫情相关新闻报道的滞后性,本文获取2020年1月-2021年3月的GDELT新闻数据作为实验数据集。利用关键词检索(如pneumonia、NCP、virus等)从GDELT中筛选出研究时段内与疫情相关的190万余条新闻事件数据,选取QuadClass(事件主要类型,包括:1口头合作,2实质合作,3口头冲突,4实质冲突)、GoldsteinScale(事件对国家产生的潜在影响,数值介于-10~10之间)、Actor1_CountryCode(参与者1的国家编码)、Actor2_CountryCode(参与者2的国家编码)共4个字段。

1.2 基于复杂网络挖掘的国际关系分析方法

1.2.1 国家关系交互网络构建方法 本文根据QuadClass字段对标识事件的分类方式,构建国家对抗关系交互网络与国家依赖关系交互网络,分别表示国家间冲突与合作事件的交互关系。若QuadClass字段的数值为3或4,则将其归为对抗交互事件,用于构建国家对抗关系交互网络,表示为GM=(VM,EM,lM,wM);若QuadClass字段的数值为1或2,则将其归为依赖交互事件,用于构建国家依赖关系交互网络,表示为GP=(VP,EP,lP,wP)。其中,点集VM和VP分别表示事件库中与其他国家有对抗和依赖交互关系的国家集合(如果某国家在该阶段不存在冲突或合作交互事件,则网络不包含该国家节点);边集EM和EP分别表示事件库中国家间对抗和依赖交互关系的集合;lM和lP表示节点(本文用FIPS国家代码表示)的标识代码集合,其中每个标识代码元素对应点集VM和VP中唯一的国家节点;wM和wP表示边的权重集合,其中每个元素代表边集EM和EP中对应边的权重值。基于此,本文对国家事件交互网络的权重wM与wP定义如下:对于任意两个节点国家i和j,国家对抗或依赖关系交互网络中连接边的权重wij可表示为某阶段内两个国家间冲突型事件或合作型事件GoldsteinScale字段值(GSk,k为事件编号)的累加,设QM、QP分别为某阶段内国家i与j冲突和合作型事件的数量,则有:

(1)

1.2.2 复杂网络测度指标 复杂网络可理解为由大量节点和节点之间复杂关系组成的、具有高度复杂性的网络[16]。由于国际关系具有不确定性和时序变化随机性,本文基于复杂网络模型和方法构建国家关系交互网络并进行时空特征挖掘与分析。1)平均加权度,为加权度总和与节点数的比值,可反映平均每个节点与其他节点间连接边的强度大小;在国家关系交互网络中,平均加权度可衡量每个国家与其他国家的平均冲突或合作交互程度。2)点度中心性(式(2)),为无向网络中节点度与网络中节点总数的比值,可衡量节点的社会影响力,其值越高,表明该节点的社会影响力越大。

di=deg(i)/N

(2)

式中:di为节点i的点度中心性;deg(i)为与节点i相连接的边数;N为网络中的节点总数。

1.3 国家关系交互网络节点演化模式聚类方法

时间序列聚类是指将任意实值型的有序数据作为一条时间序列,并将其所组成时间序列数据集分割成不同类或簇的过程[17],已被应用于心电图分类[18]、天气状况预测[19]、出行模式识别[20]等诸多领域。本文利用动态时间规整的K-means时间序列聚类算法,提取疫情防控期间具有相似时序演化特征的国家节点进行分析。

图1 DTW算法示意[23]Fig.1 Schematic diagram of DTW algorithm

1.3.2K-means时间序列聚类算法 本文在应用DTW算法度量节点时间序列之间距离的基础上,采用K-means算法对节点时间序列进行聚类,即通过多次静态聚类将时间序列数据划分为不同的聚类簇[24],通过节点间的距离公式将欧氏空间中的n个节点分为K个类别(执行算法前需人为确定K值)。该算法随机选取K个对象作为初始的K个簇的质心,将剩余对象根据距离各质心的距离分配给距离最近的簇,然后不断循环,直至准则函数达到收敛。为确定聚类簇的数目,本文应用“手肘法”,根据误差平方和(SSE)与K值的关系图确定最优K值[25]。

随着人口老龄化的不断加剧,养老问题成为一大难题。我国人口老龄化易呈现家庭小型化、空巢化,养老模式由单一的家庭养老逐步向多样化的社会化养老演变。

1.4 时序聚类的空间分布模式分析方法

利用空间分析模型开展地缘环境空间分析,可挖掘地缘现象及其背后隐藏的空间分布规律、模式与特征[26]。为探索国家节点时序聚类结果的空间分布特征,本文应用连接统计分析方法分别对国家对抗关系交互网络与依赖关系交互网络的6种聚类簇分布进行局部空间自相关计算,观察每种聚类结果是否存在集聚中心以及集聚中心的分布。局部连接统计分析方法支持基于二元变量的聚类簇空间分布模式识别,对于本文的每种聚类结果,每个国家节点的类型分为“属于聚类簇K(简称B(Black))和“不属于聚类簇K(简称W(White)),则相邻两个国家间的连接类型可分为BB、WW和BW 3种。局部BB模式连接统计可以判别属于聚类簇K的国家节点空间分布属于核心聚集或离散效应,识别聚类簇K中各国家节点的聚类中心。对于聚类簇K模式下的国家节点i,其局部BB模式连接统计可定义为[27]:

(3)

式中:wij为二进制空间权值矩阵(用于指定国家i与国家j是否相邻)的元素;xi和xj分别为国家i和j的变量值(当国家属于聚类簇K时,xi取值为1,否则取值为0)。

2 实验与分析

本文构建2020年1月-2021年3月国家对抗关系交互网络与国家依赖关系交互网络,然后对网络的规模特征、统计指标进行分析,探索疫情防控期间各类演化模式中国家节点的时空分布模式,进而揭示地缘政治关系的演化和空间分布特征。

2.1 国家关系交互网络基本特征及演化

本文以月为时间尺度,统计2020年1月-2021年3月国家对抗与依赖关系交互网络的节点数、连接边数和平均加权度的变化,结果如图2所示。

图2 2020年1月-2021年3月国家对抗关系与依赖关系交互网络指标Fig.2 Indexes of international conflict and cooperation interaction networks for each month from Jan 2020 to Mar 2021

2.1.1 网络结构属性度量及演化分析 对于国家关系交互网络,节点数和连接边数分别表示一定阶段内所有国家对抗或依赖交互事件的参与国家数和国家对数量。由图2a和图2b可知,每月与疫情相关的依赖交互事件节点数与连接边数均高于对抗交互事件,说明在疫情防控期间参与实质或口头合作事件的国家一直多于参与实质或口头冲突事件的国家,可见合作仍是各国面对公共卫生危机事件的战略主题。从时间序列上看,2020年1-3月依赖与对抗关系交互网络的国家节点数迅速增加,并在3月达到整个疫情防控期间节点数的最大值,期间疫情形势的转变导致参与疫情相关合作与冲突事件的国家增多;而在3月后,依赖与对抗关系交互网络的节点数逐步下降,且对抗交互网络中节点数的降幅远大于依赖交互网络,说明自2020年3月全球暴发疫情开始,参与冲突事件的国家逐渐减少,而参与合作事件的国家数量保持稳定,可见大部分国家基于控制国内疫情形势的目的倾向于参与国家间的合作事件。对于连接边数的时间序列,依赖与对抗交互网络的连接边数在2020年3月达到最大值后大幅下降,这表明在疫情全球蔓延后发生合作与冲突交互事件的国家对明显减少,疫情的紧张形势没有引发大规模的疫情相关国家合作与冲突事件的发生。

2.1.2 网络统计指标及演化分析 从2020年1月-2021年3月依赖与对抗关系交互网络的平均加权度的整体变化情况(图2c)看,每月依赖关系交互网络节点的平均加权度均大于对抗关系交互网络,这表明在疫情防控期间,国家参与合作事件的影响程度大于参与冲突事件的影响程度。从指标时序变化角度看,依赖与对抗关系交互网络的平均加权度均从2020年1月开始急剧上升,在3月达到最大值,表明在疫情出现全球蔓延趋势时,国家参与合作与冲突事件的影响力迅速提升,公共卫生危机事件的暴发导致国家间行为的影响被放大。而在2020年3月后,随着疫情的进一步蔓延,依赖与对抗关系交互网络的平均加权度出现下降,这表明疫情覆盖范围的扩张并未加剧国家间合作与冲突交互的强度,大部分国家的工作重心转移至控制国内疫情蔓延。

2.2 国家关系交互网络节点演化特征

2.2.1 网络节点特征时间序列聚类数确定 本文整理2020年1月-2021年3月每月国家关系交互网络中国家节点的点度中心性数据,建立月尺度时间序列数据集,数据结构如表1所示。然后利用DTW相似性量化方法进行K-means聚类,得到误差平方和SSE随聚类数K的变化结果(图3,为直观显示,只选取聚类数在50以内的SSE进行可视化)。根据“手肘法”的核心思想,随着聚类数K值的增加,时间序列样本的划分会更精细,每个类别内的聚合程度更高,SSE的值会减小;当K值逐渐逼近真实聚类数时(图3拐点附近),每个类别内聚合程度的优化效果逐渐减弱,SSE的降幅随之下降。在由对抗关系交互网络和依赖关系交互网络生成的时间序列样本中,聚类数可分别确定为6~8和6~9,为便于后期对比,本文将两种交互网络时序数据集的K-means时序聚类数K统一确定为6。

表1 节点的点度中心性时间序列数据结构Table 1 Data structure of the time series of degree centrality for nodes

图3 误差平方和变化Fig.3 Changes of SSE

2.2.2 网络节点特征时间序列演化模式聚类结果分析 为分析依赖与对抗关系交互网络中每个聚类所包含的国家节点的普遍特征,本文根据K-means时间序列聚类算法的计算结果,提取依赖与对抗关系交互网络各聚类中心的点度中心性时间演化序列以分析不同聚类簇的特征,结果如图4所示。

图4 节点的点度中心性时间序列聚类中心Fig.4 Time series clustering centers of degree centrality of nodes

(1)在依赖关系交互网络中,总体聚类效果较明显,不同类别间国家节点的特征差异较大,总体点度中心性由低到高依次为:聚类簇1(C1)、聚类簇6(C6)、聚类簇3(C3)、聚类簇5(C5)、聚类簇2(C2)、聚类簇4(C4)。C1中主要包括苏丹、利比亚、哈萨克斯坦等,疫情防控期间国家节点的点度中心性普遍较低(小于0.1)且基本稳定,表明该聚类簇的国家在疫情防控期间的依赖关系交互网络中处于边缘地位,对合作事件参与度很低;C2中主要包括俄罗斯、英国等,在2020年2月疫情暴发后点度中心性普遍处于0.2~0.6之间,表明该聚类簇内国家在疫情防控期间的依赖关系交互网络中处于较高地位,与较多国家共同参与合作事件;C4中仅有中国和美国,国家节点的点度中心性水平远高于另外5个聚类簇,在2020年2-4月疫情蔓延初期,节点的点度中心性值高于0.8,后期虽呈下降趋势,但仍明显高于其余聚类簇,表明中国和美国在疫情防控期间的依赖关系交互网络中处于核心地位。

(2)在对抗关系交互网络中,C1-C5中国家节点的点度中心性强度分布具有显著的层次特征,由低至高依次为:C1、C4、C5、C2、C3,与C6节点的点度中心性演化趋势存在显著差异。C1中主要包括牙买加、克罗地亚等,疫情防控期间国家的点度中心性水平普遍较低(小于0.1)且未出现大幅变化,这表明上述国家在疫情防控期间的对抗关系交互网络中处于边缘地位,对于冲突事件的参与度很低;C3中仅包括美国、英国,与C1、C2、C4、C5相比,在疫情各阶段C3国家节点的点度中心性水平明显较高,这表明疫情暴发后美国和英国在对抗关系交互网络中的地位迅速提升,在2020年3月疫情全球蔓延后处于核心地位,与绝大部分国家共同参与了冲突事件;C6中仅包括中国,与其余5个聚类簇相比,C6国家节点的点度中心性水平在疫情防控期间的对抗关系交互网络中呈明显下降趋势,尤其是在2020年1-2月疫情初期,C6国家节点在网络中明显处于核心地位,而在3月后开始被C3中的国家节点代替,点度中心性值保持在0.2~0.4,对冲突事件的参与度明显降低。

2.3 国家关系交互网络节点空间分布特征

基于上述依赖与对抗关系交互网络的国家节点聚类结果,本文对疫情防控期间国家关系交互网络中各国家节点演化模式的空间分布特征进行分析。

2.3.1 国家关系交互网络节点时序聚类的可视化分析 首先对依赖与对抗关系交互网络聚类结果进行可视化展示(图5),可见部分聚类簇的空间分布呈现一定的聚集性。依赖与对抗关系交互网络C1中的国家集中分布于非洲地区,表明疫情防控期间非洲地区由于检测手段落后、检测不及时等原因,其确诊病例数和死亡人数相对较低,新闻曝光度低于其他地区。此外,在网络中也存在较分散的聚类簇,如在依赖关系交互网络中的C4和C5以及对抗关系交互网络中的C3-C6,这表明在疫情防控期间,合作事件与冲突事件参与度较高的国家空间分布较分散,而参与度较低的国家往往具有空间聚集特征。

注:基于自然资源部标准地图服务网站下载的审图号为GS(2016)1663号的标准地图制作,底图无修改,下同。

2.3.2 国家关系交互网络节点时序聚类的空间依赖性分析 空间依赖性表现为对象或要素的地理次序或地理位置导致的属性值的相关性。为识别不同演化模式中国家节点的空间分布模式及聚集效应,判断聚类结果在空间分布上是否存在空间依赖性,本文通过对各聚类簇中国家节点局部BB模式连接统计进行计算,识别各聚类簇中国家节点的聚集中心,观察各聚类簇中国家节点的集中分布地区,最终得到疫情防控期间依赖与对抗关系交互网络中各聚类簇下局部BB模式连接统计结果如图6、图7所示(P值表示置信水平),其中,依赖交互网络中的C4、C5不存在局部BB模式下的显著性聚集中心,对抗交互网络中的C3、C4、C5、C6不存在局部BB模式下的显著性聚集中心。结果显示,地理位置对不同演化模式下国家节点的影响程度存在较大差异。其中,依赖关系交互网络C1、C2、C3、C6演化模式与对抗关系交互网络C1、C2演化模式的国家节点在空间分布上均存在显著聚集中心。结合各聚类簇演化模式的特点可以发现,疫情防控期间国家关系交互网络中始终处于边缘地位的国家(即依赖关系交互网络C1与对抗关系交互网络C1)在空间分布上呈现聚集特征,相同演化模式下各国家节点的地理位置分布具有空间依赖性,地理位置因素与此类国家疫情相关外交事件的发生存在显著关联;对于网络中处于核心地位的国家(即依赖关系交互网络C4与对抗关系交互网络C3、C6),其地理位置分布不具备空间依赖性,地理位置因素与该国家发生疫情相关外交事件的关联程度相对较小。

图6 依赖关系交互网络国家节点聚类局部BB模式连接统计计算结果Fig.6 Local connection results of BB pattern of national node clusters in cooperation interaction networks

图7 对抗关系交互网络国家节点聚类局部BB模式连接统计计算结果Fig.7 Local connection results of BB pattern of national node clusters in conflict interaction networks

3 结论与展望

公共卫生与健康是人类发展的核心问题,是社会经济发展的基础。本文利用GDELT数据,对COVID-19疫情防控期间国家关系交互网络进行复杂网络挖掘与节点演化模式的时空分布特征分析,提出一种结合时间序列聚类与空间统计的国家关系交互网络演化模式探测方法,探索疫情防控期间网络中各国家节点的时空分布特征,为国际关系与地缘政治研究提供新的视角。主要研究结论如下:1)COVID-19疫情形势深刻影响着国家关系交互网络的网络规模与结构特征,各国在疫情暴发后更倾向于参与合作类型的国家交互事件。2)基于复杂网络模型对国家节点进行时间序列聚类,可对疫情防控期间节点的点度中心性的时序演化特征进行类别划分,不同时序演化模式总体按照节点的点度中心性强度由高到低分布,验证了时间序列聚类方法在探索网络节点演化模式方面的有效性。3)不同演化模式下的国家节点在空间分布上呈现不同特征,国家关系交互网络中处于边缘位置的国家在地理分布上具有空间依赖性,而处于核心地位的国家分布相对较分散。4)国家关系交互网络结构的时序演化特征可反映危机事件的发生与发展,基于新闻大数据观察网络变化可在一定程度上探测危机事件的发生与发展态势,为国家应对危机事件的策略提供参考;另一方面,在疫情传播的背景下各国之间虽然存在外交摩擦,但直接形式的剧烈冲突较少,而中国作为国家关系交互网络中的核心国家节点,其在危机事件中与其他国家的互动是决定全球政治格局与秩序的关键因素。

本研究以2020年1月-2021年3月疫情传播为例,对公共卫生危机事件中的地缘政治关系进行分析探究,可为制定国际关系政策和策略提供辅助支持。后期研究将考虑结合贸易数据及人口迁徙数据,构建公共卫生危机事件期间的地理多元流网络,探索多层网络中国际关系与全球地缘政治格局的演化模式及空间分布特征,为国际关系与地缘政治研究提供参考。

猜你喜欢

聚类节点防控
CM节点控制在船舶上的应用
配合防控 人人有责
猪常见腹泻病症状及防控
基于AutoCAD的门窗节点图快速构建
守牢防控一线 静待春暖花开
概念格的一种并行构造算法
基于K-means聚类的车-地无线通信场强研究
夏季羊中暑的防控
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现