APP下载

人口流动与新冠病毒传播
——基于向量自回归模型的实证分析

2022-06-14戴冬阳

关键词:公共交通步行增长率

石 峰,胡 燕,戴冬阳

(1.湖南工程学院 管理学院,湖南 湘潭 411104;2.中南大学 法学院,湖南 长沙 410012;3.中国人民解放军陆军勤务学院 国防经济系,重庆 401331)

自2020年1月30日世界卫生组织宣布新冠肺炎疫情为国际关注的突发公共卫生事件以来,COVID-19已感染至世界大部分国家和地区。截至8月中旬,全球感染病例超过2 170万例,累计死亡病例逾76.7万例。面对严峻的形势,各国政府采取的主要措施是强制民众居家隔离和保持社交距离,以阻止疫情传播和蔓延。但是,无论是小到民众的饮食起居,还是大到国民经济的运转,长期的居家隔离并不现实,出行必然是常态化疫情防控下的一种无奈选择。因此,研究居民不同出行方式与COVID-19传播率之间的内在关联,对于指导各国政府和地区科学制定有效的疫情防控措施、推动全球协同抗疫具有重要意义。对人口流动进行限制是控制流行病传播的有效策略,但人口流动管控与COVID-19流行程度的联系仍处于探索阶段。许多研究表明,流行病的传播过程与人口流动性存在密切关系。现有研究主要从三种不同的视角来分析人口流动与流行病传播的关系。第一种视角是研究人口流动对流行病传播的影响。Peak等[1]运用塞拉利昂移动电话数据研究认为,人口出行限制有助于抑制埃博拉病毒传播。Kraemer等[2]研究发现,严格的旅行控制措施大大减轻了COVID-19的传播,但社会隔离和卫生措施在控制COVID-19传播中发挥最大作用。Yang[3]基于离散时间马尔可夫链方法研究表明,小规模的社区结构、较高的社区人口流动率和大量的临时社区有利于抑制流行病传播。李建军[4]利用百度人口迁徙数据研究认为,人口流动会加速COVID-19传播。万里阳等[5]的研究也表明,城市高铁网络增强了COVID-19在城市间的传播。第二种视角是研究流行病传播对人口流动的影响。Meakin等[6]构建人口隔离造成的空间异质性流行病模型,并根据流行病的病例报告数据估算人群之间相互作用的强度。第三种视角是全面分析人口流动与流行病传播的交互动态关系。梁泽等[7]认为,我国城市的COVID-19感染率与人口迁徙存在显著空间依赖性。张钊等[8]研究认为,“封城令”的实施使COVID-19感染人数增长率与交通流显著负相关。

综上,大多数研究都是基于第一种视角考察人口流动性的变化对流行病传播的影响。一般认为,人口流动对流行病传播带来正向影响。从流行病传播对人口流动变化的影响看,已有研究建立的模型都存在一个强加单向关系的局限性,即被解释变量受到解释变量的影响,但反之不成立。已有研究即使基于第三种视角分析人口流动与COVID-19传播的相互关系,但大多仅仅考察二者之间的简单线性相关和空间相关。因此,不同于以往研究的是,本文构建向量自回归(VAR)模型全面分析人口流动与COVID-19传播之间的双向反馈关系,系统分析人口流动与新冠病毒传播之间的内在关联,由此帮助决策者在COVID-19大流行期间评估出行限制措施对公共卫生的潜在积极影响。

一、数据、变量与模型

利用美国新冠疫情相关数据,能够为我国预警人口流动的潜在风险以及实时监控、模拟各类隔离和疏散产生的流动性变化带来重要借鉴意义。

(一)数 据

本文使用美国人口流动指数和COVID-19感染人数增长率数据考察人口流动与新冠病毒传播之间的关联,人口流动指数数据为2020年1月22日至2020年8月16日美国驾车出行指数、乘坐公共交通出行指数和步行出行指数(图1),均来源于美国苹果公司网站(https://www.apple.com/covid-19/mobility)。该数据集是以2020年1月13日为基准(100)构建的相对数。其中,2020年5月11日至5月12日的人口流动数据缺失,本文采用线性插值法补齐。美国COVID-19感染人数(确诊病例)和COVID-19感染人数增长率数据来源于世界卫生组织网站(https://www.who.int/emergencies/diseases/novel-coronavirus-2019),公布的最新截止时间为2020年8月16日(图2)。

图1 2020年1月22日至8月16日美国人口流动指数

图2 2020年1月22日至8月16日美国COVID-19感染人数及其增长率

(二)变 量

本文使用变量inf表示美国COVID-19感染人数增长率,同时分别用变量driv、tran和walk表示美国驾车出行指数、乘坐公共交通出行指数和步行出行指数。为消除模型中可能出现的异方差,以及削弱变量间的共线性,使变量数据更加平稳,对各变量取对数后再纳入模型。各变量的对数形式分别用lninf、lndriv、lntran和lnwalk表示。对于美国COVID-19感染人数增长率数据,从1月22日发现第1例确诊病例开始至8月16日期间,共有36天的增长率为0。因此,为避免样本丢失,借鉴常用做法,对变量inf所有的观测值加1,然后再进行对数变换。各变量描述性统计如表1所示。

表1 变量描述性统计

(三)模 型

向量自回归(VAR)模型允许所有变量之间的双向反馈关系,所有变量都被平等对待,即所有变量都是内生的,变量之间平等地相互影响。VAR模型将单变量自回归的思想扩展到多元时间序列回归,是单变量自回归模型的一般化。它由系统中每个变量对应一个方程组成,每个方程的等式右边都包含一个常数项和系统中所有变量的滞后项。两变量的VAR模型的系统方程表示如下:

Yt=β10+β11Yt-1+…+β1pYt-p+γ11Xt-1+…+γ1pXt-p+u1t

(1)

Xt=β20+β21Yt-1+…+β2pYt-p+γ21Xt-1+…+γ2pXt-p+u2t

(2)

在式(1)和(2)中,βij(i=1,2;j=1,…,p)是变量Y的1期至p期滞后项对其自身的影响系数,系数γij(i=1,2;j=1,…,p)表示变量X的1期至p期滞后项对变量Y的影响;β10和β20均为常数;u1t和u2t都是白噪声过程,且可能存在同期相关。

本文建立lninf和lndriv、lninf和lntran、lninf和lnwalk双变量VAR模型,系统分析COVID-19感染人数增长率与驾车出行指数、与乘坐公共交通出行指数、与步行出行指数相互影响的动态关系。

二、实证分析

本文的实证过程由平稳性检验、协整检验、滞后阶数选择、模型拟合及稳定性检验、脉冲响应分析和方差分解组成。

(一)平稳性检验

在拟合VAR模型之前,需要对变量进行平稳性检验。如果要拟合的内生变量都平稳或者同阶单整才能对VAR模型进行拟合。对于时间序列的平稳性检验,主要有图检法和构造检验统计量的方法。本文采用最常用的ADF检验和KPSS检验两种方法对所有变量进行平稳性检验。在平稳性检验中,若检验统计量的值和临界值都为负,则检验统计量的值大于临界值是接受原假设;若检验统计量的值和临界值都为正值,则检验统计量的值大于临界值是拒绝原假设。ADF检验中,原假设是序列存在单位根(不平稳),但在KPSS检验中,原假设则为序列是平稳的。

本文使用R语言中的urca程序包进行平稳性检验,平稳性检验结果如表2所示。从表2看出,ADF检验中lninf、lndriv、lntran、lnwalk4个变量的检验统计量的值在5%显著水平下都大于临界值-3.43,因此不是拒绝原假设而是接受存在单位根的假设,同时说明这4个变量序列是不平稳的;KPSS检验中lninf、lndriv、lntran、lnwalk4个变量的检验统计量的值在5%显著水平下都远大于临界值0.463,因此是拒绝原假设,说明序列不平稳。随后对4个变量的一阶差分序列dlninf、dlndriv、dlntran和dlnwalk进行平稳性检验。由于在ADF检验中4个变量dlninf、dlndriv、dlntran和dlnwalk的检验统计量的值都在1%显著性水平下小于对应的临界值,因此拒绝存在单位根的原假设,即4个变量是一阶差分平稳的。dlninf、dlndriv、dlntran和dlnwalk的KPSS检验也表明,4个检验统计量的值都在1%显著性水平下小于对应的临界值0.739,因此dlninf、dlndriv、dlntran和dlnwalk等序列是平稳序列。

表2 ADF和KPSS平稳性检验结果

(二)协整检验

由于变量lninf、lndriv、lntran和lnwalk都是一阶单整序列,因此可以进行协整检验,从而判断各个变量之间是否存在长期稳定的均衡关系,避免出现伪回归问题。本文主要分析lninf和lndriv、lninf和lntran、lninf和lnwalk之间的动态关系。因此,本文需要进行3次协整检验。本文采用E-G两步法检验变量之间的协整关系,基本步骤为:一是建立因变量与自变量回归模型,并使用OLS法估计模型,得到残差序列。二是检验残差序列的平稳性。若残差序列是平稳的,则变量之间存在协整关系,反之不存在。我们首先将lninf作为因变量,分别与自变量lndriv、lntran和lnwalk建立3个回归模型,估计模型后得到3个残差序列,分别为e1、e2和e3。随后对残差序列进行平稳性检验,检验结果如表3所示。

表3 残差序列的ADF检验结果

由表2残差序列的结果看到,e1 、e2 和e3均在 1% 的显著性水平上拒绝存在单位根的原假设,即残差序列是平稳的,说明 lninf和lndriv2个变量之间存在协整关系,意味着COVID-19感染人数增长率和驾车出行指数之间具有长期均衡关系,即增长或者减少具有协同效应。同样lninf和lntran存在协整关系;lninf和lnwalk也存在协整关系。这分别说明COVID-19感染人数增长率和乘坐公共交通出行指数存在长期均衡关系,COVID-19感染人数增长率和步行出行指数存在长期均衡关系。

(三)滞后阶数选择

选择适当的滞后阶数对于VAR模型的拟合至关重要。Johansen等[9]指出,使用太少的滞后阶数会导致自相关误差,而使用太多的滞后阶数则会导致过度拟合,从而导致VAR模型的均方预测误差增加。VAR模型的滞后长度可以根据不同的信息准则来确定。R语言中的vars程序包使用4个不同的信息准则(AIC、HQ、SC和FPE)选择滞后阶数。国家卫健委发布的《新型冠状病毒感染的肺炎诊疗方案》(试行第五版)指出,新型冠状病毒的潜伏期为1~14天,一般为3~7天。因此,本文构建的VAR模型将最大滞后阶数设置为7,随后根据AIC、HQ、SC和FPE准则选择最优的滞后阶数。由3组变量构建3组VAR模型的最优滞后阶数检验结果见表4。由表4可以看出,模型1在4种不同信息准则下确定的滞后阶数均为7;模型2在SC准则下确定的滞后阶数为3,其他都为7;模型3在4种不同的信息准则下确定的滞后阶数也都为7,因此3组VAR模型都选择7阶滞后。

表4 VAR模型的最优滞后阶数检验结果

(四)模型拟合及稳定性检验

我们首先对COVID-19感染人数增长率和驾车出行指数构建的VAR模型(模型1)进行拟合,以lninf为因变量和以lndriv为自变量的拟合结果表明,拟合优度为0.723 4,F统计量值为34.56,且在1%水平下显著,模型拟合效果较好。以lndriv为因变量和以lninf为自变量的拟合结果为:拟合优度为0.950 3,模型拟合非常好。F统计量值为252.4,且在1%水平下显著,说明各变量间的线性关系显著。接着对COVID-19感染人数增长率和乘坐公共交通出行指数构建的VAR模型(模型2)进行拟合,以lninf为因变量和以lntran为自变量的拟合结果表明,拟合优度为0.733 5,F统计量值为36.37,且在1%水平下显著,模型拟合效果也较好。以lntran为因变量和以lninf为自变量的拟合结果为:拟合优度为0.978 4,模型拟合非常好。F统计量值为598.5,且在1%水平下显著,说明各变量间的线性关系显著。最后对COVID-19感染人数增长率和步行出行指数构建的VAR模型(模型3)进行拟合,以lninf为因变量和以lnwalk为自变量的拟合结果表明,拟合优度为0.728 1,F统计量值为35.38,且在1%水平下显著,模型拟合效果较好。以lnwalk为因变量和以lninf为自变量的拟合结果为:拟合优度为0.943 8,模型拟合非常好。F统计量值为221.9,且在1%水平下显著,说明各变量间的线性关系显著。VAR模型拟合后,还需要进行稳定性检验。只有通过参数稳定性检验的模型,才具有预测能力,从而进行脉冲响应和方差分解才有意义。对于VAR模型,模型稳定的条件是特征方程的根都在单位圆以内,或者与其相反的特征方程的根都在单位圆以外。使用R语言的roots函数对3组VAR模型进行稳定性检验。模型1、2和3都包含有2个变量,且每个变量都滞后7阶,因此都有14个特征多项式根。稳定性检验结果发现,每个模型的14个特征多项式根均小于1,且在单位圆内,表明构建的VAR模型是稳定可靠的。

(五)脉冲响应分析

VAR模型中的某个内生变量受到“外部冲击”时,脉冲响应函数能动态反映其他内生变量受到的影响。图3是人口流动与新冠病毒传播的脉冲响应图。其中,(a)~(f)分别为COVID-19感染人数增长率对驾车出行指数的脉冲响应、驾车出行指数对COVID-19感染人数增长率的脉冲响应、COVID-19感染人数增长率对乘坐公共交通出行指数的脉冲响应、乘坐公共交通出行指数对COVID-19感染人数增长率的脉冲响应、COVID-19感染人数增长率对步行出行指数的脉冲响应和步行出行指数对COVID-19感染人数增长率的脉冲响应。

图3 人口流动与新冠病毒传播的脉冲响应

由图3(a)看出,当驾车出行指数受到一个标准差单位的正向冲击时,COVID-19感染人数增长率对来自驾车出行指数的冲击表现出周期效应。COVID-19感染人数增长率面对驾车出行指数的冲击在第1期为0,第2~7期持续为负向,第8期转为正向,且达到峰值,随后又持续为负,至第15期又变为正向,直至第42期,这种正负交替的周期效应具有持续性,周期峰值随时间逐渐衰减。第43~101期持续为正,且逐渐收敛。

由图3(b)可知,驾车出行指数对来自COVID-19感染人数增长率的冲击在第1期为正,随后一直为负,第32期达到波谷(最小值),其值为-0.052 2,随后负向效应逐步减弱。这说明驾车出行指数受COVID-19感染人数增长率的冲击较大,而COVID-19感染人数增长率受到驾车出行指数的冲击相对较小。

从图3(c)看出,对乘坐公共交通出行指数给定一个标准差单位的正向冲击,乘坐公共交通出行指数的变化对COVID-19感染人数增长率的冲击影响刚开始为0,随后为负向影响,第4期转为正向,第5~10期又为负向影响,且在第7期达到波谷。第1~50期的冲击影响呈现波动趋势,第51期达到冲击的峰值(0.033 8),随后逐渐衰减。这说明乘坐公共交通出行指数对COVID-19感染人数增长率的冲击具有长期影响。

从图3(d)看到,COVID-19感染人数增长率对乘坐公共交通出行指数的冲击在第1期为正,第2~78期持续为负,且在第29期达到最小值(-0.062 8)。第79期后一直为正,且在整个观察内未呈现收敛特征。这说明COVID-19感染人数增长率对乘坐公共交通出行指数的冲击影响更长久。

由图3(e)看出,步行出行指数对COVID-19感染人数增长率的冲击影响与驾车出行指数对COVID-19感染人数增长率的冲击影响非常相似,COVID-19感染人数增长率对步行出行指数的动态响应呈现周期效应,即步行出行指数对COVID-19感染人数增长率冲击的正负影响具有周期交替特征,持续时间长,且周期峰值逐渐减缓。

从图3(f)看出,步行出行指数对COVID-19感染人数增长率的脉冲响应在当期为正,随后一直为负,且在第25期达到最小值(-0.058 6)。整个观察期内COVID-19感染人数增长率对步行出行指数的冲击影响具有长期持续性,虽有小幅波动,但仍未出现明显收敛趋势。

从表5可以清楚观察各变量间动态响应的累积效应及其变化趋势。由表5看到,从1至101期,lndriv、lntran和lnwalk对lninf的脉冲响应累积效应均为负,即COVID-19感染人数增长率的冲击分别对驾车出行指数、乘坐公共交通出行指数和步行出行指数的影响都为负,且对步行出行指数的影响最大(-3.026 1)。这说明随着COVID-19感染人数不断增加,人口流动随之相应减少。而乘坐公共交通出行指数和步行出行指数的冲击对COVID-19感染人数增长率的累积效应为正,且乘坐公共交通出行指数的冲击远大于步行出行指数。这说明乘坐公共交通出行和步行出行会显著增加COVID-19感染人数,而乘坐公共交通出行对COVID-19传播的影响更大。驾车出行指数的冲击对COVID-19感染人数增长率的累积效应为负。这说明,与乘坐公共交通出行和步行出行相比,驾车出行减少了人际接触的密集度和拉大了空间距离,驾车出行方式可以减弱COVID-19传播风险和趋势。

表5 人口流动与新冠病毒传播的脉冲响应累积效应

(六)方差分解

人口流动与新冠病毒传播的预测方差分解结果如表6所示。从人口流动对新冠病毒传播的贡献度看,驾车出行指数、乘坐公共交通出行指数和步行出行指数对COVID-19感染人数增长率的预测方差贡献度在第5期都较小,分别为10.2%、6.7%和10.0%,到第15期时均不足45%,可见,在这一观察期内COVID-19感染人数增长率主要受到自身反馈作用的影响。但至第20期后,人口流动对新冠病毒传播的影响起着主要作用,驾车出行指数、乘坐公共交通出行指数和步行出行指数的贡献度分别达到57.7%、53.1%和53.8%,这说明人口流动对新冠病毒传播具有滞后效应和长期影响。

从新冠病毒传播对人口流动的贡献度看,COVID-19感染人数增长率对驾车出行指数、乘坐公共交通出行指数和步行出行指数的预测方差贡献度从第1期至第20期都达不到5%,这说明新冠病毒传播对人口流动影响的贡献率较小,人口流动的变化主要受其自身的影响,即驾车出行指数、乘坐公共交通出行指数和步行出行指数都具有明显正反馈作用。美国疫情暴发后,只有较少民众自愿“居家隔离”,但大量民众照常出行,似乎未考虑疫情带来的影响,很多地方政府也迟迟没有推出“居家令”。因此,人口流动性的变化可能更多还是来自“居家令”等出行限制政策的影响。

表6 人口流动与新冠病毒传播的预测方差分解结果

三、政策建议

第一,对城市公共交通和步行出行严格管控,鼓励居民优先选择私家车出行。针对人口流动对新冠病毒传播带来的影响,对乘坐公共交通出行和步行出行方式实施管制措施,有利于减弱新冠肺炎疫情蔓延,其中,控制公共交通出行方式对疫情扩散的抑制效果更加明显。驾车出行方式减少了人口聚集密度,是相对安全的出行方式。

第二,针对民众必要的出行,政策制定者应鼓励人们养成自我隔离和戴口罩的卫生习惯。与此同时,政府相关部门应随时提醒和告知民众疫情风险和疫情形势变化,警示民众非必要勿前往中高风险地区,自觉配合当地疫情防控筛查管控措施。对于乘坐公共交通工具、自驾出行和步行出行的民众,务必严格遵守当地疫情防控政策要求,主动申请和使用“健康码”和“行程码”,并做好个人防护。

第三,运用“时空大数据”技术工具搭建监测和防控机制。针对乘坐火车、飞机、公共汽车和其他交通工具的出行人群,通过手机号码、交通记录以及个人在线支付账户等数字工具和应用程序密切关注和监测人口流动带来的疫情风险。充分利用“城市云脑”整合城镇道路公共视频资源,全方位常态化巡查城区、城镇公众广场、公园等开放区域人口流动和聚集状况。对于居家隔离的民众,对社区居民症状进行“云上传”和“云管理”,实施有效的信息管理,建立“人员隔离、物流不断、信息畅通”的有效防控机制。

猜你喜欢

公共交通步行增长率
魔方小区
城市轨道站点公共交通一体化衔接分析
在未来,我们不需要路
二次规划在城市公共交通系统工程中的应用
台2016GDP“成功保1”
美拭目以待的潜力城市
种群增长率与增长速率的区别