APP下载

中国人口出生率的地域差异研究

2022-05-18苏理云余海琴

关键词:出生率中位数异质性

苏理云,余海琴,郭 雯

(重庆理工大学 理学院,重庆 400054)

0 引言

近年来,我国人口总量尽管还在不断上升,但人口出生率在总体上却不断下降,人口老龄化问题严峻。在此背景下,国家采取了新的鼓励生育政策,但效果并不明显。长此以往,人口结构比例的失调将会带来一系列不良影响,使社会劳动人口的养老负担加重,进而制约我国经济的未来发展。因而,调整人口结构比例已成为我国当前的重要工作。

中国著名人口地理学家胡焕庸教授[1]于20世纪30 年代在《中国人口之分布》中用一条简短的线条描述了中国自然地理、人口地理与经济地理分布不平衡的特点:从黑龙江省瑷珲县(今黑河)到云南省腾冲县之间,将中国分为东南、西北2个部分。直线的东南部,土地占全国36%,人口占全国96%;而直线的西北部,土地占全国64%,人口占全国4%。人口的区域差异问题成为关注热点,众多学者从空间的角度对数据进行分析,并将其广泛应用于具有空间异质性的数据之中。例如,苏理云等[2]在中国人口出生率的空间非均衡性及地域差异一文中指出,中国出生率呈现出由东向西增强的空间非均衡性,空间聚集性显著,且地域差异显著,表现为区域内差异大于区域间差异。陈明华等[3]运用泰尔指数分析法测算1995—2011 年中国人口老龄化地区的差异,发现中国人口老龄化具有非均衡空间分布的特征,地区差异明显且呈现反复波动趋势;总体上,区域内老龄化差异远大于区域间差异,老龄化总体差异主要是由区域内差异引起的。区域差异问题不仅广泛应用于人口社会学[4-7],在医疗卫生[8-11]领域中也大量采用。俞佳立等[12]运用熵权法和可分解泰尔指数法测度发现,中国医疗卫生资源供给水平总体呈上升趋势,各省份之间的医疗卫生资源供给水平存在差异,且这种差异主要是由四大经济区域内部差异造成的。赵雪雁等[13]采用GDI、ESDA 等方法分析了我国优质医疗资源的时空差异,并采用地理探测器方法识别影响不同尺度优质资源分布的关键因素。

随着当前人口结构的重大改变,出生率问题已成为社会学关注的重点,而人口出生率的区域差异则成为地理学研究的新热点。为此,从东、中、西部地域划分角度研究中国人口出生率的发展趋势,逐步深入地揭示造成中国人口出生率地域差异的原因。首先,通过地理探测器q 统计发现中国人口出生率存在显著的空间分层异质性;其次,通过Brown-Mood 中位数检验出东、中、西部3 个地域之间的差异;最后,采用层次聚类法进一步分析主要影响各区域内人口出生率差异的省份。

1 研究方法及数据说明

1.1 研究方法

1.1.1 地理探测器

空间自相关性和空间分层异质性是空间现象的2 个主要特征。其中,空间分层异质性是指某一属性值在不同类型或区域之间存在差异,可用于气候分带、土地利用和地理区划等。地理探测器q 统计可以探测某属性(Y)的空间分层异质性,即空间各类型之间的整体差异性。地理探测器q统计的表达式[14]为:

式中:h=1,…,L 是变量Y 的分层,即分区;Nh和N 分别为子区域h 的样本单元数和整个研究区域的样本单元数;和σ2分别是子区域h 和整个研究区域的Y 的方差。q 的取值范围为[0,1],值越大则表明Y 的空间分层异质性越明显。

q 值可以变换为非中心F 分布:

式中:α 是统计量q≥x 的概率。地理探测器q 统计的假设检验为:

H0:没有分层异质性(即分层不显著)

H1:存在分层异质性(即分层显著)

在显著性水平α 给定条件下,若F>Fα(临界值)或p 值小于α 则拒绝原假设,接受备择假设。

1.1.2 Brown-Mood 中位数检验

Brown-Mood 中位数检验[15]的主要思想:将两样本混合起来排秩,将其中大于或小于混合样本中位数mexy的数据个数进行计数,绘制四格表,利用超几何分布进行检验。

对于2 个独立分布的总体X 和Y,设其分布为X=F1(x),Y=F2(x-μ),中位数分别为mex和mey。假设检验为:

H0:mex=mey⇔H1:mex<mey

在原假设H0成立时,2 组数据有相同的中位数,则2 组数据混合后,混合中位数mexy与mex,mey相等,2 组数据将会均匀分布在混合中位数mexy两边。

表1 中A、B、C、D 表示4 个类别的样本个数,其中A 表示样本X 中大于中位数mexy的个数,t 表示混合样本中大于中位数mexy的个数。在给定m、n 和t 时,原假设成立条件下,A 服从超几何分布A~H(t,m,N),概率公式为:

表1 Brown-Mood 中位数检验的列联表

1.1.3 层次聚类

聚类分析是一种数据归约技术,可以发现一个数据集中观测值的子集。其中,最常用的聚类方法是层次聚类和划分聚类。相对于划分聚类,层次聚类不需要指定聚类的数量,且对距离度量的选择不敏感。

层次聚类通过计算不同类别数据点之间相似度来创建一棵有层次的嵌套聚类树。其基本思想是:首先,将聚类的样本或变量各自看成一类;然后,确定类与类之间的相似统计量,并选择最接近的两类或若干个类合并成一个新类,计算新类与其他各类之间的相似性统计量;再选择最接近的两群或若干群合并成一个新类,直到所有样本或变量都合并成一类为止。层次聚类法常以距离为相似统计量,常用的算法是单联动、全联动、平均联动、质心和Ward 方法。本文中采用平均联动聚类,它定义了2 个聚类之间的距离,即第1 个聚类中的数据和第2 个聚类中的数据点之间的平均距离。

1.2 数据说明

人口出生率指某地在一个时期之内(通常指一年)出生人数与平均人口之比,反映人口的出生水平或强度,一般用千分数来表示。计算式为:

式中:B 为年内出生人口数;P 为年内平均人口数。

研究对象为除中国港、澳、台地区的其他31个省份。考虑到数据获取的可行性与相对完整性,选取考察时期为1979—2019 年。数据来源于中国经济社会大数据研究平台和国家统计局的统计数据[16]。

2 实证分析

综合文献发现,人口出生率具有空间聚集性,不仅有空间同质性,也有空间异质性。

改革开放四十多年来,我国东部地区率先发展,带动国民经济发展的同时,也加剧了区域发展差异问题,造成了劳动力、资本等资源加速向经济发达地区转移,收入的不平衡也影响了各地区的人口出生率。为更好地分析人口出生率的地域差异,根据经济发展水平,对除中国港澳台地区以外的31 省份进行东中西部区域划分(如表2 所示):

表2 中国东中西部地域划分

1)东部(east):最早实行沿海开放政策并且经济发展水平较高的地区。

2)中部(center):经济次发达地区。

3)西部(west):经济欠发达地区。

2.1 空间分层异质性

根据表2 的区域划分可知,中国除港澳台地区外被划分为3 个区域,即分层数L=3,每一层(h=1,2,3)的样本单元数Nh分别为11、8 和12,全区的单元数N 为31。通过地理探测器软件计算出中国人口出生率自1979 年至2019 年间每5 年之间的地理探测器q 统计值。q 统计值越大表示人口出生率(y)的空间分层异质性越明显,如表3所示。

表3 1979—2019 年中国人口出生率的q 统计值

在1994—1999 年,中国人口出生率的q 统计值达到最大,且p 值小于显著水平α=0.05,表明中国人口出生率存在显著的空间分层异质性,但其他年份的p 值却不显著。虽然这样的p 值在统计中显然不是一个好的结果,但是现实中,空间分层异质性不能简单地通过p 值大小来判断。从表3 各年q 统计值差异变化可以看出,我国人口出生率存在空间分层异质性。自1984 年我国开放部分沿海城市,这部分城市经济率先发展起来,带动内地经济发展的同时,也导致区域发展差异问题加剧,故表3 中q 统计值先迅速增大再缓慢降低,但总体呈增加趋势。因此,分层对人口出生率分布有所影响,东、中、西部地域之间的人口出生率存在地区差异,但短期变化趋势并不稳定,呈现反复波动态势。

2.2 Brown-Mood 中位数检验

由于东部、中部和西部地域之间存在明显的空间分层异质性,进一步探究各区域间的差异有利于加深对人口出生率的地域差异认识,故采用Brown-Mood 中位数检验法分别对东、中、西3 个地域进行两两检验。采用卡方检验对东部、中部与西部的人口出生率进行独立性检验,原假设为2个地域之间相互独立。

如表4 所示,在显著水平α=0.05 条件下,卡方检验的p 值均大于显著水平0.05,表明东部、中部和西部的人口出生率之间相互独立,因此可以进行Brown-Mood 中位数检验(表5,图1)。

表4 卡方检验

表5 给出了1979—2019 年东-中部,中-西部和东-西部人口出生率的Brown-Mood 中位数检验的p 值。在显著性水平α=0.05 条件下,若p值大于0.05,则接受原假设,表明2 个地域的人口出生率没有显著差异;反之,则不接受原假设,表明两个地域间的人口出生率存在显著差异。

表5 Brown-Mood 中位数检验

续表(表5)

结合表5 中的p 值数据绘制线形图(图1 所示),可以发现,东-西部的人口出生率在1986—2003 年期间存在显著的地域差异,且呈现短期反复波动的情形,说明东部的年平均人口出生率水平小于西部的年平均人口出生率水平。同理,1994—1996 年中部的年平均人口出生率水平显著小于西部的年平均人口出生率水平,且中部-西部的Brown-Mood 中位数检验p 值在1994—1996年这3 年达到最低。总体上,区域间人口出生率差异呈现扩大趋势后逐渐收敛,东-西部和中-西部差异对人口出生率总体差异影响较大。

图1 Brown-Mood 中位数检验结果

2.3 层次聚类

为了更全面、准确地探索中国各省人口出生率地域差异及其发展变化规律,采用层次聚类分析方法[17],将各区域人口出生率中具有相似性的省份聚成一类,从而反映区域内各省份之间的内在差异与联系。

图2 的聚类分析树状图从下往上展示了各地域省份如何被结合成类。每个省份最初自成一类,然后相距最近的两类合并,直到所有省份合并成一类。树的高度代表了这个高度的类之间合并的判定值。本文中采用平均联动聚类,标准是一类中的点和其他类中点的距离平均值。根据层次树的高度,将东、中、西部区域内省份划分为两簇,其中树高的那一簇作为影响区域人口出生率差异的主要省份。

图2 聚类分析树状图

表6 展现了1979—2019 年5 个时期的东、中、西部区域的聚类结果,可以看出:东部地区的人口出生率差异主要受广东、福建、海南、浙江等省份的影响,显然沿海地区是我国经济最活跃、工业最发达、国内生产总值最高的区域,促使该地区人口数量急剧上升,人民生活水平提高,人口出生率随之提升;中部地区的人口出生率差异主要受吉林和黑龙江的影响,这两个地区的经济相对中部地区其他省份而言,属于经济发展比较好的地区,人们的传统观念有所淡化,追求人口素质的发展,“少生”和“优生”的观念逐步深入人心,这与经济发展状况相符;西部地区的人口出生率差异主要受到西藏、云南、广西、宁夏、贵州和青海的影响,由于地理位置和资源欠缺的原因,经济发展相较于东、中部地区不是很好,尽管人均可支配收入较低,但是育儿成本较发达地区而言小得多,且西部地区的老旧观念未得到改变,人们选择多生、早生,使得这些地区人口出生率较高。

表6 1979—2019 年影响各区域内人口出生率差异的省份

3 结论

1)我国人口出生率存在空间分层异质性,短期变化趋势并不稳定,呈现反复波动态势;结合Brown-Mood 中位数检验东、中、西部两两地域间平均人口出生率的变化,发现东部和中部之间没有显著差异,而东部-西部和中部-西部在1986—2003 年间存在显著的地域差异,区域间人口出生率差异呈现扩大趋势后逐渐收敛。

2)采用层次聚类法探究影响各区域内人口出生率差异的省份,发现广东、福建等沿海城市的快速发展吸引各地人民前往,人口流动增大,生活节奏加快;生活成本提高使得东部和中部地域的人们对于孕育下一代非常慎重,更注重下一代的质量,而西部欠发达地区则秉承旧观念,超生现象依然普遍。

结合本文的分析与结论,给出以下建议:

1)国家制定生育政策时需要重视人口的空间非均衡性,率先考虑地域差异和各省市的发展趋势,统筹解决人口出生率较低的问题。

2)加强各区域合作,协力解决人口生育问题。地域间既有同质性也有异质性,各个省市在解决各地区人口问题时要因地制宜,解决地区重点突出问题,完善地区人口政策,保障政策的有效实施。

3)建立完善以中央为主体的财政保障体质,推进西部人口和计划生育公共服务均等化。加大中央对西部地区人口和计划生育公共服务的投入,加大对西部欠发达地区的财政投入,帮助其建立属于当地地区的经济产业,促进经济的迅速提高。只有人们的物质基础得到保障及提升,和谐发展人口才有基础。

4)制定人口长期发展战略,优化生育政策。建立和完善计划生育家庭老年人扶助制度,妥善解决计划生育特殊困难家庭的生活照料、养老保障、大病治疗、精神慰藉等问题,降低生育、养育、教育成本,促进人口长期均衡发展,提高人口素质。

猜你喜欢

出生率中位数异质性
城市规模与主观幸福感——基于认知主体异质性的视角
管理者能力与企业技术创新:异质性、机制识别与市场价值效应
异质性突发事件对金融市场冲击分析
孕期健康教育及营养干预对降低巨大儿出生率的影响分析
基于收入类型异质性视角的农户绿色农药施用行为研究
出生率创新低,都是压力惹的祸吗?
数据的数字特征教学设计
房价上涨抑制英国出生率:每年少生7000多名婴儿
中位数教学设计