APP下载

大数据时代人口普查方法优化及探索

2020-07-04贾若真

科学与财富 2020年15期
关键词:人口普查大数据

贾若真

摘 要:在区域经济发展迅速、人员流动复杂的时代背景下,目前广泛应用的人口普查方式存在时效低、成本高等问题。基于互联网普及率越来越高,合理利用互联网技术及电信大数据,可以有效减少常规数据偏差、降低普查成本、提高数据质量,同时针对人口流动、人口重报等重难点问题提供解决方案。

关键词:人口普查;动态人口采集;大数据;

一、人口普查意义及其重要性

人口普查作为国家重点综合国情国力调查之一为国家战略政策制定与规划提供数据基础保障。我国目前的人口统计运用了抽样调查、普查、补充调查多种形式,每10年开展一次人口普查(逢“0”),两次人口普查之间开展1%人口抽样调查(逢“5”),也就是常说的“大普查”和“小普查”。

利用人口普查信息指导未来经济社会发展的重点要点以及阶段性目标。区域经济是我国21世纪区域经济发展的重中之重,承担着国家整体经济发展和全球地位提升的重要责任,其人口数据可以很大程度上反应和预测当地经济发展情况。现阶段人口流入或流出的情况也间接反映出城镇化进程,对于实现经济发展与城市群内部人口分布的平衡态存在重要意义;与此同时,在一定区域内对人口增长、性别比例等属性进行连续性分析掌握人口结构,是未来人口发展策略和国家重大政策性调整的重要依据,例如:当进入生育高峰时,如何调整政策对后期即将到来的教育高峰、就业高峰等进行筹划;逐步老龄化的社会确保一定量的劳动人口从而进行政策性调节。总体上来说,人口普查不仅反映出阶段性的发展情况,也是未来政策制定、工作规划的重要依据。将普查工作实施到位,抓住重点难点精准施策逐一击破,同时结合大数据技术,从中寻找助力点,优化普查工作。

二、互联网大环境与生活结合的紧密程度

根据中国互联网络信息中心发布的第44次中国互联网发展状况统计报告,截止至2019年6月,我国网民规模已达到8.54亿,较2018年底增长了2598万,互联网的普及率达到61.2%,其中手机网民的规模达到8.47亿,也就是占全部网民整体的99.1%。2016 年6月底,中国网民规模达7.10亿,互联网普及率达到51.7%,短短3年间,普及率上升了将近10个百分点。并且,随着国家“提速降费”政策的推动,移动端上网流量实现了大幅额增长。这些都为运用大数据技术进行人口普查的改变提供了客观条件。

通过分析2019年上半年互联网发展数据得出,从使用时长上来看,即时通信类、网络视频、短视频排名前三,从使用率上看,网络新闻类App、网络短视频类App位列前三。为适应用户信息获取渠道向线上媒体倾斜,经网信部门审批的互联网新闻信息服务单位达到了910家比2018年底增加约20%。新型的传播模式也层出不穷,将互联网新闻报道结合图文、音视频等多种方式,适应各年龄段和不同文化水平人群的理解。

三、我国人口普查工作的难点

(一)城市人口及流动普查

城市人口中人员流动情况一直是普查工作比较难以把握的重点。想具体查准这类群体情况,务必要做到城市人口的居住地、工作时间、流动状态、户籍所在地等重点信息记录。目前解决办法是主要从以下几方面入手:细化规范基础工作,尤其是规范普查行政记录,新生死亡人口、户籍人口、外出人员信息;调查员优选:聘用物业、小区管理人员等熟悉环境人员作为协助调查员,便于摸底调查与登记;

(二)人口重报

人口普查中重报问题的程度和影响已在逐年增加,产生这一问题的主要原因有:人员频繁流动和迁移导致常住地、户籍地并不完全一致。随着经济社会发展和全球经济体走向一体化,居住方式也多种多样,由此在普查登记时就会重复提交。同时,重报问题影响的体现与互联网技术日益发展也有密不可分的关系。在逐步脱离对普查员入户方式的依赖,仅仅依靠地址名录通过邮寄或互联网填表等形式完成问卷收集也会导致人口普查数据的重报情况增加。

(三)扩大普查宣传工作

2010年第六次全国人口普查工作开展时,主要的新闻媒体还集中在电视、报纸、电台、宣传栏等形式。近些年,网络媒体也发挥着重要的作用,甚至网络媒体是很多年轻人每天接收讯息的主要渠道。因此在今后的人口普查工作中,不仅要重视传统媒体的宣传渠道,也要合理利用网络媒体达到更广泛有效的宣传效果。利用信息传播能力强的新闻媒体,才能形成大众对人口普查工作的重视从而提高信息填报的准确性和时效性。

四、推动人口普查与互联网大数据结合的案例

(一)2015年小普查首次结束纸质问卷调查方式

1.实施方案

在2015年互联网条件已经相对成熟的情况下,小普查选择了两种方式双管齐下,分别为互联网填报方式与普查员入户用PDA登记。具体的实施方案:摸底时确认住户是否选择采用互联网方式进行填报,调查前期通过互联网进行填报,调查前期接受前确认是否完成互联网填报,与此同时,调查前期后期调查员使用PDA入户调查,未完成互联网填报的,调查员会在后期入户用PDA补登記。

2.使用PDA登记的特点

(1)优势:脱离传统的纸质调查问卷方式,节省调查表的印刷、分发、运输、审核等环节,减轻了调查员携带纸质问卷入户及后续整理工作,不仅保证随时掌握调查进度,对调查情况进行实时监控,同时减少了数据传输中造成的数据偏差和数据净化的工作量,提高了信息的保密性。

(2)难点:其一是PDA入户登记要求对调查员进行相关专业知识进行培训,避免在实际使用时出现问题。其二是PDA后续维护成本高,调查时间跨度较长,设备寿命短,反应时间和待机时间影响实际登记使用。其三是PDA对网络情况和信号覆盖情况要求比较高,避免出现数据丢失的情况。

3.互联网填报的特点

解决了调查员入户难,减少了调查员工作量与成本。同时增强被调查者信息的私密性。与入户调查不同的是互联网填报主要在于:被调查者对填报的内容和形式理解是否正确。若是按照错误理解进行填写则会造成数据上明显误差,对数据净化和整理造成负担。在互联网问卷设定的时候也需要考虑被调查对象的文化水平和年龄,甚至可以进行注释便于某些特定人群理解。互联网填报时间约为一周,要实时监控填报进度,及时提醒,避免被调查人员耽搁信息填报,延误进度。另外,根据不同网络覆盖情况的地区要分类施策。

4.此次互联网填报的启示

随着技术发展和网络应用广泛,国民普查意识和素质的提高,互联网填报会越来越实用和普及。当然,此次互联网填报方式应用,也提供了很好的参考。其一是验证了电子采集方式的便捷、准确、高效等优点。二是明确了倾向互联网填报的比例。三是在如何提高调查员应用电子采集方式和简化流程的培训有了新的方向。四是随着手机网民的占比提高,利用智能手机应用进行填报更便捷。五是在对加强普查知识的宣传形式和媒介上加以拓展,便于提高填报理解的准确性与责任意识。六是针对网络覆盖情况不同的地区因地施策,同时创建更好的网络硬件条件普及电子信息知识。七是可多次进行普查前的互联网填报试点工作,探索如何保证数据质量,同时收集行政记录信息作为辅助变量,用来对互联网填报数据进行质量评估。

(二)利用电信运营商数据对流动人口进行建模

1.数据基础

电信数据通过手机号码对人的动态行为进行统计,手机号码构成了人与人之间信息沟通的必要载体,大部分情况来讲可以认定为一个电话号码对应一个独立身份。通过我们日常使用,生成通话、上网、入网数据。由此,利用电信基础设置例如基站系统、信令系统、计费系统,我们就能清晰的将人随着时间在空间上的分布趋势描绘出来。

2.关键数据指标

(1)常驻位置:较长周期内最活跃的基站作为常驻地址判断的依据。

(2)社会行为重要程度排序:通话代表人与人之间的联络、上网代表人对信息的接收与获取、入网代表人与商业的互联。由此可判断,人与人的社会行为更强,所以排序是通话>上网>入网。

(3)辖区判断:按照最活跃基站或入网渠道位置的具体经纬度判断所属的区县和街道。

3.动态电信数据统计的特点

电信数据由通话、上网等行为产生的,频繁发生在白天的工作地。而入户的人口普查则更多是统计住宅所在地。当进行数据验证时,电信数据统计的人数在工作或商圈地区会高于普查统计年鉴的人数,而住宅地区则会低于年鉴的人数。但是综合两类区域的人口普查数据和动态电信统计的数据来看,人口分布和密度差异并不大,可以作为一种经常性的人口统计方案,尤其适合人口密度大,分布复杂的发达城市。

4.人口流动模型运用

在对人口流动通过建立人口新增流失和不同区域内流动的模型来进行统计。利用两个时间点的各街道人口分布人数,根据各个街道下新增人口与前一时间点的人口分布比例构建人口新增矩阵,根据离网人口与前一时间点人口分布的比例构建人口流失矩阵。将变动率标准化后就可以明显看出各区域流入流出程度。按照主要的几个指标:增长率、流出率、流入率、留存率、新增占比、流失占比,同时可以利用K-Means算法对街道进行分类,主要类型有:高流入率地区、高流失率地区、低增长率地区、低流动率地区。

5.电信数据的局限性

利用电信数据进行流动人口统计时存在局限性包括:群体、详细信息和由于口径不同导致的归属地判定。电信数据所统计到的是有使用记录的群体,这其中不包括新生儿、婴幼儿和部分老人,外地号码漫游的数据也不容易从当地的电信运营商获取。随着加强电信实名制和电信客户数据关联,可以从中获取性别、年龄等,但仍缺失了住房、家庭成员等详细信息。另外,人口归属地的判定口径比较多,普查中常用的是住所、户口等数据判断所属辖区,但是电信数据是根据社会行为活跃地作为归属辖区。

五.结语

人口发展情况对一个国家的未来战略决策是关键性,在数据时代获取更高效、精准的人口数据是十分必要的。随着居住情况越来越复杂,人户分离的情况更普遍,居民信息保护意识大大提高,入户普查存在更多阻碍。结合各地情况,逐步实行线上填报、完善居民行政记录等方式是人口普查方法优化的必然路线。同时,在线上媒体普及填报方式,提高信息填写的准确性与公民普查的责任意识,才能达到人口信息统计的高效、准确的需求。利用大数据可以在城市群中对人口流动情况进行统计,把握区域经济与人口发展之间的关系,作为推动经济的数据基础。

参考文献:

[1]中国互联网络中心.第44次中国互联网络发展状况统计报告.2019.

[2]张广宇,顾宝昌.人口重报:人口普查面临的新挑戰[J].人口学,2018,(第5期).

[3]胡英 李睿.2020年中国人口普查方法探讨——基于2015年小普查思考[J].调研世界,2017,(7).

[4]杨明哲,陈文平.动态人口统计原理与应用-依托电信业大数据优化人口普查方法[M].2016信息通信网技术业务发展研讨会论文集.

猜你喜欢

人口普查大数据
无人机助力人口普查
人口普查学问多
黑龙江省人民政府关于做好黑龙江省第七次全国人口普查工作的通知
人口普查为什么既要“查人”又要“查房”
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
人口普查由谁首创
历次人口普查中低年龄组人口漏报研究