APP下载

基于大数据时代下的疫情医疗体系建设研究

2020-11-06单佳宜

现代信息科技 2020年12期
关键词:新冠肺炎疫情数据分析大数据

摘  要:随着新型冠状病毒肺炎的爆发,如何建设新冠肺炎疫情医疗体系已然成为当前炙手可热的研究热点。同时随着大数据技术的不断演变及进步,亟需对当前疫情医疗体系进行建设及规范,改善和解决传统医疗体系的缺陷。文章围绕全球疫情数据,利用大数据工具建立数据模型及参数指标并进行系统性分析,并探究如何建设新冠肺炎疫情医疗体系。

关键词:大数据;新冠肺炎疫情;数据分析;医疗体系建设

中图分类号:R197.3;TP392      文献标识码:A 文章编号:2096-4706(2020)12-0119-03

Abstract:With the outbreak of COVID-19,how to build the COVID-19 epidemic medical system has become a hot research hotspot. At the same time,combined with the continuous evolution and progress of big data technology,it is urgent to build and standardize the current epidemic medical system,so as to break the criticism and defects of the traditional medical system. Based on the global epidemic data,the author used big data tools to establish data model and parameter index and carry out systematic analysis,and explored how to build the COVID-19 epidemic medical system.

Keywords:big data;COVID-19;data analysis;construction of medical system

0  引  言

新冠肺炎疫情以突如其來的姿态席卷全球,其影响范围之广、传染能力之强,严重影响了全球数百个国家与地区,时至今日仍有多个国家无法有效控制其蔓延趋势[1]。

21世纪是大数据的时代,在拥抱大数据时代的同时应将其充分应用至现实中,以解决实际需求,在集全球之力对抗新冠肺炎疫情的同时,可以利用大数据等技术从新冠肺炎疫情下的数据中挖掘出有用信息,并加快推进对新冠肺炎疫情医疗体系的建设。

1  疫情数据分析

1.1  疫情数据爬取

笔者借助基于Scrapy的爬虫框架,对全球新冠疫情数据进行分析与探究,时间跨度为2020年1月22日—2020年5月22日,通过爬取美国霍普金斯大学在GitHub上共享的开源数据,并以JSON文件格式进行存储导出及后续处理。

爬取过程重要代码如下,得到的初始数据文件中包含日期、国家/地区、确诊人数、死亡人数、治愈人数五个字段,并将其通过CSV文件导出:

for contry in datas['area']:

for province in contry['children']:

for city in province['children']:

with open(ExcelName, 'a', encoding='utf-8', newline='') as csvfile:

writer = csv.writer(csvfile)

writer.writerow([Datas ['name'], Province ['name'], str(Province ['total']['confirmed']), Province (city['total']['dead']), Province (city['total']['recovered']))

1.2  疫情数据清洗

根据基于Scrapy的爬虫所获取的CSV数据文件,对其数据特征进行数据清洗。原数据中部分行和列根据地名排序且难以创造实际价值,因此利用DataFrame的数据格式筛选出有价值的行。

清洗过程重要代码如下,通过删除确诊人数、死亡人数和治愈人数都为0的行并将其根据时间排序,同时删除CSV文件的首行,以便后续更好地模拟真实数据传输:

val Sorted = spark.sql("select Datas,Province" +" confirmed,dead,recovered from view where confirmed!=0 or dead!=0 or confirmed!=0 " +"or confirmed!=null or recovered!=null or dead!=null order by Dates desc")

Sorted.coalesce(1)

.write.mode(SaveMode.Overwrite)

.option("header","False")

.option("sep",",")

.csv("csv")

1.3  变量设置及数据分析

Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。对清洗过后的文件,采用Kafka作为实时处理工具,对确诊人数、死亡人数、治愈人数等当日数据与前一天定值比对得出确诊率、死亡率、恢复率三大指标进行系统分析。同时选用Flask_SocketIO作为客户端,通过MySQL数据库逐行读取数据,同时Socket监听响应函数,对数据库传入的数据实时展现实现WebSocket。与此同时连接数据库,将CSV文件存入MySQL数据库中。

如图1所示,id为自增主键,dates为日期(datatime数据),curerate为恢复率,state为状态(仅设置0和1,当数据被读取后标记为1)。

通过逐行读取MySQL数据库的内容,同时更新数据库state为1,Socket监听响应函数并使用HTML网页进行展示,以下仅选取2020年1月22日—2020年5月22日全球疫情数据进行分析,如图2所示(图2仅截取部分数据),id为自增主键,country为国家/地区,dates为日期(datatime数据),curerate为恢复率,Increase_rate为增长率,Mortality为死亡率,state为状态(仅设置0和1,当数据被读取后标记为1)。

通过分析图2中2020年1月23日数据中的确诊率、死亡率、恢复率,可以看出全球疫情体系存在一些问题:

一是三大指标中全球各个国家之间的确诊率、死亡率、恢复率差异化较大,由于各个国家的重视程度与疫情治理能力不同,对抗疫情也伴随着相当大的困难,从而增加了世界疫情格局的不确定性。

二是尚未建立疫情医疗体系标准,各个国家各自为政,尽管世卫组织在全球抗击疫情中发挥重要作用,但由于其职能所限,只能针对传染病预防,對各国如何应对疫情只能进行呼吁和建议,不具备关键决策权,这使得全球抗疫效率取决于各国的自愿配合程度。[2]因此迫切需要国际社会建立相关疫情医疗体系标准。

三是缺乏人类命运共同体意识,在全球化的今天,人类命运共同体愈发成为世界人民立足之根本,只有各国一起合作,才能实现全球疫情医疗体系的稳定有序发展,如果仅仅由少数国家对抗疫情,而大多数国家采取不作为的态度,这场疫情也难以得到继续控制和防护。

2  疫情医疗体系建设的相关措施

2.1  加快不同省市区域内疫情医疗体系建设

针对不同省市区域内的疫情医疗体系,迫切需要建立相关制度与体系,对疫情区域强、中、弱地区进行划分及分类,对出现严重疫情的地区进行及时管控并采取集中人员隔离的措施,对医疗体系的建设需严格遵循相关条例和法规制度,以此杜绝疫情下医疗资源的不对等及区域防范意识偏差。

2.2  集中医疗体系力量进行综合治理

对医疗体系的建设及规范,则重点在于集中医疗体系力量,最大的问题在于医疗体系往往只掌握在省会城市及部分发达地区,当疫情蔓延至偏远地区,加上偏远地区的医疗治理能力及处理方式相对而言不够成熟,往往会促使疫情扩散及暴露医疗体系的种种问题。因此需集中医疗体系及医疗资源对偏远地区的防控提供支持,同时防止外来人口进入偏远地区造成不必要的医疗资源流失,解决偏远地区医疗资源分配不均、医疗资源匮乏、重复使用等问题。

2.3  构建大数据疫情医疗体系

现如今,我国的大数据医疗体系发展还处于初级阶段,还在进行医疗体制改革,并未对大数据时代下医疗体系,尤其是疫情医疗大数据进行建设。从长远来看,疫情大数据建设的实施,对推动医疗人类命运共同体,改善城乡居民疫情医疗体系的差异化有着重大意义。

因此,笔者提出可以建设基于大数据下的大数据疫情医疗体系,采集医院、临床中心、防疫站、实验室的疫情大数据数据,通过构建疫情大数据平台进行数据清洗与分析,对数据进行区域疫情评级、疫情数据共享、疫情资源调配等智慧应用,如图3所示。

医疗数据大多数掌握在大部分医院手中,数据的封闭性阻碍了大数据疫情医疗体系的发展,逐步开放医疗大数据并及时整合医疗信息资源是未来大数据疫情医疗体系发展的大势。疫情医疗取之于社会而用之于社会,政府应该积极推动大数据疫情医疗体系的政策制定及制度化、科技化创新,更多地以政策推动大数据疫情医疗体系的创新和发展。

3  结  论

在大数据时代下,如何把握新冠肺炎疫情的数据特性,从错综复杂的数据中提炼出规律,是我们迫切需要解决的问题。文章通过系统分析新冠肺炎疫情下数据分析的方法及思路,并针对疫情医疗数据提出了问题及相关应对措施,对后疫情时代利用大数据工具如何建设新冠肺炎疫情医疗体系具有一定的现实意义。

参考文献:

[1] 张放,甘浩辰.疫情心理时空距离对公众情绪的影响研究——基于新冠肺炎疫期微博文本面板数据的计算分析 [J].新闻界,2020(6):39-49.

[2] 史本叶,马晓丽.后疫情时代的全球治理体系重构与中国角色 [J].东北亚论坛,2020,29(4):60-71+127-128.

作者简介:单佳宜(2000—),男,汉族,江西抚州人,本科在读,研究方向:软件工程。

猜你喜欢

新冠肺炎疫情数据分析大数据
新冠肺炎疫情早期科学研究对政府决策的影响
新冠肺炎疫情防控中的公共治理机制:信息、决策与执行
新冠肺炎疫区高校大学生的精神状态与行为应对
公共卫生学科作用在新冠肺炎疫情防控中的凸显
新常态下集团公司内部审计工作研究
浅析大数据时代对企业营销模式的影响
基于大数据背景下的智慧城市建设研究