APP下载

基于知识可视化的卫生应急建议提案分析

2022-07-06傅云翔赵静巢宝华张枫怡沈慧煌马涵彬杨立津

中国社会医学杂志 2022年3期
关键词:词频主题词公共卫生

傅云翔, 赵静, 巢宝华, 张枫怡, 沈慧煌, 马涵彬, 杨立津

2019年末在全球范围内大规模暴发的新冠肺炎疫情使经济和社会遭受了巨大损失与挑战[1]。2020年6月,习近平总书记在全国专家学者座谈会上提到:当前,我国疫情防控工作已经进入常态化,要加强前瞻性谋划和规律性思考,为统筹好疫情防控和经济社会发展工作、加快恢复生产生活秩序、早日取得抗击疫情战役全面胜利作出贡献[2]。为进一步贯彻加强前瞻谋划要求,深入了解民情,挖掘热点问题,本研究利用知识图谱对建议提案文本进行分析。建议提案是人大代表反映人民意见和要求的有效手段,反映了代表民意、整合民意、落实民意的效果。政协提案反映人民民主特征,它从不同阶层、界别、行业、团体等角度体现政治协商和民主监督。建议提案内容丰富,涵盖面广,文本容量大,但短时间内无法对发展动态、不同领域间的联系进行掌握和高效处理。知识图谱作为文献分析手段,具有处理文献量大、直观可视化、分析角度多样、数据分析结果可信度高等优势特点。将可视化处理和聚类分析运用在卫生应急管理建议提案文本中,意在拓展该领域研究视角,丰富政策研究方法,直观清晰了解代表委员们在卫生应急管理领域提出的重点热点问题,为政府在该领域快速准确找出问题、做出决策提供导向。

1 资料与方法

1.1 资料来源

研究数据自国家卫生健康委员会官网的公开信息中获取建议提案编号,依托相关课题并通过专家咨询筛选得到2020年5月21—28日全国两会期间以卫生应急管理和重大疫情防控工作为主题的建议提案总数392件。

1.2 研究方法

1.2.1 词频分析法词频是指一定范围的语言材料中词的使用频率。词频分析法主要利用文本中可以表示或展露出核心内容主题词的出现频率来确定这一领域的研究热点和发展动向[3]。优点在于可以通过对词汇出现频次的定量统计,在一定程度上克服主观偏见和个人经验主义,实用性强,并且在结果的呈现上相对准确客观,适用范围广[4]。研究主要利用ROSTCM 6软件完成词频分析,ROSTCM 6是武汉大学沈阳教授研发以辅助社科研究的计算软件。该软件可以实现分词、词频统计、英文词频统计、流量分析等一系列文本分析。

1.2.2 VOSviewer可视化分析法可视化是把信息、数据转化为可视的表示形式的过程。VOSviewer是一款基于JAVA的软件,由荷兰莱顿大学科技研究中心(Centre for Science and Technology Studies,CWTS)的van Eck和Waltman开发,适用于一模无向网络的分析,通过知识信息的关系来构建可视化分析,展现该领域的结构关系,在共现网络聚类以及密度分析方面功能强大,其突出特点是可视化图像展示能力强,适合大规模数据,但是目前主要面向文献数据,较少应用于政策文本研究领域[5]。

2 结果

2.1 高频词、共现词凸显热点指向

将上述卫生应急相关建议提案原文进行合并,将文本干扰信息、影响结果的文本内容进行筛除,运用TF-IDF算法、利用ROSTCM6软件共提取主题词16 328个,剔除无意义词后,自主筛选纳入频次大于50个的14 208个主题词,5 083个共现词对。词频排序中,“疫情” “应急” “公共卫生” “防控” “物资”位列词频排序前5名,在排名前20位的主题词中,与此次新冠肺炎疫情直接相关的有“疫情” “应急” “防控” “物资” “突发” “新冠” “肺炎” “突发事件”等8个主题词。共现词对在词频排序基础上对同一特定语段中的词对进行计数,突出表现主题词间的关系紧密程度。共现词对排序结果表明,“疫情-防控” “公共卫生-应急” “应急-物资” “储备-物资” “公共卫生-突发”位列共现词对排名前5,几乎排名前20的所有词对都和卫生应急直接相关,使对应主题清晰化、具体化。见表1。

2.2 聚类体现领域热点结构

图1中,点的大小代表主题词出现的频次,点越大代表主题词出现的频次越高,点间连线的粗细和复杂程度表示主题词之间的共现,反映出主题词的联系,点与连线的不同颜色(绿色①、黄色②、蓝色③、红色④、紫色⑤)区分了聚类结果,可以看出分为以主题词“应急、疫情、传染病、信息、健康”为核心的五个类团,分别对应了由2019—2020年度卫生应急管理体系中的不同层面,同时,能够看出代表委员们在此领域围绕新冠肺炎疫情防控和卫生应急体系建设做出了高频率多领域的探讨和提议。见图1。

3 讨论

3.1 卫生应急和疫情防控成为建议提案高频主题,主题内聚类清晰

在聚类视图中“公共卫生”占据中心位置,说明公共卫生多处在节点中介部分,大多数建议提案都与公共卫生相关;但“疫情” “应急”的词频数明显高于“公共卫生”,通过专家咨询得知在2020年度全国两会卫生建议提案中,受新冠肺炎疫情影响,“疫情防控”与“卫生应急管理”较往年建议提案数量有大幅提升,成为2020年度卫生领域热点主题。通过聚类图不同类团关键词提取与建议提案文本归纳可以得出:卫生应急储备与顶层设计、疫情防控政策与法制建设、传染病防治与中医药应用、卫生应急平台建设与大数据应用、卫生应急知识宣教与人才培养是代表委员在卫生应急领域关注的五个热点问题,指向明确。

3.2 卫生应急热点涵盖面广,代表委员关注点多元化、具体化

在卫生应急储备与顶层设计方面,代表委员重点关注的内容和问题有:一是日常的应急防疫物资储备不足,储备资金规模无法满足需要;二是亟待建立报损核销补偿机制,承储企业面临的报损压力大[6],仓储水平和内部管理水平不高;三是对省级医药储备管理的指导力度不足。建议一是加强对应急储备资金的保障,通过建立应急基金和实施灾害保险等方式,实现对应急储备资金动态化管理;二是完善卫生应急储备的核销补偿机制,建成多方一体化应急储备体系,减轻应急物资的仓储报损压力;三是建设网格化布局的防疫物资储备中心库,实行轮转更新、动态管理;四是合理规划防疫物资储备结构及规模,中央、地方财政应完善防疫物资储备专项,提供合理有效指导[7]。

在疫情防控政策与法制建设方面,代表委员重点关注的内容和问题有:一是对于传染病的监测、发布、预警,不同法律的规定不统一。《突发事件应对法》和《传染病防治法》都存在传染病疫情公布需要遵循“准确” “及时”的原则,但是对标准细节,并未说明。二是疫情信息发布主体有待明确统一。例如,在《传染病防治法》中,传染病和相关疫情的发布主体只限于国务院卫生行政部门及被授权的省、自治区、直辖市政府卫生行政部门。但根据《突发事件应对法》,县级以上地方政府都有责任在其行政区域内向公众发布突发事件预警信息[8]。三是野生动物保护法及其相关配套规定未能准确体现对不同类别野生动物分类保护和管理的理念,易对人畜互传的传染病防控造成隐患。建议一是完善《传染病防治法》细节标准,明确监测预警信息发布的准确、及时等原则;二是加强风险研判能力和防范意识,对于特殊紧急情况设定“免责条款”;三是完善我国野生动物保护法以及配套措施,加强公共卫生环境法治化治理,健全公共卫生环境法律体系[9],建立跨部门、多领域的合作机制。

在传染病防治与中医药应用方面,代表委员们在此领域的重点关注内容和问题有:一是我国部分地区传染病救治体系基础设施薄弱,配备的基础设施标准低;二是中医药治疗技术在卫生应急管理体系中参与力不足,在应对突发公共卫生事件,治疗和预防上过度依赖现代医学,缺少中医药的参与;三是对于疾病防治技术的应急储备机制不完善。建议一是重视贫困地区传染病救治体系建设,在着手大力扶贫的同时,提升重大传染病救治能力;二是应中西医发展并重,在卫生应急网络中强化中医药治疗的参与,发挥中医药治疗的优势;三是做好技术储备,完善快速研发机制、应急技术审批的相关规定以及技术产能储备。

在卫生应急平台建设与大数据应用方面,代表委员重点关注的内容和问题有:一是中央、地方之间的信息直通机制尚未完善。“层层上报、逐级审批”的规定影响了对突发事件的应急响应速度,难以实现“有效预防、及时控制”的目的。二是疫情防控期间,各省市卫生健康行政部门在官网或相关信息平台上,发布区域内新冠疫情信息存在术语使用不统一或不规范的问题,影响地区间疫情风险的研判,不利于防控工作的开展。三是数据协同问题。传染病监测和突发公共卫生事件报告等信息系统相对封闭运行,局限于疾控系统内部掌握和使用,部门间数据没有实现互联互通、对比分析,海量数据无法在第一时间清洗应用,难以第一时间提供决策支持[10]。建议一是落实“信息直通机制”,代表提出:卫生应急管理部门在遇到突发重大公共卫生事件时,除了将工作信息上报外,还应将重要信息直接上报给国务院卫生行政部门的卫生应急办公室或相关部门。二是建立发布信息的评估机制,要求术语使用规范和统一,公布信息准确、详细、充分,公布内容因地制宜、与时俱进。三是着力规范系统标准。规范突发公共卫生事件信息化平台的建设标准,打破中央与地方的公卫数据平台和疫情防控系统数据共享壁垒,并综合应用GIS和5G等新技术,方便数据动态更新、应急响应等功能应用[11]。

在卫生应急知识宣教与人才培养方面,代表委员重点关注的内容和问题有:一是未充分利用科普宣传的先行性作用,科普活动缺乏组织规划,宣传方式缺乏实效性;二是2020年受制于新冠肺炎隐匿、易感、易变异等因素,部分群众特别是患者出现焦虑、恐惧、孤独等心理行为问题,对心理健康的援助不充分;三是公共卫生专业人才缺乏,社会认同感不强,在疫情防控中,公卫人才发挥的作用不明显。建议一是搭建应急科普平台,完善应急科教宣传。政策上建设应急科普工作机制,建设应急科普专家库,发挥专家的专业主体作用,将科普宣传与公共媒体相结合,确保及时高效[12]。二是优化心理救援调适方式方法。在突发公共卫生事件发生时,及时把控不同类别人群的心理动态,准确识别心理健康高危人群,避免群体心理危机事件等极端事件发生,做好事后处理。三是定向选择和培养公共卫生专业人才,树立权威性,加强传染病疫情防控国家人才队伍建设。

4 结论与展望

本研究通过词频分析、聚类可视化对建议提案文本进行词汇信息拆分和热点提取,共发现卫生应急领域以主题词“应急、疫情、传染病、信息、健康”为核心的五个问题,涵盖卫生应急储备与顶层设计、疫情防控政策与法制建设、传染病防治与中医药应用、卫生应急平台建设与大数据应用、卫生应急知识宣教与人才培养等方面。并有针对性地提出和细化应急储备动态管理,完善核销补偿机制;推进修法进程,完善公卫法律体系;重视贫困地区疾控,中西医发展并重;完善信息直通渠道,强化大数据平台建设;搭建应急科普平台,培养卫生应急人才等建议。研究发现,建议提案文本的可视化应将计算模型与文本精确融合,进一步加强实证研究,将知识图谱等文本挖掘及文本可视化技术广泛应用于时效性较强且信息量大的政策文本或群众诉求中,利于在短期内找到政策热点走向,便于及时研判,做出合理决策。本文也有一些不足之处,VOSviewer软件作为文献计量软件性能强大,可以查看文献与关键词时间序列标签、作者合作网络等,但用于单纯的大文本数据其功能除查看词对邻接与聚类情况外,有待进一步开发利用。本研究对政策文本及相关数据绘制知识图谱只能看出该领域主题共现联系以及聚类结果,无法单纯通过可视化结果针对某一类别的问题因果和发展进行深入研究,未来应在运用知识图谱的基础上,辅助运用政策分析工具等,对领域内深入分析;本研究由于数据限制,未能获得不同年份或不同时间节点的文本数据,因此无法进行时间序列比较与分析,后续研究可基于此改进。

猜你喜欢

词频主题词公共卫生
广西医科大学公共卫生与预防医学一流学科建设成效
智能传感器的智慧战略,新技术创造新价值
词汇习得中的词频效应研究
中国首个P4实验室:服务全球公共卫生安全
汉语阅读中词频与注视时间、跳读的关系
词频,一部隐秘的历史
取消公文主题词的真正原因是什么?
汉语音节累积词频对同音字听觉词汇表征的激活作用*
公文主题词消失的原因浅析
公共卫生