APP下载

大数据背景下公共卫生人才数据应用能力培养体系的构建

2022-03-17温平镜董柏青李海马金凤罗丹陈世艺崔海辰李忠友覃光球通信作者

教育现代化 2022年6期
关键词:公共卫生数据挖掘课程

温平镜,董柏青,李海,马金凤,罗丹,陈世艺,崔海辰,李忠友,覃光球通信作者)

(广西中医药大学公共卫生与管理学院,广西 南宁)

预防医学是与临床医学、基础医学并列的三大现代医学一级学科,它以人群为主要研究对象,应用宏观与微观的技术手段,研究健康影响因素及其作用规律,阐明外界环境因素与人群健康的相互关系,制定公共卫生策略与措施,以达到预防疾病增进健康延长寿命提高生命质量为目标的一门医学科学[1]。公共卫生人才是具有公共卫生与预防医学专业基础知识和基本实践技能的人才,其有明确的职业性、实用性、实践性和高层次性的应用型人才[2-3]。以人群为主要研究对象的特性意味着公共卫生实际工作将面对人群健康大数据,因此数据挖掘和应用能力是公共卫生人才的核心能力。

一 健康大数据时代背景下公共卫生人才提升数据应用能力的急迫性

(一) 健康大数据是我国重要的基础性战略资源

“大数据”早已成为当下互联网社会的一大热词。2015年9月中国颁布的《促进大数据发展行动纲要》,2016 年 6 月颁布的《关于促进和规范健康医疗大数据应用发展的指导意见》(后文简称《意见》)两大政策文件构成了我国健康医疗大数据发展的核心战略,成为其他相关战略制定的纲领性文件,是全国乃至各省份推行健康医疗大数据最为核心的指导文件。在健康医疗领域,《纲要》重点提出要推广大数据应用,完善健康领域信息资源建设,构建电子健康档案、电子病历数据库,建设医疗健康管理和大数据应用服务体系,加强大数据基础研究,面向健康医疗等重点需求,探索建立数据科学驱动行业应用的模型。《意见》将健康医疗大数据视为国家重要的基础性战略资源,对健康医疗大数据的发展作出更具体的指示和战略指导,标志着健康医疗大数据应用发展被纳入国家大数据战略。

(二) 健康大数据时代导致公共卫生领域的深刻变革

随着健康大数据的发展,以人群和个体为研究对象的公共卫生领域发生了深刻变革,主要表现为健康相关的数据呈指数级涌现:(1)医疗数据。随着数字化医院的建设,大量医疗数据被规范化存储,把患者个体数据当作为整体进行研究时,能够挖掘出大规模公共卫生事件相关的信息。随着分级诊疗和家庭医生签约服务项目推进,家庭护理及家庭医生健康监测也将成为公共卫生数据的重要源头。(2)家庭便携式智能设备数据。家用智能健康测量装置,如智能体重秤、蓝牙血糖仪、电子血压计等,以及智能穿戴产品,智能手环、计步器、专门测量呼吸的运动背心等,都将产生大量健康数据[4-5]。(3)地理信息数据。因公共卫生研究通常具有时空性,将地理信息系统数据(地理位置、行政区域)与环境、气象、健康等公共卫生大数据结合,数据的时空性可有效体现[6]。(4)生物医学数据库和政府基础平台数据。互联网各类公共生物数据库,如NCBI,GenBank、uniprot等,提供了大量生物分子、微生物分类等数据[7]。中国最新建设的“国家人口与健康科学数据共享平台”,包含237个数据集,数据量达到49.1TB,覆盖包括生物医学、基础医学、临床、公共卫生、中医药学、药学、人口与生殖健康七大类,将带动生物医学数据资源整合与共享,为实现健康中国2030年的战略目标发挥重要作用。(5)其他数据。气象、舆情、疫情、农作物和食品安全等数据,均可用于公共卫生研究。

以上数据具有大量性、高速性、多样性、真实性和复杂性,需要具备一定数据挖掘应用能力,才能进行提取和整理,通过深入挖掘和分析获取重大疾病影响因素、流行病的传播规律等信息及其他健康/疾病发生发展的规律,以服务新时代公共卫生,保障人民健康[8]。当今公共卫生人才如不具备一定数据挖掘应用能力将难以胜任新时代公共卫生发展需求。

二 预防医学专业学生数据挖掘应用能力普遍较弱

(一) 学生数据统计应用能力普遍较弱

卫生统计学是以概率论和数理统计为基础一门课程,由于课程相对抽象,因而被认为是较难学的一门课程[9-10]。在认知方面,大多数预防医学本科生对卫生统计学课程不感兴趣,其原因可能为课程难度大,内容过于抽象有关[11]。限于师资和学时限制,统计实验课多数是“模式化”教学,教师按照实习指导使用一套规范、整齐的数据进行实验教学。在缺乏实践的教学中,学生甚至误以为实际工作中处理的数据都是整齐、规范、无缺失、完全符合统计学要求的[12]。

在本科毕业论文数据处理中可明显窥见学生数据处理能力不足,主要表现为:(1)调查表设计模式化,甚至不懂为何要设计某一问题;(2)收回调查表后遇到混杂数据、偏倚数据、离群数据时往往不知如何进行处理;(3)数据处理不规范、数据录入不对、统计方法不对、统计图表应用不恰当。面对真实场景的数据感到 猝不及防,发现自己的数据跟课堂练习的完全不一样,无知如何对无效数据、偏倚数据和无规则数据进行挖掘分析。

(二) 现有课程体系不能满足新时代公共卫生发展需求

目前我国预防医学人才国家质量标准中,要求必须安排的专业基础课和专业课有卫生统计学、流行病学、毒理学基础、环境与健康等课程,并未要求开设数据挖掘应用相应课程,其存在一定程度滞后性。经我们调查,2017年参加全国公共卫生与预防医学学科评估的34所高校中,仅7所高校将数据挖掘相关课程作为在预防医学专业的专业课程,分别是南京医科大学(医学研究的数据管理与分析)、华中科技大学(卫生统计方向:SAS基础、SPSS基础、多元统计分析、医学数据库、卫生资源统计、医院统计学)、首都医科大学(数据管理与基本统计分析)、中国医科大学(卫生信息管理学)、中南大学(数据库应用基础)、西安交通大学(数据管理与分析)、华北理工大学(健康数据管理与分析)。大部分开设预防医学专业的高校并未将数据挖掘相关课程作为专业课。2020年在《国务院办公厅关于加快医学教育创新发展的指导意见》指出,为深入推进新医科建设决定建设一批高水平公共卫生学院。《意见》中明确指出,要改革创新公共卫生人才培养模式:以公共卫生和健康问题为导向深化教育教学改革,加快构建现代化的公共卫生教育课程教材体系,将人文社科、工程科学、数据科学、信息技术等多学科知识融入公共卫生教育教学。很显然,在健康大数据时代背景下我们很多高校人才培养体系并不能满足建设高水平公共卫生学院的相关要求,相关改革亟待实施。

(三) 预防医学专业教师和学生大数据素养较弱

预防医学专业大部分教师能意识到大数据的重要性,但限于时间、精力、能力、自身研究方向等原因,除了流行病和统计学课程教师,大部分教师不愿意在数据挖掘方面进行钻研,因为其涉及到计算机信息技术、数据科学相关知识的重新学习且数据来源有限,不能进行很好的练习。预防医学专业本科生普遍认为只要能掌握统计学和流行病学就能应付将来日常工作需求,也没有更专业的老师带领其进行数据挖掘,日常学习实践中不懂大数据来源。大部分同学计算机基础薄弱,无专任教师带领对数据挖掘兴趣不足。

三 公共卫生人才数据应用能力培养体系的构建

(一) 修改人才培养方案,循序渐进增加大数据相关课程

围绕公共卫生人才数据应用能力的培养,在预防医学人才国家质量标准框架下,组织预防医学专业指导委员会专家商讨人才培养方案,在其中增加数据挖掘相关课程,如《医学数据挖掘》、《大数据处理与分析》、《Python程序设计基础》,形成切实可行的方案。根据人才培养方案修订相关课程教学大纲,以适应人才培养的需求。

(二) 灵活开展数据挖掘相关课程

根据现有课程体系,循序渐进开设数据挖掘相关课程。先将课程在公选课、限选课中开设,引导、鼓励学生选课,当课程获得较好效果时,之后在预防医学专业必修课中开设。在理论教学中运用PBL法,情景教学法增加公共卫生数据挖掘的生动案例;在实践/实验教学中增加设计性实验比例,增加对现实数据练习。

(三) 编写公共卫生数据应用案例库,通过多种形式开展案例教学

(1)从权威的中国疾病预防控制中心《中国现场流行病学调查报告》、《中华流行病学杂志》、《中华预防医学杂志》、美国疾病预防控制中心流行病学精英服务(EIS)等材料中选取有代表性的数据应用案例,形成案例库。

(2)安排有公共卫生工作经验的教师或邀请公共卫生机构专家运用PBL法,情景教学法对案例进行生动讲解,增加学生对公共卫生数据挖掘的兴趣,提升其对公共卫生数据的专业理解。

(四) 培养预防医学教师及学生大数据素养

通过以下方式提升教师及学生的大数据素养:(1)线上线下多形式参加数据健康会议;(2)浏览挖掘各种平台数据资源,如国家人口与健康科学数据共享平台,世界卫生组织卫生报告,公共卫生数据中心,中国健康与营养调查等;(3)学习、剖析公共卫生数据应用案例;(4)广泛了解学习健康大数据在公共卫生领域的应用,明确数据运用的广泛性,提升对数据挖掘的兴趣。

(五) 增设第二课堂,带领学生利用SPOC学习巩固数据挖掘+数据可视化技术

在第二课堂中,在教师带领下利用网络资源学习巩固一些数据挖掘技术,如数据开发技术(Hadoop)、分布式数据仓库(Hive)、数据库技术(NoSQL)、大数据处理技术 Spark(基础、中级、高级)、Python 编程、数据分析与挖掘、大数据可视化技术、机器学习(基础、中级、高级)等模块。利用网络下载数据进行数据挖掘的练习,鼓励其在本科阶段发表论文。

(六) 现场实践教学

(1)利用假期时间到公共卫生部门、医院、卫生健康委员会信息健康统计中心等单位/部门实习实践,实战挖掘环境与健康、疫苗、慢性病、传染病等大数据,鼓励她们发文章。(2)以赛促学,组织学生参加全国公共卫生“数据共享大赛”。(3)校企合作,使学生参与到企业资助的公共卫生大项目中,获得数据并挖掘分析数据。(4)鼓励学生申报数据挖掘相关课题,做数据挖掘相关内容的毕业论文/设计。

(七) 校地联合,培育双师型教师

建立校地联合培养的长效机制,聘请有公共卫生数据应用经验的地方专家到学校带教,同时增强教师公共卫生经验、知识、素养,鼓励学校教师利用假期到公共卫生机构轮岗。

(八) 创新考核评价机制

打破传统考核机制,在数据挖掘相关课程中主要考核学生数据发现、数据挖掘技术、数据解释能力,以报告/论文形式完成学期终评。具体如下:(1)正式课堂和第二课堂参与度、数据挖掘热情、大数据素养、假期实习实践等平时表现占终成绩10%。(2)数据挖掘理论考试,主要检验学生数据挖掘的理论,占终成绩20%。(3)数据挖掘技术占终成绩30%,给出真实公共卫生数据,以不同方式/模型对数据进行挖掘分析,主要检验学生数据挖掘技术掌握程度。(4)数据挖掘论文占终成绩40%,要求学生自行到相关数据平台挖掘大数据资源,并运用合适的数据挖掘技术进行数据处理、数据可视化、数据解释,最终形成论文/报告,鼓励学生将论文发到高水平杂志。

四 结语

在健康大数据时代背景下公共卫生领域数据呈指数级增长,对其进行挖掘分析并有效应用可发现疾病发生发展规律和健康促进因素、助力医药生物技术发展,为宏观卫生决策提供技术,提升公共卫生应急水平[13]。 但目前现有教学限制、预防医学专业国家质量标准滞后、教师及学生大数据素养较弱、缺乏数据挖掘实践机会等因素影响,目前大部分公共卫生人才大数据挖掘应用能力普遍较弱,尚不能有效利用这些大数据,因此急需培养出医学基础扎实,公共卫生素养高,数据挖掘应用技术强的复合型公共卫生人才。要培养出合格的具备数据挖掘应用能力的公共卫生人才需要在教育部顶层设计之下,融合数据科学、信息学相关技术改革人才培养方案;需要高等院校解放思想,真正地以学生能力培养为中心,大胆进行教学改革;需要数据资源平台大力支持;需要联合学校、公共卫生及其他医疗机构、社会企业及师生共同努力。具备数据挖掘应用能力的公共卫生人才才能适应甚至推动现代公共卫生的发展。

猜你喜欢

公共卫生数据挖掘课程
数字图像处理课程混合式教学改革与探索
探讨人工智能与数据挖掘发展趋势
软件设计与开发实践课程探索与实践
为什么要学习HAA课程?
《首都公共卫生》征订启事
A—Level统计课程和AP统计课程的比较
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
公共卫生服务怎加强
公共卫生监督不是“陪衬”