APP下载

基于数据中心的医院数据统一上报平台设计与应用

2020-11-30奈存剑任宇飞

科学与信息化 2020年30期
关键词:数据采集数据中心

奈存剑 任宇飞

摘 要 为解决医院存在的数据上报模块分散、重复工作等问题,本文提出了基于数据中心的统一数据上报平台,主要从系统设计和技术实现上进行了阐述,设计了医院数据统一上报平台数据库模型和医院数据统一上报平台模型,实现各系统上报统一入口,具有上报数据方式多样化、上报向导人性化、数据校验准确化等特性,优化了数据上报流程,为创建优质医院工作提供了客观、准确、可追溯性的质量数据来源。

关键词 数据中心;数据采集;统一上报平台

Design and Application of Unified Reporting Platform for Hospital Data Based on Data Center

Nai Cunjian Ren Yufei

First-authors address Tongji Hospital, Tongji Medical College, Huazhong University of Science and Technology, Wuhan, Hubei, 430030, China

Abstract In order to solve the existing hospital data reporting module dispersion, duplication of work and other issues, this paper report based on a unified data reporting platform, mainly elaborated from the system design and technology, the design of the hospital data unified reporting platform database model and hospital data unified reporting platform model, the achievement of a unified reporting system entry, with diverse data reporting mode, reporting wizard user-friendly, accurate verification of data and other characteristics, to optimize the data reporting process provides an objective to create high-quality hospital and accurate traceability of quality data sources.

Key words Data center; Data acquisition; Unified reporting platform

前言

隨着医院信息化的不断发展,医院通过多年的信息化建设建立了依托信息化基础的业务处理系统,实现了从医疗业务、物资管理、成本核算和客户服务的信息化,并积累了大量的业务数据,这些数据主要分布在HIS、EMR、LIS、PACS、心电、内镜、病理以及病案等系统中[1]。然而随着医疗卫生行业信息化的飞速发展,医疗卫生部门也不断加大对各医疗机构的监管力度,各级医疗卫生部门也都需要医疗机构按照不同的要求、方式报送各种报表或数据,例如病案科、统计科、药学部、护理部以及物价科等会按照不同的要求来上报数据。另外,各科室也加大了对科研数据的需求,需要提供相关临床数据便于支持科研工作。

针对目前医院存在的数据上报模块分散、重复工作等问题,以及医院数据中心的建立[2],设计并实现一种基于数据中心的统一数据上报平台,可以将所有业务系统数据集成在一起,通过统一用户管理平台来管理上报/查询权限,实现各系统上报统一入口,具有上报数据方式多样化、上报向导人性化、数据校验准确化等特性,系统将帮助主管部门实时掌握数据上报状况,减少数据上报时间。

1系统设计

医院数据统一上报平台,是立足于解决医院向医疗主管部门上报汇总数据统计分析和文件传输的系统,自动及时、完整真实地完成数据对接工作,利用规范化的报表展现汇总、规则校验、统计分析、打印输出等功能搭建一个高质量的数据平台。其设计原理也是整合了众多报表和数据分析应用,把占用大量存储空间的数据价值挖掘出来。

1.1 医院数据统一上报平台数据库模型研究

在构建数据统一上报平台之前首先要建立数据源,由于医院的业务数据可以分为医疗数据、财务数据、后勤管理、科研数据、病案数据等,这些数据均来自不同的系统,如果直接通过对不同系统所产生的数据进行统计,数据比较混乱,且数据格式也不同,将数据展示给医院领导层的时候,只能通过数据展现,而不能通过图表等形象化的形式来展示[3]。因此首先需要对医院各种业务数据进行预处理,并进行抽取转换,并根据医院上报数据的指标,设计相应的数据库结构,以规范化保存医院的各种上报数据,并自动从医院业务数据库中获取数据并进行预处理后保存在医院数据统一上报平台数据库中。医院数据统一上报平台数据库的设计主要包括如下几个方面:

(1)数据字段对照设计:主要是根据上报要求设计数据库表字段,提供文件导入功能,格式包括CSV、DBF、XLS以及XLSX等,并根据文件字段生成数据表。

(2)标准对照管理:根据上报要求,实现我院本地标准与上报标准的对照工作,包括数据标准的新增、维护、查询。

(3)数据填充:主要是将各业务的数据填充到新建的中间表中,并进行字段对应。

1.2 医院数据统一上报平台模型研究

对医院各数据源进行处理后,形成了医院各业务上报数据的数据集,需要对各数据集进行数据转换、规则校验以及隐私信息屏蔽。

(1)患者主索引建立:患者主索引(Main Patient Index,缩写MPI)是指病人的身份的唯一识别以何种方式在信息系统中表达,MPI是医疗数据可以共享的基础。主要元素信息应包括:姓名、性别、出生日期、民族、证件类别、证件号码、住址、电话等。

全院患者主索引系统(EMPI)用于全院范围内患者基本信息索引的创建、搜索和维护,可以智能地协助医疗人员对病人有效地进行搜索。通过建设主索引(EMPI)来识别、匹配、合并、取消重复的数据,净化病人记录,利用主索引可获得完整而单一的病人视图。EMPI会为每个病人创建一个唯一标识符,并和相关系统的医疗记录的标识之间建立映射,以确保同一病人分散在不同系统中的医疗信息可以完整和准确地关联、整合在一起。

(2)数据转换:主要是根据上报要求,将医院本地化非标准数据项按照标准对照对非标准数据进行本地数据标准化转换工作,包括本地数据标准转换、标准数据存储。

(3)规则校验:主要是利用上报数据的规则校验我院数据,对校验不通过的数据进行提示处理。

(4)隐私信息屏蔽:指对患者个人信息中的敏感信息(如:患者姓名、身份证号、电话、地址等)通过脱敏或加密规则进行数据的变形,实现敏感隐私数据的可靠保护,同时依然保持其他数据的格式和属性,保证其可识别性和可用性。参照美国HIPAA法案对于患者隐私处理的要求,针对以下常见的敏感字段进行脱敏或加密处理:患者姓名、出生地、工作单位、工作单位及地址、工作电话、身份证号、家庭电话、现住址、户口地址、联系人姓名、联系人地址、联系人电话等进行屏蔽处理,避免患者隐私信息泄露。

(5)上报数据导出:根据上报要求自动生成CSV、DBF、XLS以及XLSX等格式的数据文件,可以设置成立即导出或定时导出。

1.3 数据访问控制研究

需要对上传数据的访问权限做全面的控制,不同级别的用户的权限不同,登录平台看到的数据亦不同。除此之外,还需制定一系列的管理手段管理,包括但不限于以下内容:

(1)单独用户群组、角色及权限管理;

(2)权限细化至每个人每个字段;

(3)用户无法自行注册,必须由管理员开通;

(4)平台必须先登录再使用;

(5)用户账号具有时效性,过期无法继续登录使用。

2系统实现

2.1 数据采集

采用ETL数据抽取工具对数据进行抽取与支持。该工具内置了大量数据采集、数据处理所需的控件,采用分布式部署,利用多主机集群同时并发处理大量数据采集和数据装载任务,将现有Oracle、SQL Server等各类数据按数据标准进行清洗、转换,并加载到新的平台[4]。按统一的代码标准,整合数据类别,形成数据齐全、标准化、规范化的数据集市。同时ETL支持各类常用数据库及MDB、XML、XLS、CSV、TXT等数据的全量与增量实时抽取,将各种源数据装载到上报数据平台上的基础库中。

2.2 数据整合与清洗

为了解决“脏数据”的数据质量问题,还会在数据转换步骤后加入数据清洗功能。在数据抽取过程中所有的代码转换都通过代码转换表进行转换。当在代码转换表中找不到该代码时,该条数据即为“脏数据”。当确定数据为“脏数据”时需要将該信息记录在“脏数据”表中。

ETL 抽取时“脏数据”处理流程:

(1)判断是否为“脏数据”,即在代码转换表中找不到新代码。

(2)判断该记录在“脏数据”表中是否存在。判断条件为代码种类 ID、业务系统 ID、源表名、源字段名,源 ID 全部相等。如果存在跳到第 4步。

(3)将“脏数据”插入到“脏数据”表中。数据插入后直接到第 6 步。

(4)新“脏数据”的时间戳的值与旧“脏数据”时间戳的值进行比较。如果大于则直接跳到第(6)步。

(5)更新新时间戳的值到“脏数据”表中。

(6)“脏数据”处理结束。

WEB 界面“脏数据”处理:

“脏数据”可以通过 WEB 界面展现出,由数据管理人员进行处理决定。分为两种情况:第一种是“脏数据”确实为“脏数据”,则维护该数据抽取相关参数文件,将该“脏数据”排除。另一种为该代码为有效代码,此时需要在 基础库中相应的编码表中新建一个编码,并在代码映射表中插入相应的记录。

2.3 数据导入与导出

(1)提供CSV、DBF、XLS以及XLSX格式文件导入功能,并根据文件字段动态生成数据表;

(2)根据上报要求将医院本地化非标准数据项按照标准对照对非标准数据进行本地数据标准化转换工作,包括本地数据标准转换、规则校验以及敏感信息处理等;

(3)根据上报要求,基于WEB界面可配置定时任务立即生成或定时生成CSV、DBF、XLS以及XLSX等格式的数据文件;

(4)数据生成之后可进行权限控制,指定相应工作组查看权限。

3结束语

医院数据统一上报平台的开发应用避免了人工手动数据上传遇到的各种问题,优化了数据上报流程,提高了数据准确性和真实性,提升了医院精细化管理水平[5],实现了医疗质量与安全持续改进,为创建优质医院工作提供客观、准确、可追溯性的质量数据来源。

参考文献

[1] 吴正一,崔迎慧,陆耀,等.以临床数据仓库为核心的医院大数据平台构建[J].中国医院管理,2015,35(11):13-15.

[2] 奈存剑,任宇飞,李金,等.医院临床数据中心建设与应用[J].中国医院管理,2014,34(5):53-54.

[3] 李汉民,商建国,肖辉.区域卫生信息上报平台的体系架构研究[J].中国数字医学,2017,12(8):54-56.

[4] 王少波,黄玉成,胡建中.医院信息数据统一采集平台建设实践[J].中国数字医学,2017,12(12):75-77.

[5] 周阿华,童俊东,程超,等.基于运营数据中心的医保管控平台设计与实现[J].中国医院管理,2018,38(11):61-63.

猜你喜欢

数据采集数据中心
关于间接蒸发冷机组在数据中心中应用的节能分析
2018年数据中心支出创新高
北京科创新型云数据中心
2017第十届中国数据中心大会榜单
CS5463在植栽用电子镇流器老化监控系统中的应用
大数据时代高校数据管理的思考
基于广播模式的数据实时采集与处理系统
通用Web表单数据采集系统的设计与实现
基于开源系统的综合业务数据采集系统的开发研究
新一代数据中心建设有“书”可循