基于Caché数据库和ETL过程的医疗质量辅助决策方法研究*
2015-07-23廖茂成李韶朗范世平龙桂芳
◆刘 蔷 廖茂成 李韶朗 范世平 龙桂芳
责任编辑:姚 涛
医疗质量与广大患者的生命健康息息相关,提高医疗质量、加强医疗质量管理是医院工作的核心和永恒主题。然而由于医疗质量管理涉及的范围广、因素多、过程长,环节复杂多变等原因,医疗质量管理已成为医院工作的重点和难点[1]。因此,在加强医疗环节质量控制的同时,开发医疗质量辅助决策系统对提升医疗质量具有特殊的意义[2]。
我们尝试与医院信息管理系统对接,利用 ETL过程对 Caché数据库中的医疗数据进行提取、转换和加载。构建医疗质量辅助决策平台可以实现对医疗质量的持续改进。在进行临床工作和科研分析时,医疗质量辅助决策平台不仅可以进行总结回顾性分析,也可以进行前瞻性分析,并整合来自不同系统的数据,以实现更大范围内的数据分析,而且数据的展现形式灵活多样,包含大量丰富、直观的统计图形。
1 技术架构
1.1 Caché数据库
Caché数据库支持 ODBC(ODBC即开放数据库互连,Open Database Connectivity)标准接口,易与其它系统进行数据交换[3]。同时Caché数据库亦可以将数据输出成文本文件格式以便其它系统访问调用。Caché数据库的多维结构不仅和XML(即可拓展标记语言)结构一致,并且支持 Caché对象和XML之间的双向转换,包括自动生成 DTD(即文档类型定义)文件[4]。这样就为不同系统之间的耦合提供了极大的便利。
1.2 ETL 工具
ETL(Extract-Transform-Load的缩写)是数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程[4]。它是构建数据仓库的重要一环,用户从数据源抽取所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。
2 平台建设
粤北人民医院基于Caché数据库的医院信息系统涵盖了患者的健康档案、门急诊就诊记录、住院诊疗等所有医疗信息,有信息系统应用基础和相对丰富的医疗历史数据。根据原卫生部制定的《三级综合医院医疗质量管理和控制指标(2011年版)》,我们将住院死亡类指标、重返类指标、医院感染类指标、手术并发症类指标、患者安全类指标、医疗机构合理用药指标、医院运行管理类指标[5]等7类指标分类作为分析依据。本研究运用上述7大指标,多角度、多层面地综合分析医院在某段时间内医疗环节的质量控制水平,通过医疗质量辅助决策系统提高医疗质量。
在构建数据库接口平台时,如何从常规指标、电子病历、手术麻醉系统、临床路径、院内感染、合理用药等应用系统中分离、提取有用的数据是工作重点。
根据系统总体功能设计,ETL需要将各项指标涉及的相关信息从多个应用系统合并到OLAP系统,并甄选出与OLAP系统无关的数据列,将这些数据列排除在合并过程外。合并过程主要解决不同数据源系统间的编码差别问题,且能将源系统中使用不同数据类型存储的数据转换成决策支持系统中使用的单一数据类型。
2.1 辅助决策系统系统框架
医疗质量辅助决策系统体系架构如图1所示。其包括基于各应用系统的医疗信息数据源、ETL工具、数据仓库、数据集市、数据分析展示工具等。
2.2 建立ELT过程组件模块
ELT过程负责将数据从 HIS、LIS、PACS等应用系统的数据库中抽取、转换和处理成医疗质量辅助决策系统数据仓库需要的格式和形态,并在规定的时间输入到数据仓库以及数据集市中。这个过程比较繁杂,是整个医疗质量辅助决策系统建设过程中工作量最大的一部分。ETL整体流程图见图2。
(1)数据抽取。必须根据已确定的主题,从各应用系统的数据库中抽取相关数据到医疗质量辅助决策系统数据仓库。同时,在设计时要解决以下问题:源数据库与目标数据库的数据格式是否一致?要访问源数据库的哪些文件和表?要提取哪些字段,抽取记录的条件是什么?目标数据库中的表结构是什么?
(2)数据转换。数据转换是为了处理数据源之间的不一致性。数据名称及格式必须统一,当系统数据仓库中存在源数据库中不存在的数据时,需要创建新的数据逻辑视图并进行转换。
图1 医疗质量辅助决策系统框架
图2 ETL整体流程图图
表1 部分主题及子功能菜单列表
(3)数据清洗。是指对进入系统数据仓库的数据进行全面检查,将差错降到最低。
(4)数据装载。即将数据装入到系统数据仓库,主要包括确定数据装入次序、载入初始数据等。
2.3 主题架构及功能菜单
以度量和维度为考察依据,设计了数据仓库关系数据库的二维表结构。涉及的度量数据包括:住院死亡人数、重返类数值、医院感染类数值、手术并发症类数值、患者安全类数值、门诊住院的处方数、抗菌药物用药、外科清洁手术预防用药指标、医院运行管理指标等。考察的维度需要从产妇、新生儿、手术患者、重点疾病患者、恶性肿瘤术后患者等方面进行。部分主题及子功能菜单见表1。
以住院死亡情况指标为例,该指标的功能包括:(1)住院总死亡人数。产妇、新生儿、手术患者、重点疾病患者、恶性肿瘤术后患者死亡人数趋势分析;(2)住院人数。住院总死亡人数,产妇、新生儿、手术患者、重点疾病患者、恶性肿瘤术后患者死亡总体指标的环比、同比分析。
3 实践应用
本研究介绍了医疗质量管理辅助决策系统的实施过程,针对医疗质量管理控制指标和外部数据源的特点,通过Speedminer 7.1开发工具的构件式的系统结构,使得程序和组件都能灵活扩展,以适应数据仓库的需求和技术变化发展。
医疗质量管理辅助决策系统运行过程中,ELT功能模块表现出较好的稳定性。用户可以通过拖拽的方式快速进行多方位、多角度、连续性和历史性的分析。并能进行多维度交叉分析,即对数据在不同维度进行交叉展现,进行多角度结合分析,弥补了独立维度分析时无法发现的一些问题。同时呈现可视化,即系统设计多种可视化呈现方式,如数据表格、图表、警报列表、关键性能指示器等,方便管理层进行管理与决策[6]。但也存在一些不足:(1)不能自动抽取半结构化的源数据;(2)当源数据发生变化时,需要手动更新源数据库中的数据。
下一步工作包括:(1)完善半结构化源数据的自动提取方式;(2)当目标数据库和源数据库的数据发生变化时,索引库能及时自动地更新。
[1]中国医院协会.单病种质量管理手册[M].北京:科技文献出版社,2008:12.
[2]陈 敏,曾宇平,王春容.基于医疗信息技术的医疗质量管理研究[J].中国医院管理,2011,31(2):52-54.
[3]InterSystems公司.Caché技术手册[P].InterSystems公司北京代表处,2006.
[4]Orli RJ,Sartos F.Data Extraction,Transformation,and Migration Tools[Z].Distributed Kismet Analytic Corp,1996.
[5]卫生部办公厅.三级综合医院医疗质量管理和控制指标(2011年版)[Z].卫办医政函〔2011〕54号,.2011-01-14.
[6]陈天服,张武文.临床决策支持系统在质量管理中的作用[J].国外医学:医院管理分册,1999(3):117-118.