APP下载

基于医院数据中心的标准化数据上报应用*

2022-02-07徐骁胡外光陈敏莲

现代医院管理 2022年6期
关键词:字典校验病案

徐骁,胡外光,陈敏莲

(湖南省儿童医院,长沙市 410007)

信息数据的开发与利用是国家信息化的核心任务,医疗行业中,国家、省市级平台为了加强对基层机构的运营情况、行业数据的把控,研究制定了不同目的数据采集上报任务,要求各级医疗机构按时按质完成上报,这部分工作现已成为广大医疗机构日常工作中的重要组成部分。不同任务所需的数据集标准各异、频率不同、内容广泛且对数据质量均有严格要求,日益累积的上报工作逐步成为相关工作人员的负担,急需利用信息化技术手段改变现状、提升效率。

在众多数据上报任务中,采集的业务数据往往无法直接满足接口文档的要求,需要花费大量时间整理接口、核对数据,直接影响数据上报的工作效率。如相关研究中,发现影响上报数据质量的主要原因集中在错填漏填、字典版本串用等方面,加强首页填报约束、优化逻辑校验规则是主要应对措施[1-2]。郭亚丽[3]将影响上报数据质量的主因作了汇总并从人员、管理、系统三方面进行分析,认为临床疾病诊断名称的错用、院内扩展编码的错误匹配是加重上报人员工作负担主因。在提升数据质量的相关研究中,指出除了完善系统编码库配置、加强逻辑校验等手段外,还需由医疗机构领导层牵头指挥,定期开展数据质量专题培训,加强医师、编码员等对上报任务的文件解读与业务水平能力[4]。此外,医疗机构在落实开展各类数据上报任务的过程中,也暴露出电子病历、医嘱等业务系统中存在的数据缺陷或约束规则。通过分析研究上报任务过程中反馈的错误信息,为完善业务系统、制定相关质控规则提供依据,实现正反馈进一步提升临床数据质量[5]。

1 建设背景

湖南省儿童医院大小各类业务信息系统繁多,不同系统间接口存在大量冗余且难于维护,一旦需要上线新的功能模块或业务需求,则又需建设部署新的接口满足使用。为改变这一现状,现已完成医院信息平台的相关建设工作,打造以诊疗流程为核心的体系结构,完成了标准化的接口规范改造与定义、降低接入冗余和系统运行风险、优化清理系统结构,并实现了信息系统运行的可视化管理。依托医院建设的数据集成平台,众多业务系统纳入管控、利用标准化封装服务和消息总线进行通信实现业务交互。开展临床数据的抽取、清洗、归纳、标准化映射值域等工作,并完成了对医院所有核心业务系统字段的梳理、对标。利用变化技术捕捉(Change Data Capture,CDC)实时增量同步业务数据至临床数据仓库(Clinical Data Repository,CDR),通过抽取转化加载过程(Extract Transform Load,ETL)结合数据同步技术实现数据中心数据的实时采集及标准化转换,逐步完成医院的大数据中心的建立工作。

信息平台的建设除了为各个业务场景、信息系统提供标准化的接入解决方案外,还为医院的运营管理、系统集成、支持决策提供了一系列应用。例如,商业智能(Business Intelligence,BI)决策支持系统、科研服务平台、患者360全息视图、统一数据上报平台等,如下图1所示。

2 标准化数据上报平台概述

数据上报平台作为数据中心的一项关键性应用,底层数据源自CDR的主数据管理平台(患者主索引、临床术语、标准字典库等)其标准化程度高,结合平台本身的术语管理与值域映射功能,提供了一套流程化的处置方法应对各类数据上报任务,在保证数据的统一性与准确性的同时提高上报效率。平台功能模块划分如下:基础配置与数据上报、作业调度与上报任务管理、综合查询与数据校验、映射管理及审核等内容,下文就上述功能模块进行介绍。

2.1 基础配置与数据上报

基础配置功能负责对如操作数据存储库(Operational Data Store,ODS)、CDR、数据上报等数据库的基础信息进行配置,如数据库类型、IP地址、端口号、数据库链接、用户名密码等。各类上报任务的基本信息、上报方式、审核设置功能也在该模块中完成配置。不同的上报任务中的主题内容、字段类型、校验规则往往存在差异。为了方便管理上报任务同时满足高复用性,数据上报功能模块将任务的建立编辑划分为两个部分:业务域数据模型创建与模型数据脚本抽取。建立业务域数据模型,即按照数据上报任务提供的标准接口文档建立模型内容。任务模型中的字段内容参照文档要求定义字段名称、数据类型、非空校验等内容,其中标准转化功能可以直接选择所需的国临诊断字典并实现自动映射,解决了字典版本间切换困难等问题。考虑大部分数据上报任务中存在相同的内容,如全国三级公立医院绩效考核病案首页采集、全国医疗服务价格和成本监测与研究网络、国家儿童肿瘤上报等任务中,都需对患者的病案首页进行采集,其中需要上报的患者信息、入出院诊断、手术信息内容重复。故为提高数据复用性,在业务域建模时往往为相同的医疗主题数据建立通用中间库,如医院质量监测系统(Hospital Quality Monitoring System,HQMS)中间库。各类上报任务业务域模型只需从中间库的HQMS_ZD(诊断)、HQMS_SS(手术)中提取诊断、手术信息即可,避免了重复采集、极大的缩短了任务上报时间。

数据脚本抽取功能提供了基础结构化查询语句的编辑窗口,利用ODS成为衔接桥梁实现数据上报平台与CDR临床数据的无缝对接。不同的脚本语句按照其定义的中间库进行编辑,经由ODS实时数据仓库从CDR获取,避免了直接从生产库抽取数据。每日凌晨业务空闲时由ODS采集生产库数据并存储至CDR、管理数据仓库(Management Data Repository ,MDR)等多个数据引擎之中。

2.2 作业调度与上报任务管理

平台完成上报任务的脚本维护及业务域建模后,需要配置上报作业任务的相关参数。如上报任务的基本信息、名称,数据符合阈值设定比例,上报类型为可扩展的标记语言(eXtensible Markup Language,XML)或表数据,是否对脚本时间进行校验,上报接口类型配置及相关统一资源定位系统(Uniform / Universal Resource Locator,URL)、用户名密码,是否支持分批上报、是否开通自动校验功能、是否进行自动上报等。在具体实施过程中,一项数据上报任务在初期阶段由于对数据质量把控不准且存在数据缺陷往往采用手动采集上报方式,即平台完成采集后在指定目录输出相关文件,由数据上报人员手动提交至上报任务平台。一方面,手动上报可以利用平台值域规则自行校验,事先开展业务域建模及脚本的正确性验证;另一方面,根据平台反馈的校验错误内容方便回溯业务系统数据缺陷产生的原因,为提升数据质量制定相关约束规则提供支持。一旦上报任务平稳运行一段后即可开启自动上报,按照具体任务要求定期生成csv格式文件或其他数据类型上传至任务平台或以接口方式直接上传。

图1 基于大数据中心的上报平台

2.3 综合查询与数据校验

综合查询功能可以对各个任务的历史执行情况进行汇总查阅,每项任务在其设定频率下的执行情况、采集时间、上报人均有详细记录。特别的,如果对任务采集数据中的相关内容进行人为修正或调整,在其数据变更记录中可以进行查询追踪。

数据校验功能包含相关校验规则的制定、运行设置以及相关校验的结果报告展示。其主要功能旨在校验平台任务采集的数据与ODS源头数据库之间的差异,以便把控数据集的完整性。通过编辑相应脚本对数据上报平台库、ODS源头库数据进行核对比较,对差异数据进行标记展示并提供差异数据的二次采集功能,避免重复采集已有数据影响效率。

2.4 映射管理及审核

数据上报人员面对不同管理机构要求的上报任务时,往往最为头疼的就是种类繁多的字典库与众多版本之间的切换[2,4]。统计目前我院正在执行的上报任务,发现仅在诊断和手术涉及的相关版本就如下几类:手术操作分类代码国家临床版3.0、手术操作分类代码医保版2.0、国家临床版2.0肿瘤学态学编码、疾病分类与代码国家临床版2.0、疾病分类与代码医保版2.0。其他的值域术语还有如物价成本检测数据上报任务中的监测网络科室,儿童肿瘤检测平台中手术相关的手术操作部位代码、手术分类代码、麻醉分级代码、麻醉药品代码等。这些标准术语有的可以通用,有的又存在一定的差异。

数据平台的标准术语管理模块实现了对各类值域字典的维护功能,以及不同字典库的导入、导出与自动匹配功能。一旦标准化术语发生变化如新增映关系、增减数据行,则需要在术语审核界面进行操作审批,记录该变动操作相关操作人、操作时间以及内容方便溯源。术语管理支持两个字典版本间的自定义映射维护,为数据上报人员切换术语库提供了便捷途径。另外,为方便对业务域数据建模中相关字段术语进行维护管理,平台支持图形化界面,直接对上报任务涉及到的术语进行关联与映射操作。

3 平台应用情况及其反馈

数据上报平台应用相较以往上报任务的对接模式具有开发对接时间短、接口复用率高等特点。以往我院对接如发热门诊、流感数据上报等任务时,由于其接口文档分别包含了患者信息表、检验结果表、检查结果表、用药情况表等内容,涉及数据分别来自不同业务的系统,在没有信息集成平台的支持下,需要每个业务厂商单独对接、开发、调试,整个数据上报任务从下文到按照要求进行定期上报流花费了大约2~3个工作日。

标准化的数据上报平台是在集成信息平台基础上以数据中心为统一资源池的一项重要应用。由于其架构特点和高复用性,医疗机构在面对不同上报任务时,只需要与集成平台厂商一家开展协作,基于任务接口文档按照流程完成业务域建模、脚本撰写及作业配置,一般1个工作日即可完成相关工作。截至2022年初,数据上报平台已累计完成:全国医疗服务价格和成本监测与研究网络、全国三级公立医院绩效考核与医疗质量管理住院病案首页采集系、省级绩效考核与医疗质量管理住院病案首页数据上报平台、国家儿童肿瘤检测平台病案首页数据上报、国家药品和医疗服务价格检测信息系统数据上报、“福堂儿童”医学发展研究中心共享病案首页上报、湖南省医疗保障信息平台定点医疗机构接口规范(包含住院数据首页)等7项省级、国家级数据上报任务,累计上报数据124批次,各项上报任务均满足上报任务标准文档的要求。

数据上报平台在建立业务域模型时,通过字段类型定义、为空内容的自动填充以及关联术语的选择等功能,可以开展任务上报数据质量的自动校验。该条采集数据中患者首页填写的出院诊断3(Q21.100Y001)不符合国临诊断库2.0的编码标准。据此错误数据上报人员可以在业务系统中进行回溯,查看该条数据是缺失填写错误或是未增加相关映射转化关系,从而为进一步提升数据质量提供依据。在数据上报工作的实际开展过程中,出现多项由于业务系统设计缺陷导致的数据质量问题,如在病案首页填写责任护士、住院医师等人员时,未对该人员所在职工字典表进行医师、护士执照编码进行非空校验,导致三级公立医院绩效考核数据上传时该字典内容为NULL报错。又如,首页在编辑患儿现住址和联系人地址时,未对省、市、区、街道内容进行拼接去重优化,导致数据采集时发生地址内容重复出现等。

数据上报平台任务的字段校验功能清晰的注明了错误类型、原因,因此在数据采集过程中即可提前发现、定位并解决问题。通过对每月上报任务返回校验错误的汇总统计与制表分析,为医务部质量控制与管理部提供了第一手数据材料,以便在相关的业务系统制定约束或增加填报规范,形成正反馈机制不断优化数据上报质量。具体应用中,根据反馈的校验信息仅针对住院患者病案首页新增约束质控规则50余条,对提高病案数据质量、加强质控管理等方面均起到了积极作用。

4 结论

标准数据上报平台运用流程化的工作模式,利用统一的标准化术语管理与值域映射、中间库复用等技术改变了以往面对不同数据上报任务需要单独进行接口发开或改造的窘境,极大地缩短了对接时间,提升了数据上报的工作效率。标准化术语管理,能够实现了多个版本间字典的自由切换,解决了困扰广大数据上报工作人员字典难题。综上,标准化数据上报平台能够有效的减轻数据上报人员的工作负担,根据任务配置的完整性、准确性校验也为进一步提升数据质量提供了基础。在未来的应用方向上,应考虑接入更多的以每日传输为频率要求的相关任务,从时效性等方面进一步提高数据上报平台的可用性。

猜你喜欢

字典校验病案
使用Excel朗读功能校验工作表中的数据
基于二维码的病案示踪系统开发与应用
试析病案管理中预防病案错位发生的方法
字典的由来
炉温均匀性校验在铸锻企业的应用
大头熊的字典
电子式互感器校验方式研究
正版字典
试论病案管理在防范医疗纠纷中的作用
PDCA循环改进对病案首页中主要诊断正确选择的影响分析