APP下载

一个医疗科研大数据平台的设计与实现

2021-12-17王锐孙小梅李鹏飞

电脑知识与技术 2021年33期
关键词:医院信息系统数据挖掘深度学习

王锐 孙小梅 李鹏飞

摘要:为了挖掘和利用医院信息系统中积累的医疗大数据中的有用信息,用以临床辅助决策和基础临床科学研究,该文设计了医疗大数据研究平台。通过对医院现有信息系统的分析,结合临床医学和科研的具体需求,利用数据挖掘技术、深度学习技术、大数据可视化技术、自然语言处理技术等模型算法,对医疗大数据进行集成和整合,构建统一的大数据模型和标准,实现医疗大数据的智能应用。在构建的医疗大数据应用平台中,具体实现了病历搜索、患者全景视图、科研项目管理、疾病关系图谱和特征分布等具体的应用功能。该平台的应用,让医疗大数据蕴含的价值得以实现,不仅拉近了临床医疗实践与临床基础研究之间的距离,而且提高了医院整体运行的效率。

关键词:医疗大数据;数据挖掘;医院信息系统;深度学习;临床辅助

中图分类号:R42;TP311      文献标识码:A

文章编号:1009-3044(2021)33-0055-03

开放科学(资源服务)标识码(OSID):

1 研究背景及意义

随着医院信息化的不断发展,在医院业务数据库中,积累了大量的患者医疗数据。这些数据中包含着各种各样的有用信息,对这些数据加工处理,利用数据挖掘、深度学习等技术,可以实现对这些临床积累医疗数据的挖掘和利用。构建一个综合前沿的医疗大数据应用平台,对医院积累的医疗数据,以病人为中心进行数据整合,建立统一的医疗大数据的数据标准,将不同厂商间的数据集成到一个统一的数据环境中。通过这种方式,不仅可以解决各个信息系统数据标准不统一的问题,消除信息孤岛,还可以通过大数据平台为医院临床辅助决策及医学科研发展提供有力支持。

2 医疗大数据系统架构

该平台实现了医疗大数据的数据采集、数据集成和数据治理。在此基础上,构建适用于医疗大数据的数学模型,从而为医院管理、教学、科研提供各种个性化的应用。医疗大数据平台的系统架构如图1所示。

在医疗大数据平台架构的底层,将医院内各个信息系统中的历史数据及每天产生的增量数据进行集成接入。对各个信息系统中集成接入的数据进行整合,整合的基础是建立统一的数学模型。在数据集成[1]和数据整合[2]过程中,由于医疗大数据的敏感性,一定要注意保护好病人的个人隐私,对医疗大数据进行脱敏处理。

医疗大数据主要包含患者的基本信息、电子病历、医嘱信息、护理记录、检查检验结果以及治疗过程等。这些医疗数据信息,主要是用自然语言的方式进行记录,信息结构非常复杂,如何让计算机识别和理解这些医疗数据中包含的信息,从而高效地对这些信息进行存储、分类、检索、统计、分析和挖掘,是该医疗大数据平台建设的重点。在本文构建的医疗大数据平台中,通过自然语言处理技术[3],结合医疗专业术语名词,将自然语言表达的语义,转换成结构化的键值对。

集成后的数据,还不能实现真正的具体应用,医疗大数据还需要通过一些先进的算法模型来具体实现。具体包括利用数据预处理、文本分析类、机器学习类、模型评估等算法模型实现医疗大数据的可视化展示[4]。利用统计分析、关联规则、文本聚类、语义分析等技术构造疾病关系图谱、疾病演变等。利用贝叶斯算法、深度学等[5]技术构建疾病诊断,治疗等风险评估模型[6]。

3 医疗大数据平台技术架构

对系统开发中多种技术架构进行对比评估,Hadoop是一个能对大量数据进行分布式处理的系统。主要由HDFS(Hadoop Distributed File System),MapReduce,Spark和Hbase等组件组成。现在Hadoop技术架构设计[7]已经成为大数据平台做非结构化数据处理的标准配置,为半结构化和非结构化的医疗大数据提供分布式数据存储[8]资源。同时,也为自然语言处理,各种模型算法提供分布式计算资源。医疗大数据平台的技术架构如图2所示。

Hadoop技术架构设计,可以解决传统信息化架构中存储,计算,运维等多方面的效率和稳定性问题。Hadoop技术架构中,可以在不了解分布式底層细节的情况下,开发分布式程序,从而实现利用集群优势进行高效运算和存储。其中HDFS为海量的数据提供了存储,MapReduce则为海量的数据提供了计算。

4 医疗大数据平台应用场景

在医疗大数据平台中,主要实现了病历搜索、患者全景视图、科研项目管理、疾病关系图谱和特征分布、知识库等主要几个应用模块,为医疗大数据的应用提供了有力支撑。

4.1 病例搜索

病历搜索应用模块中,在基于医疗大数据清洗加工的基础上,通过多种搜索方式,可以快速检索出符合不同检索需求的患者或者患者病历。病历搜索可以满足临床医生各种查询需求,也可以在科研项目中,快速检索出符合特定检索需求的患者病历。病历搜索应用如图3所示。

在病历搜索应用中,提供的功能包括关键词搜索、高级搜索、条件树搜索。通过这些不同的搜索方式,不仅能提高搜索效率,同时也可以为临床应用提供复杂条件的搜索。简单的几个搜索步骤,就能满足科研项目立项的可行性分析。

4.2 患者全景视图

患者全景视图应用中,整合了同一个患者当前在该医院的所有医疗信息。包括就诊信息、检查检验结果等。可以让浏览者快速掌握患者医疗就诊的全貌,以及病情的发展情况。患者全景视图如图4所示。

在患者全景视图中,有一条时间轴,是该患者所有医疗信息的图形化总览。通过滚动时间条可以调整数据的范围。

4.3 科研项目管理

在该科研项目管理应用中,可以进行一站式在线科研项目管理。一键创建项目,实现回顾性研究的全程在线管理,极大地提高临床科研的效率,是传统科研项目数据收集效率的几倍。在科研项目管理中,具体的项目管理流程是录入项目基本信息,纳排条件设置,研究指标选择,项目结果导出,统计分析研究,科研项目管理如图5所示。

在已建立的科研项目中,还支持对导入的非平台数据进行结构化。该医疗大数据平台不仅体现了大数据技术优势,而且还能够提高智能数据平台科研场景的支持力度,灵活高效,扩展性高。

4.4 疾病关系图谱和特征分布

疾病关系图谱应用模块中,可以查看与疾病关键词相关联的诊疗关键词,以及关键词间相互关联的多层级关系网络。每个节点的大小和统计类型的权重以及分布概率相关,疾病关系图谱和特征分布如图6所示。

在疾病关系图谱中,包含诊断、用药、手术、检查检验和症状五类关键词。任意连线上的两个节之间代表有数据关联,鼠标悬浮在节点上,可以查看节点间包含的数据信息,包括具体病历的统计数据。每个节点允许再次点击查看该节点的相关数据关系。

4.5 知识库

在知识库应用模块中,主要包括的知识内容有中英文文献、指南共识、临床路径、药品说明书等。有些文献可以下载原文,在知识库首页整合了所有知识内容,可以根据用户特征信息进行智能推荐。并且平台能够学习用户对于推荐内容的喜好程度进行深度学习,将更加有用的知识推荐给用户,医疗大数据平台知识全库如图7所示。

除了知识推荐,还有研究热点趋势图、作者图谱、临床试验等知识内容。

5 结束语

医院信息化发展积累的医疗大数据,是医院宝贵的财富。这些医疗大数据能够有效地挖掘和利用,找出其中蕴含的医学价值,是极其必要的。本系统结合深度学习与数据挖掘技术,通过深度学习技术,可以智能辅助判断一些医疗图像数据和心电图等检查检验结果数据。通过数据挖掘技术,可以对医院积累的几千万份病历数据进行智能学习,挖掘出各种有用的信息知识。同时,本系统构建的科研项目管理模块,为医学科研工作人员提供了人性化的操作界面,能够快速高效地建立科研项目,并且通过平台提取病历数据,快速实施项目计划。医疗大数据平台的开发和应用,为医院建立一套完整的医疗大数据智能服务,挖掘了医院的医疗数据资源,拉近了医学基础研究和临床应用的距离,对推进诊疗水平发展都有重要意义。

参考文献:

[1] Aponte C,Kasel S,Nitschke C R,et al.Structural diversity underpins carbon storage in Australian temperate forests[J].Global Ecology and Biogeography,2020,29(5):789-802.

[2] Liu T,Chen H Q,Hetz G,et al.Integration of time-lapse seismic data using the onset time approach:The impact of seismic survey frequency[J].Journal of Petroleum Science and Engineering,2020(189):106989.

[3] 李舟軍,范宇,吴贤杰.面向自然语言处理的预训练技术研究综述[J].计算机科学,2020,47(3):162-173.

[4] 邵全勇.基于数据可视化技术平台的开发[J].微型电脑应用,2020,36(1):144-148.

[5] 余传明,王峰,安璐.基于深度学习的跨语言词汇对齐模型研究[J].情报理论与实践,2020,43(9):150-158.

[6] 祁长红,金涛,曹久敬.集体风险评估模型在医疗设备风险评估中的应用与探讨[J].中国医疗设备,2020,35(3):149-151,159.

[7] 梁林森.基于hadoop技术的信息系统用户体验智能识别与分析研究[J].中国信息化,2018(1):93-95.

[8] 冯志杰.基于HDStore模型的混合分布式大数据存储技术[J].无线电工程,2020,50(4):335-342.

【通联编辑:谢媛媛】

猜你喜欢

医院信息系统数据挖掘深度学习
基于并行计算的大数据挖掘在电网中的应用
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
基于浙江省预约诊疗服务平台的接口设计与实现
混合模式下的医院银行卡退款新思路
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究