APP下载

基于知识图谱的医学信息查询系统实验设计

2021-03-07左海维朱红马金凤张昌明王淋金宏飞

电脑知识与技术 2021年36期
关键词:知识图谱可视化数据库

左海维 朱红 马金凤 张昌明 王淋 金宏飞

摘要:目前医学信息工程专业课程实验内容存在知识体系不连贯、与行业背景脱节等问题。该文结合医疗信息化应用场景需求及课程综合技能训练要求,利用知识图谱、数据库处理以及数据可视化等技术,设计医疗健康知识百科查询系统的综合实验。系统包括用户注册、用户登录、快速链接、详细介绍以及知识图谱模块,能够实现常见疾病的查询、关联以及知识图谱的可视化等功能。通过教学实践发现,该实验有助于帮助学生通过各环节快速理解系统框架结构,增强学生理解所学专业课程之间的关联性,并培养智能医学方向的学生面向实际场景进行医疗信息系统开发的能力。

关键词:医学信息;信息查询;知识图谱;数据库;可视化

中图分类号:TP391.3        文献标识码:A

文章编号:1009-3044(2021)36-0001-04

开放科学(资源服务)标识码(OSID):

Experiment Design of Medical Information Query System Based on Knowledge Map

ZUO Hai-wei, ZHU Hong*, MA Jin-feng, ZHANG Chang-ming, WANG Lin, JIN Hong-fei

(School of Medical Information and Engineering, Xuzhou Medical University, Xuzhou 221004, China)

Abstract: At present, there are some problems in the experimental content of medical information engineering, such as the incoherence of knowledge system and the disconnection with the industry background. Combined with the requirements of medical information application scene and the training requirements of comprehensive skills, a comprehensive experiment of medical and health knowledge encyclopedia query system is designed by using knowledge mapping, database processing and data visualization technology. The system includes user registration, user login, quick link, detailed introduction and knowledge map module, which can realize the query, association and visualization of common diseases. Through the teaching practice, we found that this experiment can help students quickly understand the system framework through various links. Moreover, it is able to enhance the students' understanding of the relevance between the professional courses, and cultivate the students' ability of medical information system development facing the actual scene.

Key words: medical information; information query; knowledge map; database; visualization

在疫情防控举措的推动下,互联网医疗的服务量激增,对老百姓便捷获取医疗资源、支撑常态化疫情防控具有重要作用[1]。随着互联网医疗的不断发展与完善,大多数人习惯通过互联网查询常见疾病相关知识,如何在海量的医疗大数据知识库中高效、准确地进行检索是解决用户需求的基础[2]。知识图谱技术[2]能够对复杂结构化信息之间的逻辑关系进行梳理和可视化展示,目前广泛应用在智能问答[3]、智能搜索及推薦[4]、知识百科[5]等领域。基于知识图谱的医疗健康知识百科查询系统能够提供准确、详细的医疗健康知识查询结果,避免了过往查询结果过于专业难懂以及缺乏针对性等问题,是当前医疗信息系统研究与设计的热点之一。

医学信息工程专业是培养“医工结合”、具备医学专业知识和计算机技术实践能力复合型人才的重要平台[6],学生需要能够根据所学知识融会贯通,解决医疗健康领域应用场景的实际需求。然而,目前医学信息工程专业课程仍存在各课程实验设置独立分散,容易产生“知识孤岛”;与医疗健康应用结合性不强,难以与未来行业接轨等问题。为此,医学信息课程实验需要不断优化设计,在医疗大数据背景下,探索如何有效获取医疗资源。本实验利用知识图谱技术综合设计医疗健康知识百科查询系统。通过案例化教学深化学生对行业的认同感,提高对知识技能的实践能力,培养通过计算机技术解决行业问题的能力。

1 实验设计目标

根据医学院校医学信息专业课程的教学目标,要求提升学生对学科的认知,指导学生学习医学专业知识和信息科学技能,培养学生“医工结合”,让学生成为具有计算机技术知识与实践能力的应用型、复合型人才[6]。因此,医学信息课程综合实验需要从实践需求出发,旨在培养训练学生以下几个方面的能力[7-10]:

(1)系统设计能力。结合医学信息专业背景,培养学生系统设计能力,包括:系统总体设计、网络架构设计、软件设计等,加深学生对软件工程、计算机网络等课程的理解与应用。

(2)数据管理能力。学生对医疗健康知识结构化数据结合实际问题进行分析,充分利用数据库管理知识,通过结构化数据库、图数据库进行数据管理,加深学生的数据管理能力。

(3)逻辑思维能力。培养学生将实际需求抽象成计算机需要解决的问题,并通过数据统计、可视化分析等方式对问题进行梳理、推断和思考,从而设计合理的解决方案。

(4)开发编程能力。实验针对系统各个功能模块进行考查,选取学生已经掌握的编程语言及主流的设计模式,锻炼学生的项目开发编程能力,促进学生对编程语言活学活用。

2 实验系統设计

2.1系统总体设计

医疗健康知识百科查询系统总体架构采用主流的MVC(Model View Controller,模型-视图-控制器)模式[11]搭配DAO(Data Access Object,数据访问对象)模式[12]的设计方法。通过Java Bean实现DAO模式,允许业务逻辑与数据存储逻辑分离。这种系统设计的优势在于利用MVC模式进行分层设计,降低了层与层之间的依赖,便于学生开发。

系统数据层采用关系型数据库MySQL和图数据库Neo4j[13]。其中,MySQL数据库用于存储如用户基本信息等结构化数据。Neo4j数据库用于存储和管理知识图谱,使用Java语言开发访问Neo4j数据库的工具类,学生可以通过系统界面直接对Neo4j进行操作,不需要学习Cypher语言,降低了学生使用Neo4j的难度。

软件设计包括用户注册、用户登录、快速链接、详细介绍及知识图谱可视化五个模块,方便学生根据模块进行实验程序编写与完善。其中,知识图谱是实验重点,需要实现添加节点、添加节点间关系、查询节点、查询节点间关系、查询节点间路径以及查询全部这六个功能。系统功能模块设计如图1所示。

2.2 网络架构设计

网络架构是确保整个系统正常运行的基础,要求学生分别从客户端和服务器端两个部分对系统网络架构进行搭建。客户端包括:笔记本电脑、台式机或平板电脑等,用于用户访问系统。服务器主要是Web服务器和数据库服务器,Web服务器用于运行系统代码,数据库服务器用于存储关系型数据库MySQL和图数据库Neo4j。本实验系统的网络架构如图2所示。

为了保证系统的安全性与高可用性,将Web服务器与数据库服务器设计为各自独立运行。当系统运行出现故障时,数据库服务器可以自动备份系统数据,降低系统损害程度。

3 系统软件设计

为了方便学生理解,提高学生的逻辑思维能力,将系统软件设计分为软件架构搭建和功能模块开发。在软件架构部分按照MVC结合DAO的模式对系统架构进行搭建,并规定相关类。为统一标准,功能模块开发方面在此基础上进行编程,实现人机交互的可视化显示。这种设计具有良好的可拓展性,同时也能够规范化开发,培养学生良好的编程习惯,有助于编程能力的提升。

3.1 软件架构设计

本实验系统采用的DAO模式提供了访问关系型数据库MySQL所需操作的接口,将数据访问和业务逻辑分离,对上层提供面向对象的数据访问接口。另外,DAO模式还对MySQL和Neo4j两种不同数据库进行隔离,降低了代码的耦合性,提高了系统的扩展性和移植性。图3展示了系统软件架构,其工作流程为:

(1)Web服务器启动并初始化Servlet程序;

(2)用户通过浏览器在客户页面发送操作请求;

(3)Servlet获取前端页面发送的请求与数据;

(4)Servlet调用具体的接口和方法处理请求,并将处理结果返回给JSP页面;

(5)JSP页面显示相应结果。

3.2 功能模块设计

学生根据实验任务要求,设计以下功能模块,并对各模块进行编程。

(1)用户注册模块与用户登录模块

用户首次访问系统需要进行用户注册,填写个人信息,包括用户名、密码设置、邮箱地址、姓名、手机号、性别、出生日期及验证码。信息填写完成后,点击注册进入激活界面,系统发送激活邮件,用户完成激活后便可以登录系统。用户登录界面为已注册用户日常登录界面,需要填写用户名、密码以及验证码。用户注册模块与用户登录模块工作流程如图4所示。

(2)快速链接模块与详细介绍模块

系统主页设置快速链接选项,用户点击后可以进入常用健康知识网站。用户点击主页介绍的健康知识进入详细介绍界面,详细介绍健康知识,包括疾病的原因以及预防措施等。快速链接与详细介绍模块工作流程如图5所示。

(3)知识图谱模块

知识图谱模块需要设计添加节点、添加节点间关系、查询节点、查询节点间关系、查询节点间路径以及查询全部知识图谱的功能。知识图谱模块工作流程如图6所示。

知识图谱模块实验包括知识获取、知识表示、知识存储和知识图谱可视化操作四个步骤:

(1)知识获取

知识图谱展示的知识点不是凭空产生的,需要从不同的数据源中提取有价值的目标数据。医疗知识图谱的知识需来源于专业的医学书籍、医院的电子病历以及各大医疗网站的医科知识。

(2)知识表示

使用“点”表示各个知识点,使用“边”表示各个知识点之间的联系。每个节点对应唯一的ID,通过一条或多条边与其他节点相连接。每个节点都会使用键值对来表示自身的属性。同样,每一条边也对应唯一的ID,且与两个节点相连接以表示两节点之间的关系。每一条边都有唯一的标识,使用键值对来表示两节点之间的对应关系。

(3)知识存储

知识图谱需要采用图的数据结构,而传统的关系型数据库很难存储相互关联的数据,所以本实验采用图数据库Neo4j来存储知识图谱。

(4)图谱可视化

知识的可视化可以将复杂的知识转变成人们容易理解与接受的图像形式,使人们更加准确快速地理解与记忆知识,缩短人们学习的时间和精力。本实验中知识图谱的可视化,不仅要求学生实现展示知识节点,还要体现节点之间的关联性,从而绘制完整的知识图谱。

4 功能展示

以搜索咳嗽疾病症状为例,系统会在详细介绍界面向用户介绍与咳嗽相关的疾病与健康知识,包括疾病产生的原因和预防措施等,如图7所示。

知识图谱模块主要实现用户输入和知识图谱展示两部分内容。用户输入模块如图8所示,包括三个文本输入框和六个功能按钮,最下方设置一个返回主页的超链接。用户可在该界面输入节点和关系名称,点击对应的按钮,完成相对应的操作。之后,通过知识图谱展示模块显示相应的知识图谱数据。以搜索咳嗽为例,系统展示的相关知识图谱如图9所示。通过该知识图谱,用户可以了解与中医十咳相关的咳嗽类型,进而帮助用户进一步查询具体的咳嗽类型和症状。

5 结语

面向医疗大数据背景下医学信息工程专业课程的实践需求,结合医疗信息化应用场景需求及课程综合技能训练要求,本实验设计了基于知识图谱的医疗健康知识百科查询系统。通过教学实践表明,该实验系统能够满足设计目标与要求,通过对系统的网络架构、软件架构以及功能等方面的设计,不仅能够锻炼学生的系统分析与设计能力,提高学生工程开发水平,同时还能将理论与实践相结合,为学生构建智能医学方向的课程知识体系。

参考文献:

[1] 程辉, 周琼, 刘小莉, 等. 新型冠状病毒肺炎疫情下“互联网+医疗”的机遇及思考 [J]. 中国医院管理, 2020, 40(6): 38-40.

[2] 侯梦薇, 卫荣, 陆亮, 等. 知识图谱研究综述及其在医疗领域的应用[J]. 计算机研究与发展, 2018, 55(12): 2587-2599.

[3] 谭刚, 陈聿, 彭云竹. 融合领域特征知识图谱的电网客服问答系统[J]. 计算机工程与应用, 2020, 56(3): 232-239.

[4] 翟姍姗, 潘英增, 胡畔, 等. 基于医学知识图谱的慢性病在线医疗社区分面检索研究[J/OL]. 情报理论与实践: 1-13[2020-09-25]. http://kns.cnki.net/kcms/detail/11.1762.G3.20200729.1514.004.html.

[5] 车金立, 唐力伟, 邓士杰, 等. 基于百科知识的军事装备知识图谱构建与应用[J]. 兵器装备工程学报, 2019, 40(1): 148-153.

[6] 郭文秀, 袁永旭, 乔晓梅. 大数据环境下医学信息管理专业人才培养研究[J]. 教育理论与实践, 2019, 39(30): 12-14.

[7] 刘建明, 徐莉莉, 梁淑娟, 等. 医学智慧信息化实验实训教学平台构建与实践[J]. 实验技术与管理, 2020, 37(2): 245-248.

[8] 吴许俊, 丁勇, 姜枫, 等.健康医疗大数据开放实验室建设与应用研究[J]. 实验技术与管理, 2020, 37(5): 231-233+237.

[9] 牟冬梅, 王萍, 郑晓月, 等. 基于健康医疗大数据的医学信息学教学体系优化设计[J]. 医学与社会, 2018, 31(1): 80-83.

[10] 陆维嘉, 唐颖. 江苏省某大学附属医院医学信息学专业项目化教学模式探索[J]. 医学与社会, 2019, 32(3):128-130.

[11] 张宇, 王映辉, 张翔南. Design and Implementation of MVC Framework Based on Spring[J]. 计算机工程, 2010,36(4):59-62.

[12] 郭玉栋, 左金平. 大数据分析下DAO模式数据库间差异消除仿真[J]. 计算机仿真, 2019,36(12): 336-340.

[13] 王红, 张青青, 蔡伟伟, 等. 基于Neo4j的领域本体存储方法研究[J]. 计算机应用研究, 2017,34(8): 2404-2407.

【通联编辑:王力】

猜你喜欢

知识图谱可视化数据库
基于CiteSpace的足三里穴研究可视化分析
基于Power BI的油田注水运行动态分析与可视化展示
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展