口腔专科智能分诊系统的建设与应用

2022-10-13陈怡帆,曹战强

医院管理论坛 2022年6期

口腔专科医院科室分工精细且部分科室之间存在专业交叉，同时多数口腔疾病需要经历跨专业、跨科室的诊治过程，导致多数初诊患者就诊前难以准确选择就诊科室。例如，牙周专业患者易误挂黏膜专业，智齿冠周炎患者易误挂颌面外科专业。由于缺乏及时有效的指导，患者挂错号、退换号行为以及相关纠纷屡见不鲜，造成号源利用率降低、诊疗效率降低、患者满意度下降、医院运营成本增加等不良影响。

医院开通互联网预约挂号服务后，传统的线下导诊方式难以满足线上挂号的咨询需求，线上简单的科室和专业说明也无法有针对性地解决患者对就诊科室的疑虑，加之号源有限患者抢号时间紧张，错挂号情况更加频繁。为此，项目团队基于人工神经网络和自然语言处理技术开发智能分诊系统，在系统同患者对话后即时反馈患者相对准确的答案，以节约患者咨询时间，为患者提供自动化、准确化、高效化的就诊指导。

系统架构设计

智能分诊系统需具备与患者对话聊天、基于深度学习的诊断功能，同时通过安全权限控制，保证患者信息安全传输，并对日志数据进行埋点收集，对患者的访问进行有效记录。该系统分为口腔知识图谱构建和口腔诊疗智能分诊两个子系统。口腔知识图谱构建子系统利用医疗过程中生成的真实口腔临床数据，通过分析存储口腔临床病历数据的数据库表，设计出关键概念模式并构建知识图谱。口腔诊疗智能分诊子系统以该口腔知识图谱为基础，匹配查询模板在知识图谱内进行查询，生成分诊结果并通过前端页面展示给患者[1]。系统架构见图1。

图1 系统架构

系统实现

1.口腔知识图谱构建子系统

1.1 实体抽取。医院口腔专科电子病历基准数据模型根据口腔疾病的临床诊疗特点设计，以诊断名称(diagnosis)、治疗方案(plan)、治疗步骤(step)、医嘱(order)、收费项目(item)为路径，梳理2015年至2019年口腔专科诊疗过程中的非结构化数据、半结构化数据与结构化数据，数据清单见表1。通过自然语言处理和上下文语义识别，并利用数据模型进行数据抽取，生成文本数据集[2](见图2)。结合传统教科书与指南对文本数据集进行清洗，得到口腔领域的临床术语及关键词。据此定义口腔知识图谱中的实体，包括患者症状实体、就诊科室实体、诊断实体、用药实体、检查实体、检查指标实体等。

图2 诊疗数据抽取示例

表1 数据梳理清单

1.2 语义类设计。语义类设计作为实体层面上的规整和抽象，包含了两层概念：第一层概念对应口腔临床数据表，第二层概念对应口腔临床数据表中字段名[3]。归纳提取概念之间的关系以及概念的属性，形成有向的、包含关系的语义类。

表2 概念间的关系

1.3 知识图谱构建。将实体集中的实体与语义类中的概念一一对应，将同类实体映射到同一个概念上，建立实体与语义类的映射表。通过BFS（广度优先遍历）算法将映射表中的数据实例存入其映射的概念结点的子节点中，建立三元组口腔知识图谱[4]。

以继发龋节点为例。与继发龋存在诊断关系的症状节点包括：(食物嵌塞，诊断，继发龋)，(咬合不适，诊断，继发龋)，(牙齿有洞，诊断，继发龋)，(冷热酸甜敏感，诊断，继发龋)，(冷热刺激痛，诊断，继发龋)与(充填物脱落，诊断，继发龋)。与继发龋存在就诊关系的就诊科室节点包括：(继发龋，就诊，牙体牙髓科)，(继发龋，就诊，特诊科牙体牙髓科)，(继发龋，就诊，口腔预防保健科牙体牙髓科)，(继发龋，就诊，综合科牙体牙髓科)。因此，当患者输入上述症状时，系统可通过知识图谱对应相关就诊科室，辅助智能分诊。

2.口腔诊疗智能分诊子系统

2.1 对话聊天模块。对话聊天模块是基于AIML架构和以图结构的问答模块，内置的问题生成器通过人机交互引导患者回答问题，收集患者基本信息、症状等数据。当收集到足够的信息后，利用实体识别模型对患者提供的数据进行清洗和转换，获取关联模型可识别的字段[5]。

2.2 关联模型与服务。从历史病历信息中抽取有效特征，结合知识图谱内容，建立就诊科室与患者主诉的关联模型，通过restful接口对外提供服务，用于分析病人主诉和病史等信息，给出就诊科室的推荐。关联模型的输入为所有训练集的病例特征信息，采用加法模型将各个弱分类器进行线性组合得到预测结果，输出为建议就诊科室。对于预测错误的弱分类器增加该分类器的权重值，对于预测正确的弱分类器则降低该分类器的权重值，进行迭代训练，直到关联模型具有较低的残差和较高的预测准确性，应用用于对新病例的预测。

应用效果

智能分诊系统可针对北大口腔医院所有专业和15个科室常见的100多个症状、100多种疾病提供就诊建议，应用于北大口腔医院微信公众号。系统可为以下情景下的患者推荐就诊科室：(1)仅知道症状，如牙疼、溃疡；(2)仅知道诊断，如牙体缺损、牙髓炎；(3)仅知道治疗方式，如整牙、拔牙。

截止2020年底，智能分诊系统服务人次达3.7万，近1万人次对系统服务进行了评价，好评率达98%。系统在运行过程中积攒了大量真实患者数据，对患者画像、症状疾病、就诊科室等数据进行分析，可了解患者行为偏好、口腔常见病等情况。图3列出了患者咨询数量最多的5种症状。

图3 症状分析

讨论与结论

智能分诊系统从口腔专科电子病历入手，利用自然语言处理技术和知识图谱技术，建立起计算机可阅读、可理解的知识体系。通过搭建的人机智能对话系统，收集患者的口腔疾病信息，综合运用中文分词技术、近义词处理技术、不确定推理技术以及文本相似度技术，合理推断患者可以前往就诊的科室信息。该口腔专科智能分诊系统支持部署于APP、公众号、小程序，基本覆盖了口腔专业的疾病与治疗方式，随时随地为患者提供快捷的就诊指导，降低了患者误挂科室的可能性，可为其他医疗机构开展口腔专科智能分诊提供借鉴。

智能分诊系统通过日志监控系统记录系统的使用状况，可对各服务节点的稳定性与服务效率进行可视化监控，有利于及时发现系统的效率瓶颈与错误信息。另外，通过日志系统可有效收集患者访问记录，对患者使用数据进行合理分析，可作为系统优化、资源分配的依据。

智能分诊系统具备两个特点：第一，知识图谱的构建以口腔专科电子病历中的大量专家模板与真实诊疗数据为基础，相较于常规的基于百科类站点、垂直站点爬取，知识图谱的完整性与推断的准确率更高；第二，不同于开放的自由文本人机对话，本系统的人机对话是在预定义的规则下进行的，更符合真实的诊疗场景。在时间有限的线下面对面问诊过程中，医生会对患者提出引导性的问题，从而获得关键信息做出诊断。如果允许完全自由的文本人机对话，患者可能会输入与诊疗目的无关的过于离散的信息，导致机器学习的成本大大提高，推理结果的准确性反而降低。因此，经真实测试与实践表明，基于真实诊疗数据的、预定义人机对话场景的智能分诊系统可用性与可信性更高。