APP下载

中医药知识表示与推理方法探讨❋

2021-03-29钟卫军晏峻峰

中国中医基础医学杂志 2021年9期
关键词:医案知识库方剂

刘 琦, 钟卫军 晏峻峰△

(1.湖南中医药大学信息科学与工程学院, 长沙 410208; 2.湖南省卫生健康委员会信息统计中心,长沙 410008;3.中南大学湘雅医学院临床药理研究所,长沙 410008)

中医药领域有着丰富的知识和严密的理论体系,随着信息科学的飞速发展,运用人工智能技术对庞大的中医药知识资源进行采集、梳理和加工成高质量知识,不仅有助于中医药知识的共享利用,更能挖掘其潜在的规律,辅助临床医师智能决策、服务普通大众的知识求解等。不少人在中医药知识库构建及表示推理方面进行了诸多前瞻性的尝试,推动了中医药领域知识库的发展。

1 中医药知识的开发与利用

由于要构建一个全视角、多维度、囊括整个中医药知识体系的知识库是一个庞大的工程,目前构建中医药领域的知识库均着眼于某一项任务或某一方面去开展,具体可以从以下几个方面来认识。

1.1 文献知识的开发利用

中医药文献知识囊括了中医学科知识或机构知识库,包含了中医古籍、期刊研究和临床指南等学术出版物资源,提供以学术检索为主要形式的知识服务。古籍在中医药知识体系中占据重要地位,因此文献知识利用大多以古籍为主。如古籍方剂[1]、古籍本草[2]、古籍养生[3]、古籍藏医本草[4]、古籍温病[5]、古籍伤寒[6]和仅以《黄帝内经》中“病机十九条”知识点的表示[7]等。相比之下,中医领域的期刊、临床指南等知识库的研究较少,相关研究仍然停留在资源保存、平台搭建等阶段,未深入到文献内部的知识组织、关联等[8]。

中医药文献知识库构建的重点在于知识的可溯源性和融合创新性。建立在经验医学之上的中医古籍对揭示领域知识有着举足轻重的作用。但古籍不同于现代文献,其字义、语义、语法等有较大差异,且中医药文本信息专业而晦涩,现行的语料库和数字资源对其构建作用不大,需要各领域的深度合作。

1.2 医案病历知识的开发利用

医案病历知识库是以领域较高质量的案例为基础构建的,是中医药临床知识的具体体现。近几年临床决策支持系统(clinical decision support system,CDSS)兴起了真实世界数据驱动型模式,以真实世界中较好的病案数据为基础构建知识库逐渐受到重视。中医医案与病历数据在中医药领域一直占据重要地位。李新霞等[9]很早就基于本体以老中医脾胃病案为基础构建知识库,中国中医科学院于琦等[10]构建了基于医案的临床本体,实现了医案数据库自动构建、术语智能规范和分析挖掘功能,目前已建成有近30万古今名医医案的古今医案云平台[11],设立共享机制鼓励大家参与共建,并开发了中医临床辅助决策系统(traditional chinese medicine-clinical decision support system,TCM-CDSS)[12],结合Agent技术和智能引擎实现了相似的医案、方剂等推荐。Tong Ruan等[13]基于统一医学语言系统(unified medical language system,UMLS),从百科网站等半结构化文本中提取实体、关系和属性等训练条件随机场模型,从而自动提取中医电子病历文本中知识构建知识库。

医案知识是名老中医的智慧结晶和中医辨证模型的重要存在形式,是解决公共卫生现实需求的重要载体。相对来说,中医药验案或病例文本大部分都有着较好的形式化特征或结构特点。从知识工程的角度来看,知识较容易获取,且不仅仅只有古代验案,如今已有大量较高质量的现代医案可供利用,未来的医案知识库将是中医药知识库的重要支撑。

1.3 方药知识的开发利用

方药知识是以方剂和中药为主要研究对象,以实现依法荐方、处方评价、配伍剂量、兼证加减等基本服务需求。易纲[21]较早地将本体方法引入方药知识库构建,张帆等[22]对方剂对象构建量效关系表、药效关系表、效证关系表和效候关系表,基于证素改进了启发式规则关系表,模型经过1000首代表性方剂训练和实验,获得了较高的分类识别效果。尹丹等[23]采用领域本体对《伤寒杂病论》经方以三元组形式表达方药关系,运用图数据库构建知识图谱,利用图搜索模型进行推理,这种更契合人类思维路径的搜索模式,实现了随证选方、医案经方用药加减推荐及解释等部分智能推理。Liang Yao等[24]结合领域知识对3万多首方剂配伍、君臣佐使、主治进行主题建模,挖掘方剂模式,使得有相同症状主题描述的患者获得对应主题方剂。

方药知识是沟通理论与实践的桥梁,其知识结构简单,但也蕴含着较多的隐性知识,主要表现为剂量与功效、疗效的关系。文献[22]提出归一化“相对药量”计算各药效强度,但未给出明确药效的量化问题,在改进启发式规则后证明了证素辨证适合中医药知识的推导。

1.4 专病专科知识的开发利用

专病专科知识库是指专注于某一细分领域研究其知识结构特征以提供知识服务,如针对特定人群。张悦悦等[25]利用主题词表设计了面向亚健康人群的食疗知识库,兼顾公众术语和医学专业术语之间的差别;陈鑫等[26]针对女性人群特点利用知识元技术构建女性健康干预知识库,对食疗干预方案进行反馈评估,实现了知识动态更新和精准推荐。如针对某一疾病,朱玲等[27]以领域本体构建功能性胃肠病知识库,还有银屑病本体[28]、崩漏本体[29]等。在哮喘知识库的构建上,田野等[30]综合本体、关联数据、语义维基、语义网等构建了基于互联网防治哮喘知识库平台,在领域专家共享共建的基础上搭建,保证知识权威性的同时实现了知识评价和动态更新。还有针对某一方面的,王莹莹[31]以知识系统描述语言(knowledge database mark-up language,KDML)为表示方法,构建了中医基础理论知识库;鲍玉来[32]结合中医药语言系统(traditional chinese medicine language system, TCMLS)构建蒙医药本体,实现了诊断推理和方剂推荐;于彤等在养生分类体系下以关系型数据库形式构建养生知识库[33,34],继而该团队构建了“中医养生领域本体”,整合养生数据资源,形成了大型中医养生知识图谱[35]。Yan Zhu等[36]设计了交互式3 D针灸知识库,以立体、动态可视地展示针灸知识。

专病专科知识粒度更细更深入、结构更明确,研究也趋于精细。特别是较多研究专注用户个体以实现个性化、精准化服务[37]。张悦悦[25]设计的用户兴趣关联规则库,根据用户访问轨迹等,间断更新库中相关权值,实现个性化知识推送;黄炜等[38]构建个人健康知识库,巧妙结合用户体质、疾病倾向、环境、既往病史和现病史,对其实现健康情况实时判定,基于案例推理匹配相似案例;陈鑫[26]以女性特点实时记录生理周期、脏腑和阴阳气血情况,根据每味药物主治、功效、归经、地域、适宜月经分期等计算食疗方整体的阴阳气血偏颇,匹配干预方案,并迭代更新食疗方可信度,使知识库越来越精准。

2 知识表示方法的应用

根据文本形式和知识结构特点的不同,中医药知识库构建大概从文献、医案、方药和专病专科等方面的知识资源着手,分别采用了多种表示方法。

2.1 本体、知识图谱的表示方法

总体来看,本体由于其表达概念准确规范,具有可共享和复用性,绝大多数中医药知识库构建均采用本体概念表示方法。包括中医科学院[39]设计的中医药顶层本体——TCMLS获得了较广泛应用,还有高成勉等[40]参考了比较成熟的通用顶层本体SUMO(Suggested Upper Merged Ontology),构建了上海版的中医顶层本体。在本体基础上发展起来的知识图谱有着融合多源异构数据的优势,如于彤等构建中医临床知识图谱以中医临床领域本体为骨架,融合医案、经验、临床指南、文献等知识,实现了各知识资源的关联与联通[43]。在知识图谱之上的图推理也较符合人类思维路径。但由于本体需要有较清晰规范的形式化表达特点,这一点对模糊而晦涩的中医药知识的本体表达和利用造成了一定的瓶颈,也使得其应用范围受限,这又回到了中医药标准化的问题。

2.2 知识元表示方法

知识元的应用也有不少,特别是文献类[1,4,5]。由于其面向的均为专业用户即中医专家,对知识要求可溯源、专业而粒度更细,一般的期刊元数据等已不能满足要求,而知识元指向能独立表达完整语义的最小单位而受青睐。特别是中国中医科学院柳长华团队的“中医药古文献知识库”[41]是其中的代表,是以知识元为关联的网络。主题词表与本体相比限制较少,在对普通用户非专业性知识的表示方面仍有优势[25,31]。

2.3 其他方法

此外还有KDML的方法可实现文献资源的语义检索,产生式规则表示症状→证型→治法→方剂→中药的因果关系[42]。基于关系型数据库构建启发式规则表[22],利用主题图技术灵活定义《伤寒论》原文并可视化展示和语义检索[6],及与动态不确定因果图对病机十九条的有效表达[7],独热编码的词向量技术也有涉足[15]。

3 知识推理

目前推理方法可分为基于规则、案例、模型和图的推理,这4种推理方法在中医药领域均有实践,各有优劣。

3.1 基于规则、模型的推理

有以产生式规则定义了症状→证型→治法→方剂→中药的因果关系[42]实现规则推理。沈玉强等[45]基于ThinkPHP服务框架构建方剂、证候、症状等库表并定义关联规则,目前已通过互联网为300余家基层中医馆提供辅助诊疗支持。将规则加上置信度是为模型推理,张鑫等[46]以类似模糊数学思想方法引入权值因子来表示症状隶属某证型的可信度,测试表明模型推理具有可行性。边红[16]运用软集关联规则算法挖掘规则构建可置信规则库,实现了疾病的推理诊断和处方推荐。

3.2 基于图推理

李新龙[47]基于证素思路构建本体提取三位中医师失眠症案例,并挖掘其核心方及其有效人群特征,构建了各位中医师个性化知识图谱的图推理模型。张鑫提出的模型较好地解决了辨证模糊性的问题,但未能体现辨证个性化;李新龙提出以“人机结合,以人为主”为诊疗服务个性化与信息标准化需求的矛盾解决提供了新的思路;尹丹等[23]采用图搜索模型在方药知识图谱上很好地对方药分类识别,推荐和加减解释等推理。图推理是以图数据库为基础,以类似思维路径行走方式去求解问题,符合人脑推理实际。

3.3 基于案例推理

目前基于案例推理的方法效果较好,均为通过相似度度量实现相似案例的匹配,从而完成推理过程。如陈广[14]将医案精准匹配归类为有监督多分类问题,提取出中医肾病医案文本关键语义信息,并利用深度学习模型训练分类器;QIANG XU等[15]用1.8万多份中医药治疗慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)数据训练神经网络模型,取得了较好的样本分类辨证效果;也有JU CHEN等[17]结合领域专家知识挖掘病历中证素信息,从而实现辨证、论治等的推荐,基于属性偏序结构图原理发掘医案知识,总结名家经验[18,19]。周晟[20]则综合知识挖掘和医案驱动两种思路,在合理的医案表示方法之上,利用知识工程结果辅助案例检索与匹配。

中医药知识推理最终目标在于获得症状与治疗之间的深度认识,涉及病症关系、症证关系、方证关系、药证关系以及治则治法等,其中辨证论治是中医药知识推理的核心技术和主要矛盾,是中医药CDSS的关键所在。推理结果的可靠性需要建立在知识网络尽可能囊括所有知识且无冗余,用以支撑临床决策、处方预警、决策解释。规则推理在中医药领域应用最早、实践最多,图推理模式较好地模仿了人脑思维推理过程。但由于中医模糊性且各中医师辨证思路各不相同,使得广泛有效的辨证推理模型难以建立。基于案例驱动型的医案知识库类似临床跟师学习过程,契合了中医药传承模式,同时也模仿了中医师诊治过程中有着勤求古训的习惯。这种无需深入理解语义的问题求解方式,在目前知识工程技术不成熟和中医药模糊性特点的背景下,切合临床实际,具有率先获得临床大规模应用的潜在价值。

4 总结与展望

中医药各领域知识模型各有各的特点,因此应多专注单一方面知识库构建。本文以资源的形式特点分别从文献、医案、方药和专病专科等知识资源对中医药知识开发利用进行了回顾,发现对文献知识的利用相对较少,医案知识的利用较多,而文献知识是促进中医基础理论突破和循证来源的重要支撑,未来需要加强对该资源的利用。医案知识是临床实践的结晶,是医师实践能力提升必不可少的重要资源。对医案知识的开发利用取得的成就或可足以成为弥补中医基础理论研究无法取得突破的遗憾。

知识推理依赖于知识表示的方法,知识推理模式也影响着知识表示的适用性。大部分的中药方剂有着较强的规律性,应用规则推理的方法较多;而诊断与辨证灵活多变,其推理模式较为复杂。从文献中还发现,从证素角度建模有助于增强模型的泛化能力,这与证素能够灵活地表示更多分类信息的特点是分不开的。

本体和知识图谱的方法对知识库构建有较强的优势,但中医药知识模糊和不规范阻碍了本体和知识图谱的表达效果。不过随着词向量预训练技术的成熟,不用大量人工标注和自动动态提取深层次语义的优势,或将促使成为未来理想的文本表示方法。基于案例的推理以相似度度量为核心逻辑,以预训练好的词向量能为相似案例匹配带来更高的精度,且无需复杂的建模或人工干预,巧妙地绕过复杂的辨证论治过程,迎合了重视经验知识的中医。总体而言,是目前中医药CDSS构建现实需求与限制的一个折衷选择。

目前知识库构建有着朝针对使用用户的个性化服务和大型知识图谱方向发展的趋势,但也存在以下问题。一是缺乏统一的知识资源全局视图。重视标准规范制定,从领域专家共享共建的角度构建顶层本体和知识图谱;二是缺少更新和评审机制。需要注重研究知识的自动获取或半自动的获取方式,同时对临床证据、知识来源进行评估,确保知识权威性和高质量;三是知识表示方式单一,2种或2种以上的知识表示组合方法较少。为方便不同用户获取所需知识,如医师、科研人员、不同年龄性别的普通用户、学生、护理人员、评审人员、管理维护等对象,其需求各不一样,需要重点以用户需求为主去组织知识,融合多种知识表示方法,以提供多样化的服务。

猜你喜欢

医案知识库方剂
中药方剂在治疗黄褐斑中的应用
《金匮要略》黄芪类方剂探析
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
医案聊斋续篇 吐泻案
论方剂的配伍环境
医案聊斋续篇 晨泄案
甘草在方剂中的作用及配伍规律
高速公路信息系统维护知识库的建立和应用
基于Drupal发布学者知识库关联数据的研究
新加香薷饮医案6则