APP下载

基于朴素贝叶斯算法的全国名中医诊治儿童过敏性紫癜的症-证-药规律初探❋

2023-08-19姜盈盈许玉龙任献青蔡明阳席乐迎

中国中医基础医学杂志 2023年8期
关键词:医案频数紫癜

姜盈盈,许玉龙,任献青,△,蔡明阳,席乐迎,许 爽,,丁 樱,

(1.河南中医药大学,郑州 450046;2.河南中医药大学儿科医学院,郑州 450000;3.河南中医药大学第一附属医院,郑州 450008;4.北京中医药大学,北京 100029)

过敏性紫癜(henoch-schonlein purpura,HSP)是儿科临床常见的全身性小血管炎,也被称为免疫球蛋白A血管炎(immunoglobulin a vasculitis,IgAV),表现为非血小板减少性皮肤紫癜,伴或不伴腹痛、胃肠出血、关节痛、肾脏损害等症状,少数患儿伴有血管神经性水肿等[1]。HSP 年发病率为每10万儿童10~30 例,近几年随着饮食结构改变、环境污染影响等,呈现逐年升高的趋势[2]。且研究发现约20%~80%的HSP患儿在起病 12 周内出现血尿和蛋白尿等肾脏损伤,即紫癜性肾炎(henoch-schönlein purpura nephritis,HSPN)[3],约1%~2%患儿可发展为终末期肾病,是导致死亡的主要原因[4],疾病的远期预后与肾脏的受累程度有关,少数病例还可出现严重的胃肠道及其他器官损伤。病情常反复发作、迁延难愈,复发率高达31.9%[5],严重影响患儿身心健康、生活质量。

有大量临床研究表明,中医药治疗在控制紫癜症状、预防肾脏损伤、降低复发率及不良反应发生率等方面的疗效已经得到了确认及肯定[6-11]。西医治疗以抗过敏及对症治疗为主,应用免疫抑制剂等药物时副作用较大。中医在HSP诊治方面积累了丰富的经验,名中医在总结和继承传统理论的同时,对HSP的辨证论治进行了创新与发展,然其多散在于著作及期刊文献中,关于名中医经验医案的症-证-药规律的研究缺少较全面的系统整理和深度挖掘。本文以中国知网及河南中医药大学馆藏书中有关儿童HSP的医案为对象,采用频数分析、贝叶斯算法进行挖掘,探讨名中医辨治儿童HSP的症-证-药规律,为临床辨治提供参考,也可为后期构建中医辅助决策系统提供算法支持。

1 资料与方法

1.1 数据来源

研究数据来源于中国知网(建库至2020年9月)及河南中医药大学图书馆数据库,以[“主题”(“紫癜” OR“紫斑”OR“葡萄疫”OR“HSP”) AND“全文”(“中医”OR“医案” OR“验案” OR“举隅”)]为检索式,并根据名中医判定标准,筛选符合HSP中西医疾病诊断标准、四诊资料完整的名中医诊治儿童HSP的医案,包括症状、体征、舌脉、证型、用药等信息。

1.2 纳入标准

文献及著作纳入标准:①名中医诊治儿童HSP的医案类、临床经验类文献及著作,名中医判定标准为国家中医药管理局认定的国医大师、第1~5批全国名中医药学术经验继承工作指导老师、省级名中医、自治区名中医、直辖市名中医、享受国务院政府特殊津贴有突出贡献的专家等,且对儿童HSP有较系统研究的中医知名专家,如丁樱、汪受传、贾六金、胡天成、皮持衡、裴正学、赵健雄等名老中医;②文献发表在国家级及以上的相关期刊。

医案纳入标准:①HSP中西医诊断及其证型明确;②患者年龄在18岁以下;③医案记录资料完整,同时包括症状、证型、药物组成等;④转归为好转或痊愈。

1.3 排除标准

文献及著作排除标准:①重复的类似文献;②科普类、理论综述等与中西医临床治疗无关的文献。

医案排除标准:①合并其他严重的心脑血管等疾病;②前人误诊、无效描述的医案;③用药不详的医案;④中西医联合用药的医案。

1.4 数据规范

主要依据《中医诊断学》[12]规范症状名称,如“纳欠佳”“纳食减少”“纳差”“食欲减退”统一为“食少纳呆”。参照《中医临床诊疗术语》[13]和《中医证候学》[14]规范中医证型名称,如“风热伤络”“邪热伤络”“外感风热”等统一为“风热伤络”。参照2020年版《中华人民共和国药典》[15]规范中药名称,如“金银花”“二花”“银花”等统一为“金银花”;将合在一起的中药拆分开,如“龙牡”拆分为“龙骨” “牡蛎”。

1.5 质量控制

严格按照纳排标准选择期刊文献及书籍,由2名研究者独立进行医案筛选和数据提取,数据录入时由两人进行审核校对,如有意见由第三方专家裁定。

1.6 统计方法

朴素贝叶斯(naive bayes,NB) 算法属于机器学习方法中的有监督学习,是具有分类标签属性的文本信息分类的一种较为成熟的概率算法,方法简单高效、分类效率稳定、计算速度快、准确率高、易于理解[16],是基于贝叶斯定理与特征条件独立假设的分类方法[17]。

将纳入医案的年龄、症状、证型、中药等数据分别录入Microsoft Excel信息采集表中,采用标准化的特征编码表示方法进行整理,出现上述对应信息的赋值为 1,未出现的则赋值为 0,建立名中医诊治儿童HSP数据库,共有664条医案数据。数据库中证型的列为标签列,作为算法学习时的标签以及测试时的参考结果。运用Excel软件统计症状、证型及药物的频数;运用朴素贝叶斯算法对数据分析,训练集采用全部664条症状-证型数据和中药-证型数据,得到相关规则模型以分值形式展示。训练集学习时构建症状-证型辨证规则和证型-中药规则模型,结果分值以玫瑰图展示,具体贝叶斯分析过程详见团队研究成果[18-19]。

测试集使用2种类型测试验证,一种使用全部的664条症状数据做测试,另一种使用133条症状数据(即全部数据的20%)验证测试对比。测试集中不包含证候列(标签列),用模型规则辨别得到的结果与标签对比,用准确率、召回率等机器学习常用指标来衡量模型效果。

2 结果

2.1 检索结果

对中国知网和校图书馆的文献及书籍进行人工逐篇、逐本筛检,依据纳排标准,最终筛选到261位儿科名中医辨治HSP的学术思想医案,包括455则期刊文献医案及209则著作医案,共664则医案数据,每位专家平均2~3篇医案。

2.2 频数分析结果

经数据处理规范后,数据库内共录入664则HSP医案中的151个症状、12种证型、323味药物,其中出现频数>5的症状、舌脉、证型、中药统计表见表1至表4。结果示HSP除常见的双下肢紫癜、腹痛、关节痛三大主症外,还有食少纳呆、咽红、大便干结、口干口渴、神疲乏力等;舌脉以舌红、苔黄、脉数、脉细、脉滑等为主;证型以血热妄行证、风热伤络证、湿热痹阻证、瘀血阻络证等多见;常用药物以牡丹皮、生地黄、赤芍、紫草、白茅根、连翘等祛风清热、凉血止血之品多见。

表1 症状统计频数表(频数>5次)

表2 舌脉统计频数表(频数>5次)

表3 证型统计频数表(频数>5次)

表4 中药统计频数表(频数>5次)

2.3 朴素贝叶斯算法分析结果

对频数>5的症状、证候、中药数据进行贝叶斯算法分析。分析症状-证候时以证候作为标签,症状作为属性,得到分值形式的规则模型,分值越高表示对证候的影响越大,取前10个分值最大的症状进行展示,规则阈值统一为10;分析中药-证候时以证候作为标签,中药作为属性,得到分值形式的模型,分值越高表示对证候的关联越大,取前10个分值最大的中药进行展示(表5至表13)。

表5 血热妄行证分析结果(阈值为10)

表6 风热伤络证分析结果(阈值为10)

表7 湿热痹阻证分析结果(阈值为10)

表8 气不摄血证分析结果(阈值为10)

表9 阴虚火旺证分析结果(阈值为10)

表10 气阴两虚证分析结果(阈值为10)

表11 脾肾气虚证分析结果(阈值为10)

表12 胃肠积热证分析结果(阈值为10)

表13 脾肾阳虚证分析结果(阈值为10)

将症状-证候模型,通过统计玫瑰图展示见图1所示,图中分值较高的症状花瓣较大较长,表明对证候的影响较大。为节省版面,其他证候辨证规则玫瑰图不再展示。

图1 血热妄行证规则玫瑰图

2.4 朴素贝叶斯模型分类的评估结果

为了验证贝叶斯模型得到规则的合理性和准确性,使用全部数据进行训练得到模型,训练模型时,症状是自变量特征,证型标签是分类结果。然后用模型对全部数据、20%数据作为测试集分别进行辨证测试,辨证时,数据只保留症状部分,模型分类的结果与原始标签进行对比,使用机器学习常用的评估指标来量化分类效果。

在模型的评估指标上,使用机器学习、医学领域常用的受试者工作特征曲线(receiver operating characteristic curve,ROC曲线)、曲线下面积(area under curve,AUC)来评估模型在测试集上的表现[20],ROC曲线是比较分类模型有效性的可视化工具,AUC表示ROC曲线下的面积,可直观评价分类器的好坏,取值在0.5 ~ 1之间,值越大越好。同时采用二分类常用的准确率、精确率、召回率、F1与AUC值等5种分类性能指标对结果进行评估,作为衡量模型的指标。

将收集的664则医案数据作为训练集用来训练学习模型,全部作为测试集用来衡量模型的表现。在表14中,可看到在使用全部数据作为测试集时,使用朴素贝叶斯算法建立的胃肠积热证分类器模型分类的准确率最高,为96.23%。气不摄血证分类器模型分类的综合指标最高,为72.13%。脾肾阳虚证分类器模型分类的AUC值最大,为0.956 3;其次为阴虚火旺证,为0.954 9,两者ROC曲线见图2、图3。

图2 脾肾阳虚证ROC曲线

图3 阴虚火旺证ROC曲线

表14 朴素贝叶斯模型预测的二分类机器学习指标结果

将收集的664则医案中80%的数据作为训练集用来得到规则模型,剩余20%作为测试集用来衡量规则模型的表现。从表15中可看到使用20%数据作为测试集时,使用朴素贝叶斯算法建立的胃肠积热证分类器模型分类的准确率最高,为96.24%;使用朴素贝叶斯算法建立的阴虚火旺证分类器模型分类的综合指标最高,为74.29%;使用朴素贝叶斯算法建立的脾肾气虚证分类器模型分类的AUC值最大,为0.9924。

表15 朴素贝叶斯模型预测的二分类机器学习指标结果

分析所有的测试结果,发现使用贝叶斯得到的模型在分类时具有良好效果,特别是在准确率上绝大部分在70%以上,说明了分析方法和得到模型的可靠性。

3 讨论

中医对紫癜的诊治积累了丰富的经验,名中医在总结和继承传统理论的同时,对HSP的辨证论治等方面进行创新与发展,均证实疗效明确,且可控制复发率、肾损率。中医医案记录着各医家的诊疗经验及学术思想,是中医学术的载体[21],具极大的学习、借鉴意义,挖掘其隐含的辨证规律有利于更好地传承和发扬中医。

3.1 频数分析HSP症-证-药规律探究

由频数分析可知HSP常见症状中除了主症双下肢紫癜外,还包括腹痛、食少纳呆、关节痛、咽红、大便干结、口干口渴、神疲乏力、皮肤瘙痒、发热,其中腹痛、关节痛是HSP常见的伴发症状。咽红、大便干结、口干口渴、发热均为热象,可知紫癜病因以“热”为主。神疲乏力为虚证,因紫癜易反复,久病多虚,在疾病后期常见。皮肤瘙痒常见于风热伤络证,因风热邪气侵袭肌表而引发瘙痒。

对全国名中医近现代医案证型进行统计,再结合临床经验,可将儿童HSP的中医证型归为血热妄行证、风热伤络证、湿热痹阻证、瘀血阻络证、气不摄血证、阴虚火旺证、气阴两虚证、脾肾气虚证、胃肠积热证、脾肾阳虚证等10个常见证型,其中血热妄行证、风热伤络证、湿热痹阻证、瘀血阻络证出现次数最多,临床也最为多见,可推测本病病因主要与“热、风、湿、瘀”有关。现代大多医家均认为“瘀”既可作为致病因素,又可作为病理产物,伴随疾病的始终[22-24],故瘀血阻络证亦出现频次较高。汪受传教授分期治疗儿童HSP时将本病分为风热偏盛证、血热偏盛证、湿热痹阻证、气阴两虚兼瘀证、气阴两虚证、脾肾亏虚证[25],与本研究挖掘全国名中医辨治儿童HSP所得的辨证思想基本一致。

在中药频数统计分析中,治疗儿童HSP排名前十的中药有牡丹皮、生地黄、甘草、赤芍、白茅根、紫草、连翘、茯苓、金银花、当归,以清热凉血药、清热解毒药等为主,可知小儿HSP实证的致病因素与“热、毒”有关,这或与小儿纯阳之体、阳常有余的生理特点相关,患病易于热化。牡丹皮、生地黄、赤芍、紫草均属清热凉血类药,走血分,清解营分、血分热邪,临床中亦常用这几味药,尤常用于血热妄行证,《本草新编》言生地黄“热血妄行,或吐血或,衄血,或下血,宜用之为主”[26]。牡丹皮、生地黄还具清热养阴之功,有清透阴分伏热之效,阴虚火旺证型中亦可加之清虚火、生阴津。《本草纲目》言“白茅根,甘能除伏热,利小便,故能至诸血……治黄疸水肿”[27],白茅根既可清热凉血,又能利水生津,在临床中出现血尿症状时尤为常用。连翘、金银花皆为清热解毒药,还可疏散风热,宣透肌表紫癜之热毒,现代研究也报道二者均有抗菌、抗炎、解热、解毒等作用[28]。茯苓行水之功多,亦可益心脾,后期紫癜虚证见蛋白尿、浮肿时可用之利水消肿,气不摄血证时亦可用之健脾宁心以统血。当归可治风治血、补血除瘀,现代研究还报道本品可扩张血管、改善微循环[29],对风热、血虚、血热、血瘀、血滞之证,均可随证配伍。

3.2 贝叶斯算法分析HSP症-证-药规律探究

由症状-证型、证型-中药相关联的贝叶斯算法分析结果可知:

血热妄行证的核心症状有舌绛、苔燥、呕血、斑色深红、舌红、鼻衄、乳蛾肿大、口唇色红、紫癜大量、脉数,其中舌绛分值最高,提示热盛,其余症状也均为热象。所用核心药物以水牛角、徐长卿、海风藤、生地黄、牡丹皮、紫草等清热凉血药、祛风通络药、清热解毒药为主,其中水牛角使用频率最高,有清热解毒、凉血止血之功效。

风热伤络证的核心症状有恶风、鼻塞、流涕、脉浮、咳嗽、斑色鲜红、头痛、咽痛、双下肢紫癜、咯痰。其中恶风分值最高,为外感风邪之象;鼻塞、流涕、脉浮、咳嗽、头痛、咯痰亦多因风邪外感;紫癜斑色鲜红、咽痛等为外感热邪之症。所用核心药物以薄荷、淡豆豉、麻黄、牛蒡子、连翘、蝉蜕等发散风热药为主,其中薄荷的使用频率最高,有疏散风热透疹之功效。

湿热痹阻证核心症状有苔腻、大便黏腻、不欲饮水、脉濡、脉滑、身体困重、苔厚、双下肢浮肿、形体肥胖、有痰难咯。其中苔腻分值最高,提示湿浊内蕴;脉滑、苔厚、形体肥胖、有痰等可提示痰浊之象;脾主肌肉,湿热之邪困脾,留滞肌肉,故可见身体困重。所用核心药物以苍术、滑石、白豆蔻、黄柏、茵陈、薏苡仁等化湿药、清热燥湿药、祛风湿通络药为主,其中苍术、滑石使用频率最高,有清热解毒、燥湿渗湿之功效。

气不摄血证核心症状有心悸、气短懒言、神疲乏力、面色淡白少华、舌淡、面色萎黄、斑色淡红、脉无力、脉弱、便溏。其中心悸分值最高,提示心气不足;次之的气短懒言、神疲乏力为一派气虚之象;面色淡白少华、面色萎黄、便溏提示脾气虚。所用核心药物以龙眼肉、远志、酸枣仁、党参、黄芪、白术等补血药、补气药、养心药为主,其中龙眼肉、远志、酸枣仁使用频率最高,有补心脾、益气血之功效。

阴虚火旺证核心症状有两颧潮红、五心烦热、苔少、盗汗、手足心热、脉细、低热、咽干、斑色暗红、腰膝酸软。其中两颧潮红分值最高,与肾阴亏虚、虚火内生有关,其余核心症状均为阴虚之象。所用核心药物以墨旱莲、沙参、龟板、女贞子、地骨皮、熟地黄、麦冬等补阴药、清虚热药、补肾固精药为主,其中墨旱莲使用频率最高,有滋阴清热、凉血止血之功效。

气阴两虚证核心症状有易感冒、手足心热、自汗、形体肥胖、全身浮肿、苔少、苔干少津、脉细、小便浑浊有泡沫、身体困重。其中易感冒、手足心热分值最高,易感冒为肺气虚之症,手足心热为肾阴虚之象。所用核心药物以太子参、白及、天花粉、山茱萸、桑寄生、黄芪等补气药、补阴药为主,其中太子参使用频率最高,有补气健脾、养阴生津之功效。

脾肾气虚证核心症状有全身浮肿、面色晦暗、脉虚、腰膝酸软、便溏、舌淡、满月脸、腰痛、形体肥胖、齿痕舌。其中全身浮肿分值最高,脾气虚失于运化水液,而肾主水,肾气虚,气化失司,水邪泛溢肌肤可致全身浮肿;次之的面色晦暗可能与紫癜病的血瘀贯穿本病始终有关;其余诸症均体现脾肾气虚之象。所用核心药物以杜仲、山药、金樱子、芡实、附子、桑寄生等补气药、补阳药、固精缩尿药为主,其中杜仲使用频率最高,有补中、益精气之功效。

胃肠积热证核心症状有口臭、齿衄、口唇色红、腹胀、恶心、面红、脉数、苔干少津、眠差、咯痰。其中口臭分值最高,由胃火内盛,蒸腾胃中浊气上冲所致;齿衄、口唇色红等亦为胃热之象。所用核心药物以藿香、漏芦、枳实、石膏、厚朴、栀子等清热药、化湿药、理气药为主,其中藿香、漏芦使用频率最高,有清热解毒、化湿和中之功效。

脾肾阳虚证核心症状有面色白光白、舌淡、腰痛、脉沉、脉虚、齿痕舌、双下肢浮肿、小便量少、舌胖、全身浮肿。其中面色白光白分值最高,提示阳虚证,可由水液内停所致;舌淡、脉虚均提示虚证;腰痛、浮肿、小便量少等可见于肾虚;舌胖、齿痕舌可见于脾虚,致湿盛内停于舌。所用核心药物以附子、桑寄生、猪苓、金樱子、玉米须、杜仲等补阳药、利水消肿药为主,其中附子、败酱草、桑寄生、猪苓、金樱子使用频率较高,附子可中温脾阳、下温肾阳,败酱草可除浮肿、破瘀血,桑寄生有主腰痛之效,猪苓可利水消肿,金樱子有收敛固精之效,可治疗尿蛋白精微泄下。

根据朴素贝叶斯算法分析挖掘得到名中医治疗儿童HSP的核心症状、证型及辨治规律,且通过测试集对贝叶斯模型进行评估,分类器模型分类的指标很高,准确率、精确率较高,模型质量较好,可更好地反映辨证用药规律。由分析结果可知,很大程度上与现代中医治疗儿童HSP的辨治思想相似,也基本符合本病常见证型的核心症状、用药规律,对临床有一定的指导价值,也可为后期构建中医辅助决策系统提供算法支持。

猜你喜欢

医案频数紫癜
说说过敏性紫癜
医案聊斋续篇 吐泻案
医案聊斋续篇 晨泄案
中考频数分布直方图题型展示
学习制作频数分布直方图三部曲
蒙药治疗干燥综合征伴血小板减少性紫癜1例
激素在过敏性紫癜的应用
频数和频率
盗汗病治疗药物性味归经频数分析
新加香薷饮医案6则