APP下载

基于数据挖掘的高血压病肝阳上亢证用药规律分析*

2011-06-11陈素玲李运伦

中国中医基础医学杂志 2011年1期
关键词:阳上亢项集钩藤

傅 爽,陈素玲,李运伦

(1.山东中医药大学理工学院,山东 济南 250355;2.山东中医药大学附属医院 心脏内科,山东 济南 250011

高血压病又称原发性高血压,是一种常见的心血管疾病,而肝阳上亢证是高血压病最常见的证候类型。中医药在辨证论治高血压病方面有自身的特色和优势,然而自古至今大部分处方均为各医家经验用药,带有一定的主观性和片面性。如何集各家所长,又能摒除个人用药的偏倚,找到能够达到最佳疗效的药物组方,是现今亟待解决的研究课题。数据挖掘的许多方法既能借鉴专家意见,又能够尽量消除主观性等随机误差,所以可以利用其对用药规律进行较为科学的探讨。本研究拟利用数据挖掘方法,从古今医案中探寻中医药治疗高血压病肝阳上亢证的用药规律。

1 数据来源及预处理

课题组从高血压病(眩晕、头痛)相关的古今医案中搜集到治疗高血压病(眩晕、头痛)肝阳上亢证的处方776篇。由于产地、炮制、用药部位的不同,即便同一品种的药物也有不同的药名,对此均做了统一处理,“生白芍”、“炒白芍”均作“白芍”,“钓藤”、“吊藤”、“钓钩藤”、“钩丁”、“倒挂金钩”、“钩耳”、“双钩藤”、“钩藤皮”、“钩藤茎枝”、“钩藤钩子”、“嫩钩”均作“钩藤”。在这776篇处方中,共得到药物252种,从中选取出现频率较高的药物53种将其数字化,出现为“1”,不出现为“0”,并利用SPSS17.0生成数据库。

2 数据挖掘方法的原理及步骤

2.1 药物分布的频数分析

单味药在方剂中出现的频数实际上是中药常用程度的数量化标准。先利用 SPSS17.0中的“frequency”命令计算各药物出现的频数及频率,将出现频率大于15%的药物按频率高低次序列出。

2.2 基于粗糙集理论的属性约简〔1〕

系统中的属性并不同等重要,有些甚至是冗余的。属性约简就是在保持系统分类能力不变的条件下,删除那些不相关或者不重要的属性。若将这些属性删除,不仅不会改变决策表的分类或预测能力,反而会提高系统潜在知识的清晰度。而粗糙集理论〔1〕是处理模糊和不明确问题的一种较新的数学工具,主要应用于研究不完整数据、不确定知识的表达、学习及归纳。它无需提供问题所需处理的数据集合之外的任何先验知识——避免了专家的主观经验。

由于数据库中的数据来源于古今不同的医案,而不同时期、不同的中医都有自己的用药习惯,不同的患者除了具有肝阳上亢证的症状以外还有其他自身所特有的症状,所以在第一步利用频数分析得到的出现频率较高的药物并不一定是对肝阳上亢证的治疗起关键作用的药物,属性约简能在一定程度上摒弃这样一些随机因素,保留实质上重要的属性,使我们能进一步了解到治疗肝阳上亢证所常用的药物。

2.3 药物的关联规则分析方法

对采用属性约简以后保留下来的高频药物采用关联规则的Apriori算法进行分析,旨在找出已知和未知的药对和药组。

关联规则〔2〕是一种简单但很实用的数据挖掘方法。关联规则算法本质上是一种对条件概率、联合概率方法的简化,并在这个简化过程中增加了对数据库扫描次数和效率的改进,从而使算法更加实用化。本文使用的是Apriori算法,算法利用了频繁项集的子集必是频繁项集,非频繁项集的超集必是非频繁项集的特点。算法的实现过程如下:

(1)通过单趟扫描事务数据库D计算出所有1-项集的支持度,从而得到满足最小支持度s%的频繁1-项集构成的集合 L1;(2)为产生k-项集构成的集合Lk,先生成一个候选频繁 k-项集的集合Ck。若 P,Q ∈ Lk-1,P ={p1,p2,…,pk-1},Q ={q1,q2,…qk-1},并且当 1 ≤ i≤ k - 1 时,pi=qi,当 i=k - 1 时,pk-1≠ qk-1,则 P ∪ Q={p1,p2,…,pk-2,pk-1,qk-1}是候选频繁 k - 项集的集合 Ck中的元素;(3)由于Ck是Lk的超集,可能有些元素不是频繁的。由于任何非频繁的k-1项集必定形不成频繁k-项集的子集,所以当候选k-项集的某个k-1子集不是Lk-1中的成员时,则该候选频繁项集不可能是频繁的,可以从Ck中移去。通过单趟扫描事务数据库D,计算Ck中各个项集的支持度,将Ck中不满足最小支持度s%的项集删除,形成由频繁k-项集构成的集合Lk;(4)通过迭代循环,重复上述步骤(1)~(2),直到不能产生新的频繁项集的集合为止。

3 数据挖掘结果

3.1 药物分布的频数分析结果

表1显示,在所收集的776例处方中,按照药物出现频数的高低进行排序,出现频率大于15%的前15味药物如下:珍珠母、钩藤、菊花、玄参、茯苓、白芍、黄芩、丹皮、甘草、牛膝、天麻、桑寄生、枸杞、牡蛎和酸枣仁。按照中药学的功效分类标准对其功效进行归类。

表1 药物出现的频率和频率统计表

3.2 利用粗糙集理论进行知识约简

表2显示,采用粗糙集理论Johnson算法对所收集的776例处方药物进行属性约简,约简结果保留了以下16味药物,即钩藤、菊花、玄参、珍珠母、黄芩、茯苓、白芍、丹皮、怀牛膝、首乌、当归、龟板、石决明、桑寄生、桑叶和菖蒲,包括平肝潜阳药(钩藤、菊花、珍珠母、龟板、石决明)、滋补肝肾阴液药(玄参、白芍、怀牛膝、首乌、桑寄生)、健脾药(茯苓)、清热药(黄芩、丹皮)、养血药(当归)和祛风药(桑叶)。同时属性约简结果还认为,在药物频次出现较高的前15味药物中,甘草、天麻、牡蛎、枸杞、酸枣仁并不重要,是可以被约简掉的。药物分布的频数分析和基于粗糙集理论的属性约简均认为,重要的药物是珍珠母、钩藤、菊花、玄参、茯苓、白芍、黄芩、怀牛膝、丹皮、桑寄生,2种数据挖掘方法所得出的结论基本上是吻合的。

3.3 药物关联规则分析

3.3.1 药对配伍结果 表2显示,将以上保留的药物通过频繁项集挖掘出的药对,按照药对出现频数的高低进行排序,出现频数大于25%的药对共10组,即:钩藤 +珍珠母、钩藤 +菊花、珍珠母 +白芍、珍珠母+菊花、珍珠母+玄参、钩藤+黄芩、珍珠母+黄芩、珍珠母+茯苓、钩藤+茯苓、钩藤+白芍。

3.3.2 3味药组配伍结果 表3显示,将以上保留的药物通过频繁项集挖掘出的3味药的药组,按照药组对出现频数的高低进行排序,出现频数较高的药组共8组,即:钩藤 +珍珠母 +菊花、钩藤 +珍珠母+黄芩、钩藤+珍珠母+白芍、珍珠母+白芍+玄参、钩藤+珍珠母 +茯苓、钩藤 +菊花 +黄芩、钩藤+菊花+茯苓、钩藤+菊花+白芍。

表2 药对统计分析

表3 3味药组统计分析

3.3.3 4味药组配伍结果 表4显示,将以上保留的药物通过频繁项集挖掘出的四味药的药组,按照药组对出现频数的高低进行排序,出现频数较高的药组共4组,即:钩藤 +珍珠母 +菊花 +白芍、钩藤+珍珠母+黄芩+菊花、钩藤 +珍珠母 +菊花+茯苓、钩藤+珍珠母+玄参+白芍、珍珠母+玄参+白芍+菊花。

3.3.4 5味药组配伍结果 表5显示,将以上保留的药物通过频繁项集挖掘出的5味药的药组,按照药组对出现频数的高低进行排序,出现频数较高的药组共3组,即钩藤+珍珠母+菊花+白芍+玄参、钩藤+珍珠母+菊花+白芍+茯苓、钩藤+珍珠母+菊花+白芍+黄芩。

表4 4味药组统计分析

表5 5味药组统计分析

4 讨论

数据挖掘[2]就是一门致力于从大量数据中提取或“挖掘”知识的学科。数据挖掘具有分类、估计与预测、聚类、关联和序列发现、描述等功能。从大量的数据中挖掘有价值的模式或规律,常应用决策树理论、人工神经网络以及关联规则等,挖掘到的知识和规律是否有用,除去相关领域专家的指导和评价外,数据本身统计方面的特性也必不可少,特别是对挖掘到的模式和关系进行解释和评价时,将更多地应用到统计学的方法和思想。在数据挖掘过程中多种方法交互、混合使用,比单一方法更能有效挖掘出所需要的知识。

从上面药味分布的频数和知识约简结果统计中可以看出,治疗高血压病(眩晕、头痛)肝阳上亢证的药味达252味,常用中药10余味,因此中医治疗高血压病(眩晕、头痛)肝阳上亢证组方用药非常广泛和灵活,不仅要考虑主症,还要对很多兼症加以辨证用药。从各味常用药味的功效来看,所用的药类比例轻重有明显不同,其中以平肝潜阳药和滋阴药出现的频率较高,如平肝潜阳类药物(珍珠母、钩藤、菊花、天麻、牡蛎)共出现1539次/776方,平均1.98次/方,滋补肝肾阴液类药物(玄参、白芍、枸杞、桑寄生、怀牛膝)共出现1123次/776方,平均1.44次/方,也从侧面反映了高血压病(头痛、眩晕)肝阳上亢证的“阴虚阳亢”病机特征及证候归属。其他健脾药、清热药和安神药也是治疗高血压病肝阳上亢证的常用药物,是平肝潜阳方剂的重要组成部分,如健脾药(茯苓、甘草)共出现504次/776方,平均0.65次/方,清热药(黄芩、丹皮)共出现449次/776方,平均0.59次/方,安神药(茯苓、枣仁)共出现453次/776方,平均0.58次/方。由此可见,潜阳药、滋阴药、健脾药、清热药和安神药的遣用是中医治疗高血压病(头痛、眩晕)肝阳上亢证的基本配伍规律。

药对或药组是由2味或2味以上药物组成,分析药对药组,对于深入探讨治疗高血压病的中药复方的配伍规律有重要意义,特别是通过关联分析可以找出在临床上高频使用而还未载入中医书籍的药对和药组〔3〕。表2、表3显示,出现频率大于 25%的10组药对中有6组属于潜阳药配伍潜阳药或潜阳药配伍滋阴药,出现频率大于14%的8组药组中有4组属于潜阳药配伍潜阳药或潜阳药配伍滋阴药。可见,潜阳药不论是使用次数还是与其他药组成的药对药组都占有相当大的比率,而同其配伍最多的药类是潜阳药和滋阴药。中医学认为,高血压病肝阳上亢证的病机特征阴虚阳亢、肝肾阴液亏虚为本,亢阳上扰为标,亢阳上扰在高血压病肝阳上亢证的病机演变中占有特殊重要的地位,治疗宜平潜亢阳为主兼以滋补阴液〔4〕。因此,潜阳药配伍滋阴药为主的药对药组是治疗高血压病(头痛、眩晕)肝阳上亢证方剂的基本结构。

高血压病肝阳上亢证的基本病机是阴虚阳亢,而亢阳升腾太过可以化火、生热,肝阳、肝火可以影响脾导致脾气亏虚,肝阳、肝火上扰于心而导致神志不安,因此火热炽盛、脾气亏虚和神志不安也是高血压病肝阳上亢证病机演变的重要内容。本研究发现,清热药(黄芩、丹皮)、安神药(枣仁)和健脾药(茯苓)既是使用频率比较高的药物,也是药对、药组中常用的配伍药物,在潜阳、滋阴的基础上,清火热、健脾气、安神志。可见,健脾药、清热药和安神药的配伍既针对高血压病肝阳上亢证的病机演变过程,其配伍与否对治疗效果也有一定的影响,是中医治疗高血压病肝阳上亢证不可忽视的配伍药类。

本研究采用数据挖掘技术中的关联规则和链接分析工具,对中医治疗高血压病(头痛、眩晕)肝阳上亢证的医案进行了分析,找到了中医治疗高血压病(头痛、眩晕)肝阳上亢证的处方用药规律,其结果与中医理论一致,说明数据挖掘技术是适合分析中医临床数据的一种科学有效的方法。

[1]张文修,吴伟业,梁吉业.粗糙集理论及方法[M].北京:科学出版社.2001.78-89.

[2]梁循.数据挖掘算法与应用[M].北京:北京大学出版社.2006,56-63.

[3]周鲁,周晓芳,李鹏志.中药复方治疗病毒性心肌炎用药分析[J].辽宁中医杂志.2005,32(8):827-828.

[4]李运伦.滋阴潜阳法在内科杂病中的应用[J].山东卫生.2004,(5):31-32.

猜你喜欢

阳上亢项集钩藤
针刺联合硝苯地平控释片对高血压头痛(肝阳上亢证)的治疗效果观察
肝火旺和肝阳上亢,你会区分吗
不同产地钩藤的药用成分含量及不同温度烘干的影响
华钩藤研究综述
基于矩阵相乘的Apriori改进算法
不确定数据的约束频繁闭项集挖掘算法
肝阳上亢型高血压病的外治方法探讨
一种自底向上的最大频繁项集挖掘方法
天麻钩藤饮加减合复方羊角颗粒治疗肝阳上亢型头痛的临床疗效观察
HPLC测定钩藤药材中钩藤碱、异钩藤碱的含量