APP下载

690例慢性乙型肝炎病毒感染伴脂肪肝患者证候要素特征的隐结构分析❋

2022-06-09梁淑芳程彬彬陈建国郭晓冬翟笑枫

中国中医基础医学杂志 2022年5期
关键词:互信息肝郁气滞

余 钦, 余 宋, 洪 靖, 鲁 健, 梁淑芳, 刘 群, 程彬彬,陈建国,5, 郭晓冬△, 翟笑枫,△

(1.上海中医药大学附属岳阳中西医结合医院, 上海 200437;2.中国人民解放军海军军医大学中医系,上海 200433;3.江苏省启东肝癌防治研究所,江苏 启东 226200;4.中国人民解放军海军军医大学第一附属医院, 上海 200433;5.南通大学附属肿瘤医院,江苏 南通 226231)

中医证候辨证规范化研究一直是中医发展现代化及中西医有效结合的重要问题,中医辨证涉及到对患者进行分类[1,2]。聚类分析(cluster analysis)是根据事物自身的特性,对被聚类对象进行类别划分的统计分析方法,属于探索性无监督统计方法[3];因子分析是运用降维的思想通过消除数据的多元共线性,探索能综合所有指标主要信息相对独立的潜在变量分析方法[4]。聚类分析和因子分析均属于多元统计分析方法,在挖掘从症状到证候的关系时,单个方法只能从单一角度进行分析,在症状属于多种证候或患者具有兼夹证候的情况下无法进行多角度分析,不符合中医辨证的临床实际[5]。隐结构分析是基于统计学和概率知识对症状数据进行分析的方法,找出隐变量并建立相应的隐结构模型(latent structure model,LSM),再根据模型对患者进行聚类划分,不仅可以辨析症状之间的复杂关系,对症状进行分类、挖掘特征人群,弥补其他方法的不足,还可以揭示病种的证候特点,发掘出新的中医学理论知识,更接近中医的辨证论治体系,优于上述其他统计方法[6,7]。

本研究利用Latern 5.0软件(香港科技大学计算机科学及工程学系.孔明灯隐结构分析软件.http://www.cse.ust.hk/~lzhang/tcm/resource.html.)中的最优双步隐树分析聚类模型[8],通过建立690例慢性乙型肝炎病毒(hepatitis B virus,HBV)感染伴脂肪肝患者中医症状的隐结构模型,评价该类人群的证候要素特征,为临床辨证施治提供指导。

1 资料与方法

1.1 病例来源

研究对象来源于江苏省启东地区“肝癌早诊早治”队列,乙肝表面抗原(hepatitis B surface antigen,HBsAg)阳性者,利用B超诊断脂肪肝。

1.2 诊断标准

慢性乙型肝炎病毒(hepatitis B virus,HBV)感染诊断参照《慢性乙型肝炎防治指南(2019版)》[9]。

脂肪肝诊断参照《非酒精性脂肪性肝病防治指南(2018更新版)》[10]:B超显示肝脏前场回声增强(“明亮肝”),回声强于肾脏;肝内管道结构显示不清楚;远场回声衰减。具备以上3项中任意2项者即能做出脂肪肝诊断。

1.3 纳入标准

同时符合HBV慢性感染以及脂肪肝的临床诊断;基线及问诊资料完整;年龄>18岁;签署知情同意书。

1.4 排除标准

合并有其他类型肝炎病毒、Epstein-Barr(EB)病毒、人类免疫缺陷病毒等;有严重心、脑、肾等其他脏器器质性疾病者;精神异常不能配合者。

1.5 数据准备及数据库建立

使用本课题组前期通过文献检索、专家讨论等制定出的中医证候调查问卷表[11,12],由经过培训的中医师(主治及以上职称)依据问卷内容逐一问诊。问诊结果分为“无、有”两类分别赋值“0、1”,用Epidata录入建立数据库。根据出现频率(>10%)和数据分析后确定善太息、胸闷、便溏等61个问诊信息参与隐结构分析。

1.6 证型及证候要素等名称规范化

参考慢性乙型肝炎[13-15]、脂肪肝[16,17]各版指南对证型分类及证候要素的描述规范,对症状名称、证候名称进行相应的规范化处理。

1.7 统计学方法

采用Latern5.0软件的最优双步隐树分析聚类模型,采用人机结合模式对数据进行聚类分析。

2 结果

2.1 隐变量获取

690例患者年龄(62.73±7.37)岁,男性329例,女性361例。通过隐结构模型,根据数据分布特点引入12个隐变量(Y0~Y11),25个隐类(如图1)。

注:隐变量Y旁边的数字表示该隐变量经数据分析分成的隐类个数,变量之间连线的粗细代表变量关联的强弱,如Y3与便溏、泄泻的关系密切,但是与胃脘喜按的关系更弱。图1 HBV慢性感染合并脂肪肝隐结构模型

2.2 模型诠释

从上述隐结构模型可以看出,各显变量被不同的隐变量(症状)分成不同的类别,通过Latern5.0软件的直连分析可以诠释每个隐变量的内涵,包括每一隐变量与关系密切症状之间的定性定量关系,关联程度用互信息表示。

经软件分析后得出信息曲线图(图2),隐变量Y11由与之关系最密切的烦躁易怒、情志抑郁、发热3个显变量诠释,3个显变量累积信息覆盖率为97%(如表1)。

注:横轴是隐变量Y11所对应的显变量,左右纵轴分别表示互信息(单位bit)的绝对值和信息覆盖度(取值0%~100%)。横坐标上的症状是按其在隐类Y11的相关度大小依次排列。红色曲线:各显变量与隐变量Y11的两两互信息大小,由大到小从左至右排列;蓝色曲线:各显变量与隐变量Y11的累积互信息的大小,由大到小从左至右排列,累积互信息逐渐增大,当到达所要求的95%时,所截取的显变量到此为止,曲线便也在这里停止图2 Y11隐类信息曲线图

表1 隐变量Y11互信息及信息覆盖率比较

隐变量与显变量之间的定性定量关系,还体现在隐类在此研究人群中出现的概率(用显变量在该隐变量中出现的概率表示)。如果定义Y11的症状属于肝郁气滞,隐类S1各症状出现概率普遍高于隐类S0,故隐类S1为具有肝郁气滞症状的人群,发生概率为12%。由此可知,肝郁气滞在总体人群证候中的概率为12%(见表2图3)。

表2 隐变量Y11中显变量出现的条件概率比较

图3 隐变量Y11类概率直方图

2.3 综合聚类分析方法应用

其余隐变量的模型诠释参照Y11,如Y4、Y9也可诠释为肝郁气滞证人群,Y1、Y8诠释为湿热证人群,Y3为脾虚证人群等。由此看出,同一证候类型不止1个隐变量与之对应。如气滞证有Y4、Y9、Y11反映其不同的侧面,Y4反映胸中气滞伴有胃气上逆症状,Y11反映情志方面气滞不畅伴有气郁化火症状,Y9反映气滞在脉象上的表现。而从临床角度分析,不同侧面都是气滞证的表现,也都对气滞证证候诊断有价值。基于此,进一步通过latent 5.0软件的综合聚类模型,将Y4、Y9、Y11反映的不同症状进一步综合,从而得到一个新的隐变量Z1,并对其进行中医诠释(见图4)。

图4 隐变量Z1综合聚类隐结构模型

Z1是2个主症加兼症对隐变量特征的刻画,主症善太息情况(0.19/0.19)、胸闷情况(0.13/0.27);再加上兼症烦躁易怒情况(0.06/0.29)、情志抑郁情况(0.05/0.32),其特点是首2个症状的互信息相对较高,余显著降低(见表3图5)。

表3 隐变量Z1两两互信息及信息覆盖率比较

图5 肝郁气滞证(Z1)的信息曲线

隐变量Z1可以解释为肝郁气滞,则S0为非肝郁气滞人群,S1为肝郁气滞人群,在总体人群中的概率为30%(见表4图6)。

表4 隐变量Z1中显变量出现的条件概率比较

图6 隐变量Z1类概率直方图

2.4 人机结合模式运用中医理论阐释综合聚类隐变量

同理,其他综合聚类隐变量也重新归纳,新产生的综合聚类模型(Z2~Z6)(如图7)。

各综合聚类模型在人群中出现的概率和对应的症状,以及中医病理病机阐释(如表5)。

图7 综合聚类隐结构模型Z2~Z6

表5 综合聚类分析结果

2.5 综合聚类隐变量模型与显变量之间的互信息及信息覆盖率

综合聚类模型与症状之间的互信息与信息覆盖率(如表6)。

表6 综合聚类后各证候类型与问诊信息之间的概率及互信息表

3 讨论

隐结构模型属于树状贝叶斯网[18],是特殊聚类算法[19],不仅可以辨析症状之间的复杂关系,对症状进行分类、挖掘特征人群,还可以揭示病种的证候特点,发掘出新的中医学理论知识,促进中医学的现代化发展进程[6]。香港科技大学的张连文对该模型进行推广及应用[20-24],揭示了肾虚证的证候结构和内容,与中医传统理论及临床认识十分吻合。而且更为重要的是,隐结构分析是基于客观的临床症状,用概率这种量化数据来解释症状和症状、证候和症状、证候和证候之间的关系,没有加入任何人为的经验和判断。

HBV慢性感染和脂肪肝的证候类型只分别见于相关指南和《中药新药临床研究指导原则(试行)》[25],且HBV慢性感染又因所处疾病阶段不同(慢性乙肝携带、肝纤维化、肝硬化等)而有不同的证候辨证标准,难以统一,如果是医生判定又带有主观性和不确定性。而本研究借助隐结构模型评价HBV慢性感染伴脂肪肝患者的主要证候要素相对客观,且针对特定的HBV慢性感染伴脂肪肝人群专门分析特异性强,有助于更精准地辨证施治和统计分析。从本研究隐结构模型结果来看,气滞、脾虚、湿热、血瘀是其主要的证候要素特征,其中尤以气滞和脾虚表现最为重要,较为客观地反映了HBV慢性感染伴脂肪肝的中医证候要素特征。同时,每一证候的对应症状与临床实际比较吻合,如喜太息、胸闷、烦躁易怒、抑郁均能帮助诊断肝郁气滞证,值得临床证候规范化的进一步探索与应用。

目前隐结构模型仍有一定的局限性,数据条目不宜过多或过少,且建立模型时变量太多会导致分析过程缓慢。另外,分析的结果中可能也会出现个别症状在证候归类上与中医理论不一致等问题,导致该变量的诠释困难,一定程度上影响了对隐结构模型可信度的评价。当前这些问题的解决,有赖于中医从业者结合中医理论和临床专家的经验进行综合考虑与判断数据特征的中医临床意义。同时,更新的统计分析技术及相关模型的探索运用,也是未来的研究方向之一。

猜你喜欢

互信息肝郁气滞
柴芍六君汤加味结合自血疗法对脾虚肝郁型慢性荨麻疹患者的疗效观察
自拟脾胃安方治疗脾虚气滞型餐后窘迫综合征的临床观察
气滞胃痛颗粒联合叶酸在慢性萎缩性胃炎治疗中的应用价值分析
加味乌药汤合失笑散加减治疗气滞血瘀型原发性痛经的临床疗效观察
A Meta-analysis of Dachaihu Decoction combined with western medicine in the treatment of acute pancreatitis with the TCM syndrome of liver qi depression and liver-gallbladder dampness-heat
改变肝郁体质,要想得开
谢旭善教授从肝气肝郁证论治胃脘痛经验
基于改进互信息和邻接熵的微博新词发现方法
基于互信息的图像分割算法研究与设计
基于互信息的贝叶斯网络结构学习