APP下载

贝叶斯网络在医学领域中的应用研究

2013-08-21张月黄钢章小雷田理政曾词正

中国医学创新 2013年4期
关键词:概率分布网络结构贝叶斯

张月 黄钢 章小雷 田理政 曾词正

随着人工智能领域的发展,对于不确定性问题的研究也越来越多地得到重视。而贝叶斯网络作为一种将概率论与图论相结合用来处理不确定性推理和数据分析的有效工具,已经成为了人工智能的一个重要研究领域,也是近年来数据挖掘领域中的研究热点之一。在过去的十年中,贝叶斯网络已成为编码专家系统中不确定性的知识流行的代表[1]。

1 贝叶斯网络的概述

1.1 贝叶斯网络的定义 贝叶斯网络(Bayesian Networks,BNs)又称为信念网络、概率网络或因果网络[2],是一种用图的形式表达的一组变量间联合概率分布函数的模型。它是由两个部分组成:一个图形化的结构和一组概率参数的概率模型。图形结构是一个有向无环图 (Directed Acyclic Graph,DAG),其中包括表示变量的节点以及变量有关的不构成任何圆环的有向弧。在给定的父节点下相关联的每个节点(称之为一个子节点)是一个概率分布,而所有节点的概率分布联合起来就代表所有变量的联合分布[3],通过条件概率表(Conditional Probability Table,CPT)来进行表示。因此,一个贝叶斯网络可以表示为B={G,P},(其中 G 是一个能表示变量域的 DAG,P 是相应的一组条件概率集合)。若随机变量集合 V(包含 n 有限个变量),G 表示有向无环图,E 表示有向边的集合,P 表示条件概率分布集,那么可以得到一个贝叶斯网络模型为:B=(G,P)=(V,E,P)。

贝叶斯网络可以从定性和定量两个方面来理解[4]。在定性方面,它用一个有向无环图描述了变量之间的依赖和独立关系;在定量方面,它则用条件概率分布刻画了变量对其父节点的依赖关系。

1.2 贝叶斯网络的语义 在语义上,贝叶斯网络是联合概率分布的分解的一种表示[4]。假设网络中的变量为X1,...,Xn,那么把个变量所附的概率分布相乘就得到联合分布,即

2 贝叶斯网络的学习及构建

2.1 贝叶斯网络的学习 贝叶斯网络构建的过程主要分为两个任务:结构学习和参数学习[5]。结构学习既需要确定网络结构又要确定网络参数,而参数学习是在已知网络结构的条件下确定网络参数的问题。在结构学习和参数学习的过程中,存在着四种类型的问题[6],见表1。

表1 贝叶斯网络结构学习的四种类型

四种类型的描述分别如下: (1) 用完整的资料在已知的网络结构中学习概率参数,经常使用的方法是β分布(Beta distribution)和狄利克雷分布(Dirichlet distribution)。 (2)用不完整的资料在已知的网络结构中学习概率参数,通常采用最大似然估计法(maximum likelihood estimation)及期望优化(expectation maximization)算法,而最常用的是期望优化算法,简称EM算法[7]。 (3) 在完整的资料中学习网络结构,通常采用基于打分搜索(Search and score)的学习方法[8]和基于依赖分析(Dependent-based)的学习方法[9]。 (4) 在不完整的资料中学习网络结构,基本上采用前三个问题改良的EM算法,但在网络中寻找存在许多难题。

2.2 贝叶斯网络的构建 一般贝叶斯网络的构建是首先由相关领域的专家根据事物间的关系来确定出结构模型,即有向无环图,然后再利用其它方法确定每个结点的条件概率。贝叶斯网络构建的专家系统能够对于不同事物之间的因果关系进行定性和定量的描述,并根据相应的观测或干涉作出推理。

3 贝叶斯网络的优势

通过提供图形化的方法来表示和运算概率知识,贝叶斯网络克服了基于规则的系统所具有的许多概念上和计算上的困难[10]。在与统计技术相结合时,这样的图形模型数据建模拥有以下几个优势[11]:(1) 贝叶斯网络将有向无环图与概率理论有机结合,不但有严格概率理论基础,同时也具有更加直观的知识表示形式。一方面,它可以将人类所拥有的知识直接用有向图自然直观地表示出来;另一方面,也可以将统计数据以条件概率的形式融入模型。这样贝叶斯网络就能将人类的先验知识和数据无缝地结合,克服语义网络模型仅能表达处理定性信息的弱点和神经网络、支持向量机等方法不够直观的缺点。(2) 由于该模型编码的所有变量之间的依赖关系,因此它很容易对于一些数据项缺失的情况进行处理。(3) 一个贝叶斯网络可以用对因果关系进行学习,因此可以用来获得一个问题领域的理解以及预测干预的后果。(4) 贝叶斯网络中没有确定的输入或输出节点,节点之间是相互影响的,任何节点观测值的获得或者对于任何节点的干涉,都会对其它节点造成影响,并可以利用贝叶斯网络推理来进行估计预测。(5) 贝叶斯统计结合贝叶斯网络的方法为避免过度拟合数据,提供了高效和有原则的方法。

4 贝叶斯网络在医学领域中的应用

贝叶斯网络既可以通过图论的语言来揭示问题的结构,又按照概率论的原则来对问题结构进行分析,从而大大降低了推理计算的复杂度。因此,贝叶斯网络被用于众多领域来解决实际问题,如医学领域,故障诊断方面,交通管理,工业制造系统,软件工程等。

近年来通过贝叶斯网络解决实际问题的过程中相继出现了有关的应用系统和文献。在医学领域中,尤其是在医疗诊断方面,人们研究开发了多个规模可观的网络。在国外,如1988年Heckerman开发的用于淋巴结组织诊断的PATHFINDER网络[12],它可以诊断60多种疾病,涉及100多种症状;1993年,Spiegelhalter 等人构造出的评定新生儿先天性心脏病的CHILD网络[13];CPCSBN 远程医疗系统[14],它是一个多层贝叶斯网络,有448个结点和 908条弧,是优于世界上主要的远程医疗诊断分析方法;ALARM 网[15],具有37个结点和46条边,描述了在医院手术室中所存在的潜在细菌问题;TakeHeart II系统[16]是基于贝叶斯网的用于心血管病诊断的临床支持决策系统(Clinical Decision Support System,CDSS)等。国内方面,主要将贝叶斯网络与中医理论相结合来用于中医诊断,如利用贝叶斯分类方法进行冠心病中医临床诊断[17];通过贝叶斯网络分析方法分析抑郁症中医证候的分型[18]等,此外还有结合医学影像学来进行辅助诊断的相关研究,如通过多层贝叶斯网络对医学图像语义进行建模从而用于星形细胞瘤恶性程度的预测[19]等。

医务人员不仅可以通过贝叶斯网络图形化的特点建立起疾病与症状之间的因果关系,还可以利用它对于临床缺失数据的处理优化模型,从而使得医疗诊断更加科学化,客观化以及准确性。因此,可以预见贝叶斯网络在医学领域将要发挥越来越重要的作用。

[1]Heckerman D.A Bayesian approach for learning causal networks[C].In Proceedings of Eleventh Conference on Uncertainty in Artificial Intelligence. Montreal, QU: Morgan Kaufmann,1995:28-295.

[2]Jensen F V.An Introduction to Bayesian Networks[M].New York:Springer,1996:35-36.

[3]Pearl J.Probabilistic Reasoning in Intelligent Systems:Networks of Plausible Inference[C].Morgan-Kaufmann, San Mateo.CA,1988,45-47.

[4]张连文,郭海鹏.贝叶斯网引论[M].北京:科学出版社,2006.

[5]Jaehun Lee, Wooyong Chung, Euntai Kim, and Soohan Kim.A New Genetic Approach for Structure Learning of Bayesian Networks:Matrix Genetic Algorithm[J].International Journal of Control, Automation,and Systems,2010,8(2):398-407.

[6]陈祐凡. 针对线上学习的适应化导航模型[D].淡江大学资讯工程研究所,2003,102-103.

[7]S Z Zhang, Z N Zhang, N H Yang, J Y Zhang, and X K Wang.An improved EM algorithm for Bayesian networks parameter learning[J].Machine Learning and Cybernetics,2004,8(3):1503-1508.

[8]Cooper G, Herskovits E.A Bayesian Method for Constructing Bayesian Belief Networks from Databases[C]. In: Ambrosio, B., Smets, P. (eds.)UAI '91. Proceedings of the Seventh Annual Conference on Uncertainty in Artificial Intelligence,Morgan Kaufmann, San Francisco,1991:86-94.

[9]Chow C K, Liu C N. Approximating discrete probability distributions with dependence trees[J].IEEE Transactions on Information Theory,1968,14(3):462-467.

[10]张兵利,裴亚辉.贝叶斯网络模型概述[J].电脑与信息技术,2008,16(5):43-42.

[11]D Heckerman. Bayesian Networks for Data Mining[J].Data Mining and Knowledge Discovery ,1997,8(1):79-119.

[12]D Heckerman. An empirical comparison of three inference methods[J].UAI ,1988,9(1):88.

[13]D J Spiegelhalter, A P David, S L Lauritzen et al. Bayesian analysis in expert systems[J]. Statistical Science,1993,8(1):219-247.

[14]Agnieszka Oni ko, Peter Lucas, and Marek J. Druzdzel. Comparison of Rule-based and Bayesian Network Approaches in Medical Diagnostic Systems[C]. Proceedings of the Eighth Conference on Artificial Intelligence in Medicine (AIME-2001), Lecture Notes in AI, Cascais, Portugal, 2001:281-292.

[15]Beinlich I A, Suermondt H J, Chavez R M et al. The alarm monitoring system: A case study with two probabilistic inference techniques for belief networks[C].Proceedings of the Second European Conference on Artificial Intelligence in Medicine, London, England,1989:247-256.

[16]Hope L R,Nicholson A E,Korb K B.TakeHeart II: A Tool to Support Clinical Cardiovascular Risk Assessment[R].Tech Rep,2007:209.

[17]孙亚男,宁士勇,鲁明羽,等. 贝叶斯分类算法在冠心病中医临床证型诊断中的应用[J]. 计算机应用研究,2006,23(11):164-166.

[18]范建平,李常洪,吴关琴,等.贝叶斯网络在中医诊断中的应用研究[J].管理科学学报,2008,11(6):143-150.

[19]林春漪,马丽红,尹俊勋,等.基于多层贝叶斯网络的医学图像语义建模[J].生物医学工程学杂志,2009,26(2):400-404.

猜你喜欢

概率分布网络结构贝叶斯
基于贝叶斯解释回应被告人讲述的故事
离散型概率分布的ORB图像特征点误匹配剔除算法
基于动态贝叶斯估计的疲劳驾驶识别研究
弹性水击情况下随机非线性水轮机的概率分布控制
关于概率分布函数定义的辨析
基于概率分布的PPP项目风险承担支出测算
基于时效网络的空间信息网络结构脆弱性分析方法研究
基于互信息的贝叶斯网络结构学习
复杂网络结构比对算法研究进展
高速公路高清视频监控系统网络结构设计