APP下载

人工神经网络在消化道肿瘤检测和诊断中的应用进展

2009-11-29解庭波

长江大学学报(自科版) 2009年9期
关键词:人工神经网络大肠癌标志物

解庭波

(长江大学医学院,湖北 荆州 434023)

张 蕾

(武汉工程大学计算机学院,湖北 武汉 430074)

人工神经网络在消化道肿瘤检测和诊断中的应用进展

解庭波

(长江大学医学院,湖北 荆州 434023)

张 蕾

(武汉工程大学计算机学院,湖北 武汉 430074)

作为一种人工智能形式,人工神经网络具有自适应性、并行处理能力和非线性处理优点,广泛用于肿瘤早期检测和诊断。介绍了人工神经网络的工作原理和特点,综述了人工神经网络在消化道肿瘤检测和诊断中的应用研究进展,并就其发展作出评述。

人工神经网络;消化道肿瘤;肿瘤检测与诊断;进展

人工神经网络(Artificial neural network,ANN)是理论化的人脑神经网络的数学模型,是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统。随着神经网络技术的发展,其用途日益广泛,应用领域也不断拓展。而肿瘤标志物已被公认为一种有效的肿瘤诊断方法,并广泛应用于临床肿瘤的诊断[1,2]。本文主要介绍ANN原理、发展历程及其在消化道肿瘤早期检测和诊断中应用进展,对应用ANN进行肿瘤诊断具有一定的借鉴意义。

1 人工神经网络

ANN是一种模仿人神经结构所发展起来的计算机网络系统,由许多相对独立的人工神经元彼此连结成网络,模仿生物神经处理信息的方式解决问题。最早的ANN是由McCulloch和Pitts于1943年所提出,这个网络被用来从事逻辑运算。1949年,Hebb提出了一套模仿人神经系统学习方式的法则。1957年, Resenblatt发明了第一套被认为有用的神经计算器,名为马克一号辨认器。但是,在1980年之前,由于专家系统是当时最流行的人工智能系统,加上ANN的理论不成熟,计算机运算速度有限,因此ANN 并没有受到很大的重视。直到20世纪80年代后,Hopfield神经网络被提出,而此时专家系统开始遇到了瓶颈,ANN理论才逐渐受到重视[3]。目前,ANN不断有新的架构及理论被提出,配合计算机运算速度的加快,使得ANN的功能更为强大,运用层面也更为广泛,结合了生理、心理、计算机等科技而成为新的研究领域,并被应用于医学科学。

1.1人工神经网络的结构及原理ANN是一种由多个神经元以某种规则连接而成的层次型网络结构,一般分为输入层、隐含层和输出层结构[4](图1)。前向型网络模型中信号是逐层前传的,不相邻间无联系,其主要思想是把整个学习过程分为3部分:①输入模式从输入层经隐含层传向输出层的模式“顺传播”过程;②网络的希望输出与实际输出之间的差异信号由输出层经隐含层向输入层逐层修正连接权值的“误差逆传播”过程;③由模式“顺传播”和“误差逆传播”的反复交替进行的网络记忆训练,最终网络趋向收敛,即网络的全局误差趋向极小值的“学习收敛”过程。

图1 神经网络结构示意图

要使得ANN 能正确运作,则必须透过“训练”的方式,让ANN反复的学习,直到对于每个输入都能正确对应到所需要的输出。事实上,ANN中最重要的部分就是它的“学习法则”,即借着训练过程来调整网络中运算单元间“连结”的强弱(权重) 。当训练完成后,所有的知识即储存于这些连结上。完成训练后的网络,即可借着隐含其中的知识去判断尔后输入数据的属性。ANN的工作性能与训练样本有直接的关系,若训练样本不正确、太少或是太相似,ANN的工作区间与能力将大打折扣。换句话说,训练样本就是ANN的老师,因此,训练样本越多、越正确、差异性越大,ANN的能力就越强。ANN训练的目的,就是让ANN的输出越接近目标值。亦即,相同的输入进入到系统与ANN得到的输出值亦要相同。ANN未训练前其输出是凌乱的,随着训练次数的增加,ANN的键结值会逐渐的被调整,使得目标值与ANN的输出两者误差越来越小。当两者的误差几乎不再变化时,则称此ANN 已收敛,此时ANN便训练完成。通常会定义一个价值函数作ANN收敛的指针,价值函数将会随着网络的训练次数越变越小最后几乎不再变化[5]。

1.2人工神经网络的特点ANN是互连的神经元构成的网络,是通过对人脑的研究而得到的一门交叉学科,它的研究使诸如生物学、认识科学、非线性科学等基础学科与计算机、人工智能、信息处理、模式识别等工程学科有机地结合起来,并具有非常广泛的应用前景,它具有以下特点:①自组织和自学习能力:它能借着与环境交互作用时,改变及调整自身的结构;②具有很强的推广能力;③能以任何精度逼近任何非线性函数;④高度并行,即大量的相似或独立的运算都可以同时进行;⑤很强的信息综合能力,能同时处理定量和定性的信息,能很好的协调多种输入信息融合和多媒体技术[6,7]。

2 人工神经网络在消化道肿瘤检测和诊断中的应用

ANN是属于人工智能的领域,有别于其它人工智能的方法,ANN具有自我学习的能力,使用者无需设计复杂的程序去解决问题,只须提供数据。目前, 医学对绝大多数疾病的病因尚不明确,而各种疾病的表现也千变万化,在医学实践中, 对疾病的判断和相应的治疗往往只是以经验为基础。因此,ANN所具有的学习、记忆和归纳功能决定了它将在医学领域良好的应用前景。

2.1在胃癌检测和诊断中的应用胃癌占我国恶性肿瘤死亡的23%,居首位。胃癌的预后很大程度上取决于早发现、早诊断、早治疗及对治疗后的随访监测[8,9],而常规内镜的检查不适合于普查及随访,且会给病人带来一定的痛苦。血清肿瘤标志物的检测较为便捷,对诊断胃癌具有重要的临床意义[10]。近年来,胃癌标志物的研究发展很快,但是,这些标志物都缺乏高度特异性和敏感性,尤其是对于胃癌的早期诊断和筛选不够理想。王雪萍等[11]利用ANN建立的胃癌多种血清肿瘤标志物ANN模型,在提高诊断敏感性的同时,还保证了较高的特异性,证明ANN模型对胃癌的早期诊断具有较高的价值。

2.2在胰腺癌检测和诊断中的应用胰腺癌是消化系统的恶性肿瘤,占消化道恶性肿瘤的10%。其发生原因至今仍未清楚,恶性程度高,发展较快,预后较差,早期诊断十分困难,且近年来其发生率不停上升[12]。多数患者被发现时已是晚期,仅15%~20%的患者有根治手术切除的机会。而在平时临床诊断工作中,由于单一指标的灵敏度和特异性具有局限性[13],不能早期对胰腺癌作出判断,从而不能使患者得到更早期的治疗而提高其存活率[14]。肿瘤标志物的检测在早期诊断中具有非常重要的参考价值[15],但单一标志物的检测其灵敏度及特异性均难以满足临床对早期诊断的要求。因此在临床上,多主张将具有敏感性互补的标志物联合检测[16]。Kazufumi Honda等[17]应用ANN模型分析联合检测的肿瘤标志物指标以诊断胰腺癌,结果发现ANN模型可以显著提高胰腺癌诊断功效。另外ANN模型结合计算机断层成像(computed tomography, CT)、内窥镜超声波检查法(endoscopic ultrasonographyEUS)以及免疫组化的方法都可以提高其对胰腺癌诊断的准确度[18]。

2.3在肝癌检测和诊断中的应用长期以来,我国肝癌的死亡率在恶性肿瘤中占居第三位,仅次于胃癌和食管癌[19]。AFP一直是肝癌早期诊断的最佳指标,但从病理类型看,高分化和分化很差的肝癌细胞往往不产生AFP,因此AFP对肝癌诊断的阳性率一般为60%~70%。肝硬化患者中AFP也有一定的阳性率[20],AFP在原发性肝癌诊断中存在假阳性。因此,探索和建立一种简单、快速、敏感性高和特异性强的早期诊断技术已经成了临床医学上的迫切需要。王家祥等[21]利用人工神经网络的血清蛋白质指纹图谱模型检测肝癌的敏感性和特异性均高于AFP。同时,利用AFP检测为假阴性者, 利用人工神经网络模型也可以被正确检验出来。Luk等[22]也利用人工神经网络模型对肝癌、肝硬化患者和健康人血清标本的蛋白质指纹图谱的数据进行分析,发现该方法对肝癌诊断的敏感性和特异性分别为96.97%和87.88%。

计算机断层成像(computed tomography, CT)以其卓越的低对比度分辨率和丰富的影像后处理功能,近几年内已得到迅速的普及和发展,成为诊断肝癌的主要手段之一[23]。然而CT影像质量又受多种因素控制和干扰,特别是在肝癌的早期,其空间形态变化比较小,给放射医生的诊断造成极大困难,很容易发生误诊和漏诊[24]。因此,有必要采用适当的技术和方法对肝癌CT影像进行处理和分析,以提高CT影像对病变的识别、诊断能力。张波等[25]在对肝癌和其它肝占位疾病CT影像预处理的基础上,提取CT影像特征并以此作为训练参数,建立了肝癌CT影像BP人工神经网络辅助诊断模型,并对网络进行仿真测试,经过计算神经网络用于肝癌CT影像诊断的灵敏度和特异度分别为98%和96%,准确度达到97%,远远高于目前国内增强CT对肝癌诊断的准确度。

2.4在大肠癌检测和诊断中的应用大肠癌是常见的恶性肿瘤,在世界范围内其死亡率居各种肿瘤的第三位[26],在西方居第二位[27]。目前,大肠癌诊断常用的方法仍为结肠气钡双重造影和电子肠镜等,但它们均为入侵性诊断方法,存在价格和风险问题;血液肿瘤标志物检测较简便[28],但单个血清标志物诊断率太低,如癌胚抗原(CEA)诊断大肠癌的敏感性只有55.2%[ 29]。大肠癌是一种复杂疾病,它的发生和发展关系到多种基因的改变,所以联合多个标志物检测和诊断大肠癌非常有必要。余捷凯等[30]通过生物信息学的方法筛选出了检测大肠癌的最优化标志物组合:CEA、CA199、CA242、CA211、CA724。对CEAlt;5ng/ml的86例样本进行了人工神经网络模型预测,其准确率为96.5%,证实了人工神经网络模型预测大肠癌的敏感性比单个血清标志物CEA高的多。同时,他们用了多种生物信息学方法分析了大肠癌肿瘤标志物数据,对筛选的结果和建立的模型用决策树和支持向量机验证了其可靠性。在模型的评价中他们应用了5倍交叉验证的方法,并在测试集上估计模型的预测效果,这样既做到了盲法测试又避免了结果的随机性,使对模型的评价更加可靠。

3 结语

人工神经网络有着许多人脑不可比拟的优势,同时由于其可以对线性或非线性多变量在不设前提条件的情况下进行统计分析,同传统的统计方法需要被分析的变量符合一定的条件相比有其自身的优点。一个良好的ANN甚至可以在资料不太完整或有偏差的情况下也可以作出正确的预测。尽管ANN有诸多的优点,但它目前仍不象传统的统计方法为人们所熟知和应用,在ANN被人们广泛接纳之前,还有许多工作要做。毕竟网络实体与要处理的问题相去甚远,领域专家很难理解用数据化的节点、权值和连接来描述他们要解决的问题。此外,网络是“黑箱推理”,全部知识存储于网络内部,难以提供可信的解释。最后,在训练阶段存在训练时间长,过度拟合或训练不足,网络麻痹及局部最小值等问题[6,7]。但是可以认为,随着对ANN研究的深入,ANN必将得到临床工作者的认同,成为医学中疾病(尤其是肿瘤)诊断预测研究的有效工具。

[1]Jin L, Jung C. Diagnostic utility of serum and pleural fluid carcino-embryonic antigen, neuron-specific enolase, and cytokeratin 19 fragments in patients with effusions from primary lung cancer[J]. Chest,2005, 128 (4) ;2298-2303.

[2]David S, Boris Z, Ariella S,etal.Diagnostic value of CYFRA 21-1,CEA, CA19-9, CA15-3 and CA125 assays in pleural effusions: analysis of 116 cases and review of the literature [J]. Oncologist,2005,10 (4):501-507.

[3]暴春, 谢邦昌. 浅谈人工神经网络[J]. 山西科技, 2006, (1):132.

[4]Ramesh AN, Kambhampati C, Monson JRT,etal.Artificial intelligence in medicine[J]. Ann R Coll Surg Engl,2004,86(5):334-338.

[5]段芳,徐亮,黄新. 人工神经网络在医学中的应用[J].九江医学,2008,23 (2):90-92.

[6]宋烨,杨本. 人工神经网络及其在疾病诊断中的应用[J]. 中华医学实践志,2006,5(3):275-277.

[7]Farid EA. Artificial neural networks for diagnosis and survival prediction in colon cancer[J]. Molecular Cancer,2005,4:29-33.

[8]Wu CH, Lin SR, Hsieh JS,etal.Molecular detection of disseminated tumor cells in the peripheral blood of patients with gastric cancer: evaluation of their prognostic significance[J]. Dis Markers,2006,22(3):103-109.

[9]Ebert MP,Röcken C. Molecular screening of gastric cancer by proteome analysis[J]. Eur J Gastroenterol Hepatol,2006,18(8):847-853.

[10]李建华,吴昌平. 胃癌诊断标志物研究新进展[J]. 医学综述,2008,14(10):1554-1555.

[11]王雪萍,佟素香. 血清肿瘤标志物人工神经网络模型在胃癌诊断中的临床应用[J]. 实用医学杂志,2007,23(12):1821-1822.

[12]Chen JH, Ni RZ, Xiao MB,etal.Comparative proteomic analysis of differentially expressed proteins in human pancreatic cancer tissue[J]. Hepatobiliary Pancreat Dis Int,2009,8(2):193-200.

[13]Ru C, Sheng P, Teresa A,etal.Proteomic Profiling of Pancreatic Cancer for Biomarker Discovery[J]. Mol Cell Proteomics,2005,4(4):523-533.

[14]Sezgin C, Karabulut B, Uslu R,etal.Gemcitabine treatment in patients with inoperable locally advanced/metastatic pancreatic cancer and prognostic factors[J]. Scand J Gastroenterol,2005,40(12):1486-1492.

[15] Ni X,Bai X,Mao Y,etal.The clinical value of serum CEA, CA19-9, and CA242 in the diagnosis and prognosis of pancreatic cancer[J]. Eur J Surg Oncol,2005, 31(2):164-169.

[16]孙文恒,王炜,周文策. 人工神经网络技术在胰腺癌诊断中的应用[J]. 兰州大学学报(自然科学版),2008,44(3):224-227.

[17]Honda K, Hayashida Y, Umaki T,etal.Possible detection of pancreatic cancer by plasma protein profiling[J]. Cancer Res,2005,65(22):10613-10622.

[18]Bartosch-Härlid A,Andersson B,Aho U,etal.Artificial neural networks in pancreatic disease[J]. Br J Surg, 2008,95(7):817-826.

[19]Hu LY,Hu GX,Li FQ,etal.Application of protein chip system to the detection of primary liver cancer[J]. Bengbu Med Col,2004,2(3):74-76.

[20]Witzigmann H,Geissler F,Benedix F,etal.Prospective evaluation of circulating hepatocytes by alpha-fetoprotein messenger RNA in patients with hepatocellular carcinoma[J]. J Surgery,2002,131(1):34-43.

[21]王家祥,张波,余捷凯,等. 基于人工神经网络的血清蛋白质指纹图谱模型在肝癌诊断中的应用[J]. 中华医学杂志,2005,55(3):189-192.

[22]Luk JM,Lam BY,Lee NP,etal.Artificial neural networks and decision tree model analysis of liver cancer proteomes[J]. Biochem Biophys Res Commun,2007,361(1):68-73.

[23]Ippolito D,Sironi S,Pozzi M,etal.Perfusion computed tomographic assessment of early hepatocellular carcinoma in cirrhotic liver disease: initial observations[J]. J Comput Assist Tomogr,2008,32(6):855-858.

[24]Takayasu K,Muramatsu Y,Mizuguchi Y,etal.CT Imaging of early hepatocellular carcinoma and the natural outcome of hypoattenuating nodular lesions in chronic liver disease[J]. Oncology, 2007,72 (1):83-91.

[25]张波,张治英,徐德忠,等. 人工神经网络肝癌CT影像辅助诊断模型的建立[J]. 实用发射学杂志,2006,22(9):1079-1082.

[26]Ries LA,Wingo PA,Miller D,etal.The annual report to the nation on the status of cancer,1973-1997,with a special section on colorectal cancer [J]. Cancer,2000,88(10):2398-2424.

[27]Jemal A,Murray T,Samuels A,etal.Cancer statistics 2003 [J]. CA Cancer J Clin, 2003,53(1):5-26.

[28]Mladen DM,Dragoslav MP,Sanja Z,etal.Problems in screening colorectal cancer in the elderly[J]. World J Gastroenterol,2003,9(10):2335-2337.

[29]Griesenberg D,Nurnberg R,Bahlo M,etal.CA 19-9 and CA 72-4 and the fecal occult blood test in the preoperative diagnosis and follow-up after resective surgery of colorectal cancer [J]. Anticancer Res,1999,19(4A):2443-2450.

[30]余捷凯,杨美琴,姜铁军. 血清肿瘤标志物优化组合人工神经网络模型在大肠癌诊断中的应用[J]. 浙江大学学报(医学版),2004,33(5):407-410.

[编辑] 一 凡

2009-04-15

解庭波(1981-),男,湖北襄樊人,助教,硕士,从事医学微生物学与免疫学的教学与研究工作。

10.3969/j.issn.1673-1409(R).2009.03.031

R735

A

1673-1409(2009)03-R069-04

猜你喜欢

人工神经网络大肠癌标志物
利用人工神经网络快速计算木星系磁坐标
人工神经网络实现简单字母的识别
滑动电接触摩擦力的BP与RBF人工神经网络建模
脓毒症早期诊断标志物的回顾及研究进展
血必净在用于大肠癌合并肠梗阻术后ICU脓毒症中的效果
大肠癌组织中EGFR蛋白的表达及临床意义
FAP与E-cadherinN-cadherin在大肠癌中的表达及相关性研究
冠状动脉疾病的生物学标志物
肿瘤标志物在消化系统肿瘤早期诊断中的应用
MR-proANP:一种新型心力衰竭诊断标志物