APP下载

学习矢量量化神经网络在乳腺肿瘤诊断中的应用

2018-09-06

山西电子技术 2018年4期
关键词:矢量乳腺神经网络

李 萍

(山西大同大学浑源师范分校,山西 浑源 037400)

0 引言

乳腺肿瘤作为世界上女性中发病率较高的疾病之一,一直以来都是医学方面研究热点。特别是在中国,由于许多人饮食、生活环境等方面存在一些问题,近年来,患该类型疾病的人越来越多。对于这类型疾病,如果能提早发现、提早做出正确的诊断,将对病情的缓解非常有帮助。然而,及时、准确的对乳腺肿瘤进行诊断一直都是医学界的难题,主要是由于现有医学设备和医生自身的能力并不能满足实际乳腺肿瘤诊断工作的需求,出现误诊的几率较大。由此可见,研究基于LVQ神经网络的乳腺肿瘤诊断具有非常重要的意义。

神经网络是对于人脑神经网络的抽象和建模,是人工智能的重要部分。学习矢量量化神经网络是一种较为简单的神经网络,在进行分类处理工作时不需要对所输入的向量进行归一化、正交化。近些年来,在人工智能逐渐发展壮大的同时,LVQ神经网络的应用范围也愈加广泛[1-8]。因此,在乳腺肿瘤诊断方面运用学习矢量量化神经网络是行之有效的。

本文主要是研究基于LVQ神经网络的乳腺肿瘤诊断问题,LVQ神经网络的建模工作,然后再对其进行仿真测试,得出实验结论。

1 LVQ神经网络

学习矢量量化神经网络(Learning Vector Quantization Neural Network,简称LVQ神经网络),是近年来运用较为广泛的一种神经网络。相比其他神经网络而言,LVQ神经网络具有效率高、使用简单等特点。LVQ神经网络的拓扑结构主要由三层神经元组成,包括输入层、竞争层和线性输出层。其神经元之间的连接方式有部分连接和全连接两种方式。在实验的过程中,需要根据实际情况修改各层之间的连接权值。例如:在进行网络训练时,输入层与隐含层之间的权值是需要修改的。

2 乳腺肿瘤诊断问题

2.1 目前乳腺肿瘤诊断的主要技术概述

目前医学中对乳腺肿瘤诊断的主要方法虽然比较多,但是,这些方法或多或少都存在较大的局限性。例如:X线光影中的辐射会对人体产生非常大的损害、CT检查的检查费用过高等等。此外,近红外光透检查对人体的损害较少,设备本身的成本也比较低,且移动起来较为方便,因此,其在临床上的应用还是比较广泛的。但是,由于近红外光透检查不能显示钙透率,其诊断符合率较低。当然,未来在进行乳腺肿瘤诊断时,还可以在超声检查方面做出改进,通过分析血管搏动指数和阻力指数来进行良性肿瘤还是恶性肿瘤的分类和判断工作。

总之,目前我国在乳腺肿瘤诊断方面还存在较大的问题,有待进一步研究。未来在进行乳腺肿瘤诊断的相关工作时,应该充分考虑实际情况,例如:医院的实际硬件条件、病人的经济状况以及最重要的肿瘤诊断的准确率等等。

2.2 乳腺肿瘤诊断的原则

在对乳腺肿瘤进行诊断时,主要的依据是细胞核的显微图像,提取其中与肿瘤性质密切相关的特征来进行分析。本次实验主要是选取了乳腺肿瘤细胞核的部分特征。主要包括:细胞核的半径、质地、周长、面积、光滑性、紧密度、凹陷度、凹陷点数、对称度以及断裂度等共10个量化特征。将这些量化特征作为网络的输入,从而来诊断乳腺肿瘤的性质。

2.3 乳腺肿瘤诊断的一般步骤

本次实验中对乳腺肿瘤进行诊断分析的主要步骤如图1所示。

图1 乳腺肿瘤诊断的一般步骤

3 基于学习矢量量化神经网络的乳腺肿瘤诊断建模

3.1 数据预处理

在采集数据时,对每一例病例组织中的各细胞核提取之前提到过的10个特征向量的平均值、标准差以及最坏值,一例病例共采取30个数据。在数据文件中,每组数据共32个字段。其中,病例编号、确诊结果(用1表示良性,2表示恶性)为前两个字段,以后字段分别为该病例病灶组织各细胞核显微图像10个量化特征的平均值、标准差以及最坏值。这样能保证所提取数据的准确性、代表性,从而保证实验结果的准确性。

最终提取到了596×32个数据,数值类型均为double型,尽可能使所提取到的特征值精度足够高,能够满足实际实验的需求。并将这些数据保存为data.mat文件,在实验中,当完成了对于LVQ神经网络的训练工作时,输入数据进行网络测试以及运行得出最终的实验结果。

3.2 网络创建

完成上述数据采集工作之后,构建一个新的LVQ神经网络。利用newlvq()函数来创建LVQ网络,并根据实际需要对相应的参数进行设置。

3.3 网络训练

完成网络创建以及参数设置工作之后,需要对网络进行训练学习。主要是通过Matlab自带的函数train()来进行训练。训练过程中可以根据实验的具体需要对LVQ神经网络的相关参数进行修改。

3.4 网络仿真

网络训练完成之后,利用之前搜集好的69组数据输入训练好的网络,从而进行网络仿真,得到结果。

4 在Matlab环境下实现乳腺肿瘤的诊断

4.1 Matlab实现

Matlab神经网络工具箱调用非常简单,其提供的函数十分丰富,本实验在Matlab环境下的具体实现过程如下。

4.1.1 数据分析

实验中共采取了569个病例样本,其中包括良性肿瘤和恶性肿瘤。针对每一例病例提取其10个特征值的平均值、标准差和最坏值,共组成596×32个double类型数据。

4.1.2 清空环境变量

在运行所编写好的程序运行之前,还需要对相关的环境变量进行清空,具体程序如下。

%%清空环境变量

clear all

clc

warning off

4.1.3 导入数据

本次实验共搜集、整理了569个病例,其中有良性357例,其余为恶性病例。实验过程中所采用的训练集为500组,测试集为69组。实验数据中用数字“1”与良性乳腺肿瘤对应,数字“2”与恶性乳腺肿瘤对应,数据保存在data.mat文件中。

4.1.4 创建LVQ网络

利用newlvq()函数可以创建LVQ神经网络,还需要根据实验的具体要求设置相关参数值,具体的程序如下。

net=newlvq(minmax(P_train),10,[0.6 0.4]);

% 设置网络参数

net.trainParam.epochs=1000;net.trainParam.show=10;

net.trainParam.lr=0.1;net.trainParam.goal=0.1;

4.1.5 训练LVQ网络

完成网络创建以及参数设置工作之后,需要对网络进行训练学习,训练结果如图2所示,训练误差走势图如图3所示。训练主要用到的函数为MATLAB自带的函数train(),具体的程序如下。

%%网络训练

net=train(net,P_train,T_train);

4.1.6 仿真测试

通过输入测试集来输出仿真数据,主要用到的函数是sim()函数,具体的程序如下。

%%仿真测试

T_sim=sim(net,P_test);Tc_sim=vec2ind(T_sim);result=[Tc_sim;Tc_test];

说明:1) vec2ind()函数的作用与ind2vec()函数的作用相反,将目标向量转换为对应的代表类别的下标矩阵。

2) result第1行为测试集的仿真结果,第2行为测试集的真实结果。

4.2 结果显示及分析

某次运行神经网络训练测试的运行结果如图2所示。

图2 某次运行结果截图

图3 对应正确率的走势分析图

通过多次运行对比,发现最终得到的良性肿瘤和恶性肿瘤的误诊率均低于10%,这与预期的结果是相符合的。诊断结果对应的正确率走势分析如图3所示。而在临床的诊断中,利用乳腺光影和医生判断的方法来进行乳腺肿瘤诊断,由于各方面的局限性,误诊率是比较高的。本次实验的误诊率较低,证明了利用LVQ神经网络建模来进行乳腺肿瘤诊断的可行性。

5 结束语

乳腺肿瘤诊断问题在实际生活中是一个较为复杂的问题,医学中最常采用的诊断方法由于费用较高、诊断效率较差等原因存在着一定的局限性。通过学习矢量量化神经网络来进行乳腺肿瘤的诊断工作能够节约成本、诊断准确率较高,并且与医生进行诊断相比诊断结果少了一些主观性,多了一些客观性。这便是乳腺肿瘤这类型疾病所需要的,充分体现了这种方法的优越性。通过上面的结果显示,通过将学习矢量量化神经网络应用于乳腺肿瘤诊断中的确诊率较高,是非常可行的。今后还需要对LVQ神经网络进行更进一步的研究,改进算法,尽可能提高确诊率。

猜你喜欢

矢量乳腺神经网络
乳腺结节状病变的MRI诊断
一种适用于高轨空间的GNSS矢量跟踪方案设计
矢量三角形法的应用
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
体检查出乳腺增生或结节,该怎么办
得了乳腺增生,要怎么办?
基于矢量最优估计的稳健测向方法
三角形法则在动态平衡问题中的应用
基于神经网络的拉矫机控制模型建立