基于卷积神经网络的肺结节良恶性分类*

2020-03-19吴世洋任劲松张冉钱昊楠司启益巩萍

中国医学工程 2020年1期

吴世洋，任劲松，张冉，钱昊楠，司启益，巩萍

（徐州医科大学医学影像学院，江苏徐州 221004）

肺癌是我国发病率和死亡率最高的肿瘤，我国肺癌患者5 年生存率仅有16.1%［1］。为了提高患者的生存率，早发现、早诊断、早治疗是关键。肺癌早期的表现形式是肺结节，因此发展新的肺结节良恶性分类方法是目前临床中面临的重点和难点。

传统的肺结节良恶性分类主要是利用CT 图像的底层特征，如灰度特征、纹理特征、几何特征等［2-4］，这些特征一般是人工设计的，存在着主观差异性。近年来，深度学习作为一种新的特征提取方法，通过建立多层次的学习模型来自动提取图像特征［5-6］，以提升分类的准确性。常用的深度学习模型有卷积神经网络（convolutional neural networks,CNN）、自编码（auto-encoder,AE）、受限玻尔兹曼机（restricted Boltzmann machine, RBM）等。在以上模型中，CNN 在物体的方向、大小和位置等方面抽象特征的敏感性更低，更有助于提高分类的准确性。因此本文提出利用CNN 进行肺结节良恶性分类，其流程如图1 所示。

1 数据来源

本文所有数据均来自美国国家癌症研究会颁布的肺部图像数据库联盟（Lung Image Database Consortium, LIDC）［7］。LIDC 包含 1 000 余例肺部CT 图像，同时提供了一个 XML 的注释文件［8］。在注释文件中，4 名放射学专家对大于3 mm 的结节给出了其对应的坐标。

图1 基于CNN 的肺结节良恶性分类流程

2 肺结节分割

采用基于多专家标注的阈值概率图方法［9］对肺结节进行分割。该方法根据专家的经验为每个专家设置一个权重来表示标注的可信程度，相应专家标注的肺结节区域中每个像素设置为相同的权重值，各像素值为所有专家对该像素标记的权重之和。设置阈值T，高于T 的设为1，低于T 的设为0，将图像分割为一个二值图像。将原始图像与二值图像进行与运算即完成肺结节的分割。

3 基于CNN 的肺结节特征提取

CNN 的一般结构如图2 所示，包括输入层、卷积层、下采样层、全连接层和输出层［10］。CNN通过滑动窗口对肺结节图像进行卷积操作获得特征图，每次卷积之后，再通过下采样层对获得的特征进行降维，最后通过全连接层将图像转化为一个低维的特征向量［11-12］。

图2 基于CNN 的肺结节特征提取

4 肺结节的良恶性分类

将CNN 提取到的特征利用Logistic 回归分析进行良恶性分类［6］。在LIDC 数据库中，肺结节的恶性度共有1～5 个等级，分别是高度不可能、适度不可能、不确定、适度怀疑和高度怀疑。本研究将等级大于等于3 的归为恶性，小于3 的归为良性。

5 实验结果及分析

从LIDC 数据库中选取至少2 位放射学专家对恶性度判断一致的病例共750 张肺结节图像，使用Deep-Learning 工具箱中的CNN 模型进行特征提取［13］。卷积层和下采样层的数量均设置为2，卷积核的大小为5×5、下采样降幅为1/4，将每张肺结节图像转化为一个192 维的特征图，然后通过Logistic 分类器进行分类。将特征图像随机分成50一批，迭代次数设置为500，表1 给出了不同训练/测试样本下的分类精度。

表1 不同训练/测试样本下的肺结节分类精度

由表1 可见，当训练样本为600，测试样本150 时，肺结节的分类精度达到最高，其最高值为83.4%。在此条件下，改变学习率，肺结节分类精度如表2 所示。

由表2 可知，当学习率为0.8 时，肺结节的分类精度达到最高，其值为84.4%。

表2 不同学习率下的肺结节分类精度 %

6 讨论

肺结节良恶性分类对肺癌的早期诊断具有重要意义。目前国内研究者提出了很多分类方法。这些方法都是通过提取肺结节的图像特征进行的。在特征提取过程中，早期大部分的分类方法是基于人工设计的图像底层特征加分类器的方式，这些底层特征包括肺结节的大小、形状、纹理、边缘等。如裴博等［14］通过提取肺结节的灰度、纹理及形状特征利用模糊支持向量机进行肺结节良恶性分类，获得了83%的分类精度。方胜儒等［15］通过提取肺结节的直方图、形态和纹理等特征，利用随机森林分类器获得了76% 的分类精度。PEÑA 等［16］提取了肺结节图像的几何、直方图等特征，利用支持向量机进行了分类研究。这些方法一定程度上降低了医师对肺结节诊断的主观性，但是基于人工设计的底层特征的分类方法，性能上存在较大差异。近年来，随着人工智能的发展，基于深度学习的肺结节良恶性分类是目前肺癌计算机辅助诊断的一个研究重点。相比于人工设计的底层特征，深度学习具有强大的自动特征提取能力和高效的特征表达能力，可以实现从底层到高层的特征组合，从而获得较理想的分类效果。如刘露等［17］提出一种基于深度置信网络的肺结节良恶性分类方法，获得了86%的分类精度。由于研究者使用的肺部CT 图像的不同，因此无法通过直接对比判断模型的好坏。另一方面，基于深度学习的肺结节良恶性分类结果受限于网络结构的不同，SHIN 等［18］研究表明，随着CNN 网络层次和复杂度的增加，分类精度会随之增加。本文提出的基于CNN 的肺结节特征自动提取与良恶性分类方法，受限于MATLAB 环境下Deep-Learning 工具箱的限制，只能构建小型的网络，以ResNet 为代表的新兴深层CNN 网络可提取更优的图像特征，因此后续可将深层的ResNet 网络应用于肺结节的良恶性分类中，以提高分类精度，为临床提供更有效的诊断依据。