基于影像组学的肺结节恶性程度预测

2017-05-15杨春然郭翌汪源源

肿瘤影像学 2017年2期

关键词：高通量组学分类器

杨春然，郭翌，汪源源

复旦大学电子工程系，上海 200433

·专题论著·

基于影像组学的肺结节恶性程度预测

杨春然，郭翌，汪源源

复旦大学电子工程系，上海 200433

杨春然，理学学士，本科毕业于复旦大学信息科学与工程学院电子工程系，现为复旦大学信息科学与工程学院电子工程系医学信号处理实验室在读硕士研究生。研究方向为肺部CT图像中肺结节的检测与诊断，主要使用的方法为影像组学与机器学习等。

目的：探讨基于影像组学的肺结节恶性程度预测。方法：对肺部图像影像数据库(The Lung Image Database Consortium，LIDC)-IDRI (Image Database Resource Initiative)中604例肺结节患者的CT图像进行分析，其中含肺结节的CT图像共2 803幅，医师手工勾画肺结节轮廓。根据肺结节诊断标准，共提取96个灰度、形态和纹理高通量特征，输入基于随机森林的多类分类器进行恶性程度预测。恶性程度分为5级，以数字1～5表示。随机选取1 000幅CT图像作为训练样本，剩余的1 803幅CT图像作为测试样本，实验重复10次。结果：对于单个肺结节，5类恶性程度的平均预测准确率为77.85%。对于每一类预测，曲线下面积(area under curve，AUC)均在0.94以上。对于每例患者，肺结节恶性程度的预测准确率为75.16%。结论：该研究提出的基于影像组学的方法对肺结节恶性程度的预测性能良好，可为临床诊断提供可靠的辅助信息，以利于早期发现病灶。

肺结节；CT图像；随机森林；影像组学

肺癌是当今世界范围内发病率最高的癌症。2015年，中国有73.33万例肺癌新发病例和61.02万例肺癌死亡病例，高居癌症发病率和死因首位[1]。临床研究表明，早期得到检测与治疗的肺癌患者，5年存活率从14%上升至49%[2]。肺癌在早期阶段常表现为肺结节形式，因此对肺结节的检测及早期治疗能明显提高肺癌患者的存活率。

CT相比于普通X线检查，可消除骨骼重叠的影响，还可提供更高的图像分辨率及灰度对比度。肺结节在CT图像上表现为圆形或类圆形高密度亮影，长径一般在3 mm～3 cm。为了能以较高的灵敏度检测肺结节，CT采用对患者肺部进行层厚较小的扫描，目前最薄层可达0.5 mm。因此，在使用CT对肺癌患者进行诊断时，每次扫描均会产生上百幅全肺部CT图像。放射科医师在阅片过程中，对肺结节的恶性程度打分，以数值的形式来表示其恶性程度。恶性程度通常分为5级，以1～5表示，等级越高表示恶性程度越高。在肺癌发病率持续增高和医学影像学数据量与日俱增的情况下，大量阅片工作给医师带来了很大负担并可能发生漏检。

针对以上问题，人们提出了各类基于医学影像学的计算机辅助检测与诊断系统，借此来减轻医师的负担，并去除诊断过程中的主观因素，使结果更加标准化和定量化。近年来，数据技术与医学影像辅助诊断的有机融合产生了新的影像组学方法。该方法通过从影像中提取海量信息，实现肿瘤分割、特征提取与模型建立，凭借对海量影像学数据进行更深层次的挖掘、预测和分析，帮助医师作出准确诊断，具有重要临床价值[3]。目前，影像组学方法已应用于肺结节诊断，预测肺结节良恶性的准确率达76.10%[4]，表明其在肺结节诊断中的可行性。为进一步研究基于影像组学的肺结节恶性程度的预测，本研究提取肺结节CT图像的高通量特征，建立了基于随机森林的多类分类器，实现了肺结节恶性程度的预测。

1 资料和方法

1.1 实验流程

本研究的实验流程图如图1所示，主要包括3个部分。

图1 实验流程图

首先，从数据集中筛选出含有肺结节的肺部CT图像；然后，根据医师勾画的肺结节边缘提取出相应的感兴趣区(region of interest，ROI)；接着对ROI提取高通量特征，输入基于随机森林的5类分类器进行训练或预测。在训练阶段，以医师打分的恶性程度作为金标准使分类器收敛。在预测阶段，由收敛的分类器给出肺结节恶性程度预测结果。

1.2 资料来源

本研究所使用的数据来自美国国家癌症研究所(National Cancer Institute，NCI)发起的大型公开数据集——肺部图像影像数据库(The Lung Image Database Consortium，LIDC)-IDRI (Image Database Resource Initiative)，包含从7个学术中心和8家医学影像公司采集到的1 018例患者的肺部CT扫描成像结果。图2分别给出一幅含肺结节和不含肺结节的CT图像。

图2 肺部CT图像示例

每例患者CT扫描层厚为0.6～5 mm[5]。对每例患者的肺部CT图像，均由放射科医师进行诊断。在诊断过程中，首先勾画结节轮廓，对长径≥3 mm的结节勾画出轮廓，对长径＜3 mm的结节仅给出结节的中心点，并给出该结节的病理信息建议分级。病理信息共9类，包括精细处、内部结构、钙化程度、球形度、边缘、分叶征、毛刺征、纹理及恶性程度。其中恶性程度最重要，直接代表诊断结果[6]。肺结节的恶性程度分为5级，统一存储于XML文件中，方便研究者参考与查看。

考虑到最新肺结节诊断标准已将长径＜3 mm的肺结节排除在外[7]，故本研究仅考虑长径为3 mm～3 cm的结节。根据该标准筛选数据集中的病例，获得含肺结节病例604例，合计CT图像2 803幅。每幅含结节图像均有与之对应的恶性程度打分。

由表1可见，该数据集中5类样本分布不均匀，其中第1级最少，仅317例，占11.31%；恶性程度最高为第5级，有603例，占21.51%。

表1 5类样本的分布情况

1.2 ROI提取

为提取高通量特征，需先提取ROI和肺结节。XML文件包含了放射科医师勾画的肺结节轮廓。据此，可在CT图像中定位肺结节并同时提取ROI。在提取ROI时，考虑到提取的高通量特征中有边缘特征，因此需保留部分边缘背景区域。本研究ROI提取采用以下方法：在横向取已勾画的肺结节最左、最右侧各增加肺结节横向最大距离的1/4，在纵向取已勾画的肺结节最上、最下侧各增加肺结节纵向最大距离的1/4。在提取ROI的同时，采用医师勾画的肺结节边缘填充内部区域，产生相应的肺结节二值图像。

图3分别给出一幅标注了肺结节的CT图像、提取的ROI图像及其对应的肺结节二值图像。为方便展示，这里将图3A所示的肺部CT图像缩小了4倍。

1.3 高通量特征提取

基于影像组学的肺结节高通量特征是进行肺结节恶性程度预测的重要参数。本研究根据肺结节影像学诊断指南设计相应的高通量特征[8]，包括肺结节的形状、大小、边缘毛刺程度、密度与强化程度等。共提取96个计算机定量特征，其中灰度特征16个、形态特征15个、纹理特征65个，如表2所示。

灰度特征是最基本的图像特征，用来描述图像灰度分布的相关性质，包括灰度均值、灰度方差、灰度直方图等。形态特征指肺结节的大小和规则程度等。纹理特征通过像素点及其邻域的灰度分布来表现物体表面缓慢变化或周期性变化的组织排列属性，体现了肺结节区域的强度以及密度等性质。

1.4 肺结节恶性程度预测

将96个高通量特征作为分类器的输入，进行肺结节恶性程度的预测。肺结节的恶性程度分为5级，是一个5类的分类问题，选用随机森林进行分类[9]。随机森林由很多决策树随机组成，每个决策树都是一个弱分类器。在使用训练样本将随机森林训练好后，当有一个新样本输入时，森林中的每一棵决策树都独立判断输入样本的类别，最终被决策树选择最多的类别即为随机森林对输入样本所属类别的预测结果。

图3 含肺结节的肺部CT图像(白线为医师勾画的结节轮廓)

表2 临床影像学特征与提取的高通量特征对应表

首先，对5类样本各随机抽取200例作为训练样本，即利用1 000例训练样本来建立随机森林分类器，所建立的森林中共有500棵决策树。然后，将剩下的1 803例测试样本输入分类器中，获得每例测试样本经过分类器判断而给出的对应于5类中每一类的概率，取概率最大值对应的类别作为测试样本所属的类别结果。

在临床诊断中，最终需给出的是对患者病情的整体判断。因此，根据每幅CT图像的肺结节恶性程度预测结果，可进一步得到每例患者肺结节恶性程度。对每一病例所有图像的预测结果进行统计，出现次数最多的结果作为其对应肺结节的恶性程度，并与医师诊断结果进行比对分析。分类器的评价指标选取灵敏度、特异度、预测准确率及受试者工作特征（receiver operating characteristic，ROC）曲线的曲线下面积(area under curve，AUC)。实验重复10次，取上述指标的均值作为最终分类器指标。由于本研究设计的实验为多类的分类，因此在对每一类的分类准确率的计算中，都视作一个两类的分类问题。例如，在考察第1类的分类准确率时，将第1类的样本视为阳性样本，第2～5类统一视为阴性样本。

2 结果

实验结果如表3和表4所示。

表3 单幅图像的肺结节恶性程度分类器预测结果

表4 患者的肺结节恶性程度分类器预测结果

对于单幅图像来说，每一类分类的特异度均在92%以上，准确率均在85%以上，对应的AUC值均在0.94以上。第2、3、4类的灵敏度相对稍差；但在恶性程度最低的第1类和恶性程度最高的第5类，分类器的灵敏度均较好；对于恶性程度最高的第5类结节，分类器的灵敏度达87.56%。结果提示，本研究提出的方法在预测患者肺结节恶性程度的准确率方面表现良好。

对于每例患者而言，每一类的预测结果与单幅图像的预测结果基本吻合，分类器对肺结节恶性程度最低和最高的患者均有较好的识别能力，灵敏度均在84%以上，对肺结节恶性程度的预测准确率为75.16%。在CT与PET/CT联合应用于诊断肺结节良恶性的临床试验中，诊断准确率达73.70%[10-12]。而在Wang等[4]的肺结节良恶性预测实验中，预测准确率为76.10%。对肺结节进行良恶性预测是两类预测问题；而本研究提出的方法是对肺结节的恶性程度进行5级预测，是多类预测问题。在相似的预测准确率下，本方法可提供更加精确的信息，从而帮助医师更加有效地诊断肺结节。

3 讨论

本研究提出了一种基于影像组学的肺结节恶性程度预测分析方法。通过对604例肺结节患者的2 803幅CT图像进行分析，表明该方法对肺结节恶性程度的预测性能良好。对于单幅图像，5类恶性程度预测的准确率为77.85%，灵敏度在70%以上，特异度在90%以上，AUC值超过0.94。对每例患者，该方法对恶性程度预测的准确率为75.16%。由此可见，采用影像组学高通量特征并构建随机森林分类器，可充分利用计算机辅助诊断，有效减轻医师负担，降低漏检率，从而为肺结节的临床诊断提供可靠依据。

未来工作可研究更有效的肺结节影像学特征，以进一步提高肺结节恶性程度预测的准确率。

[1] 王庆生, 陈万青. 癌症防治策略的探索与分析[J]. 中国医学前沿杂志, 2016, 8(7): 13-16.

[2] KAKINUMA R. Low-dose helical CT screening for lung cancer [J]. Jpn J Lung Cancer, 2003, 43: 1001-1005.

[3] 张利文, 方梦捷, 臧亚丽, 等. 影像组学的发展与应用[J]. 中华放射学杂志, 2017, 51(1): 75-77.

[4] WANG J, LIU X, DONG D, et al. Prediction of malignant and benign of lung tumor using a quantitative radiomic method [C]. International Conference of the IEEE Engineering in Medicine and Biology Society, 2016: 1272-1275.

[5] MCNITTGRAY M F, III S G A, MEYER C R, et al. The lung image database consortium (LIDC) data collection process for nodule detection and annotation [J]. Acad Radiol, 2007, 14(12): 1464-1474.

[6] 顾晓晖, 马晓宇, 陈卉. LIDC中肺结节注释信息的提取及数据库的建立 [J]. 数理医药学杂志, 2009, 22(2): 203-206.

[7] MCNITTGRAY M F. Reduced lung-cancer mortality with low-dose computed tomographic screening [J]. New Engl J Med, 2011, 365(5): 395-409.

[8] 白春学. 中国肺结节诊治共识制定及执行策略 [J]. 中华医学信息导报, 2016, 31(1): 18.

[9] LEE S L, KOUZANI A Z, HU E J. Random forest based lung nodule classification aided by clustering [J]. Comput Med Imaging Graphics, 2010, 34(7): 535-542.

[10] 汪敏, 徐友平. CT结合 PET/CT显像诊断孤立性肺结节误诊原因分析 [J]. 实用医学杂志, 2013, 29(12): 2005-2007.

[11] 沈爱军, 李洪江, 夏淦林, 等. 恶性孤立性肺结节CT影像特征 [J]. 中华实用诊断与治疗杂志, 2013, 27(12): 1209-1211.

[12] 秦卫, 张爱平. 孤立性肺结节的良恶性鉴别诊断进展[J]. 中国胸心血管外科临床杂志, 2011, 18(2): 153-156.

Prediction of pulmonary nodule malignancy based on radiomics

YANG Chunran, GUO Yi, WANG Yuanyuan
(Department of Electronic Engineering, Fudan University, Shanghai 200433, China)

WANG Yuanyuan E-mail: yywang@fudan.edu.cn

Objective:To investigate the method of malignancy prediction of pulmonary nodules based on radiomics.Methods:A total of 2 803 computed tomography (CT) images containing pulmonary nodules were extracted from 604 scans in the publicly available dataset of The Lung Image Database Consortium (LIDC)-Image Database Resource Initiative (IDRI). Each contour of nodules was labelled by the clinical doctor. Totally 96 high throughput features including gray level features, shape features and texture features were extracted according to the pulmonary nodule diagnosis criteria and put into the multi-class classif i er based on the random forest to predict the malignancy. The degree of malignancy was classif i ed into 1 to 5 levels. Among all images, 1 000 of them were randomly chosen as the training set and the rest were used as the testing set. The experiment was repeated 10 times.Results:For a single nodule, the average prediction accuracy of five levels was 77.85%. The area under curve (AUC) of each category reached over 0.94. For each patient, the malignancy prediction accuracy of pulmonary nodules was 75.16%.Conclusion:The method of malignancy prediction of pulmonary nodules based on radiomics has a good performance. The results can provide a reliable basis for clinical diagnosis and help to detect the disease in the early stage.

Pulmonary nodule; CT image; Random forest; Radiomics

R445.3

1008-617X(2017)02-0097-05

2017-04-01）

汪源源 E-mail：yywang@fudan.edu.cn