基于深度学习的人工智能在肿瘤诊断中的应用进展

2020-03-02张佳佳樊鑫秦珊珊余飞

国际放射医学核医学杂志 2020年1期

张佳佳樊鑫秦珊珊余飞

同济大学附属第十人民医院核医学科，上海 200072

人工智能最初在1956年由美国科学家在达特莫斯学会会议上提出，其聚焦于利用机器模拟人的部分思维活动的研究。近年来，人工智能在医疗保健领域取得了众多研究成果，在肿瘤诊断中的应用也得到了蓬勃发展。癌症作为一种自我维持和适应的过程，与其所处的微环境动态相互作用，因此其诊断与治疗极为复杂[1]。现阶段，癌症的诊断多依赖于高分辨率医学成像仪器和病理仪器设备等，由医师对结果加以判断，无法反映成像数据的分布。人工智能则可以对数以万计的图像组成的数据集进行学习及推理，可有效地解决这一问题，使肿瘤诊断从主观感知转向客观科学；另外，人工智能不存在由视觉疲劳、经验不足等主观因素造成的漏诊与误诊。随着人们对自身健康关注度的提升，每天都会并行产生大量与肿瘤相关的医疗数据，人工智能可以对海量的与肿瘤相关的数据进行汇总分析，协助医师高效地开展工作。本文主要从以下几个方面阐述目前人工智能用于肿瘤诊断的新进展。

1 机器学习、深度学习与人工智能的关系

人工智能融合计算机科学、统计学、脑神经学和社会科学等多种学科，用于模拟、延伸和扩展人类智能，以代替人类实现识别、认知，分析和决策等多种功能。人工智能经过推理期、知识期、机器学习期和深度学习期4个阶段，以人工神经网络（artificial neural network，ANN）、支持向量机（support vector machine，SVM）及卷积神经网络（convolutional neural network，CNN）为代表。人工智能包括机器学习，深度学习是机器学习方法的一个类别。机器学习由亚瑟·塞缪尔在1959年提出，用来描述人工智能的一个子领域[2]，其包括所有允许计算机从数据中学习而不用经过解释性编程的方法，已经被广泛应用于医学图像[3]。机器学习结合计算机模型和算法，模仿人体大脑中的生物神经网络结构（ANN体系结构）[4]，其具有3个不同的层：接收输入数据的输入层，产生数据处理结果的输出层，以及提取数据模式的隐藏层。在机器学习中，深度学习提高了传统神经网络使用深度结构时的性能，已成为最有前途的技术之一。深层ANN不同于单一隐含层，其具有大量的隐含层，这是网络深度的特征[5]。在不同深度的ANN中，CNN已经成为计算机视觉应用中的热门话题。在这类深层神经网络中，由于特征提取层和特征映射层的存在，多维输入向量的图像可直接输入到网络，避免了特征提取和分类过程中复杂的数据重建这一难题，对大型图像的处理表现出色。

2 人工智能用于肿瘤诊断中的关键技术

2.1 肿瘤图像分割

图像分割即根据图像的灰度特征、纹理特征和频域特征将图像分成多个具有自身特性的区域，分割的准确性对于医师判断疾病的真实状况至关重要。近年来，由于ANN存在大量的连接，使图像中的噪声和不均匀问题得以解决，其在不同肿瘤图像的分割中得到了广泛应用[6-10]。例如：Havaei等[11]提出了一种基于深度神经网络的脑肿瘤自动分割方法，可以同时获取MRI局部和全局特征，并采用两阶段训练解决肿瘤数据标注不均衡这一问题。然而，基于CNN的传统分割方式需要大量的存储空间且计算效率低下，因此，Shelhamer等[12]提出全卷积神经网络（fully convolutional networks，FCN）以改善这些问题。尤为重要的是，FCN可通过实现图像像素级别的分类克服一些语义级别中存在的图像分割弊端。目前，FCN已应用于头颈癌[13]、肺癌[14]、结肠癌[15]等肿瘤图像的分割，同时，在FCN的基础上涌现了大量图像分割算法，如 U-Net、SegNet和 RefineNet等。Meng 等[16]提出了一种新的光噪声抑制网络，无需预处理即可实现端到端的学习和后处理，克服了肿瘤图像分割被解析成几个阶段的缺点。目前存在大量的图像分割算法，但均未应用于肿瘤图像的分割，有待进一步的尝试与研究。

2.2 肿瘤图像特征提取

图像特征提取源于计算机视觉，指从图像中挑选出可以最有效表达图像内容的低维矢量的过程，如对形状特征、灰度直方图、纹理结构特征和空间关系等特征的提取，从而降低特征空间维数，是医师做出诊断的基础。传统的图像提取方式为人工特征设计提取，由于不同医学成像设备所得的图像具有多形态、模糊性和异质性等特征，单纯依靠医师的专业经验，缺乏统一的标准，客观性较差。基于深度学习的自动特征学习是指运用不同算法使计算机自动学习图像的特征，并对低层特征进行组合，从而形成更加抽象的高层特征以实现更加全面地表达图片特征的目标。Wang等[17]提出了一种级联的有丝分裂检测方法用于乳腺癌的诊断，其结合了CNN模型和手工设计的特征（形态、颜色和纹理特征），与原有的单纯手工特征设计提取相比，此方法准确快速，并且需要更少的计算资源。深度学习可以使计算机直接从大量数据中学习特征表达，通过一定的预处理和后期处理方法，准确高效地检测细胞。Ciresan 等[18]利用CNNs模型，使计算机自动学习乳腺疾病的病理特征，首次证明即使没有人工手动设计特征，神经网络也能自动全面地学习，为病理图片分析带来了新的突破。此后，许多研究进行了类似的尝试，Xu等[19]研究了基于深度学习的自动特征提取方法，并证明自动特征学习优于人工特征提取设计。

2.3 肿瘤图像特征选择

与图像特征提取类似，图像特征选择也是降低特征空间维数的基本方法之一，其能够从给定的特征中选出有效识别目标的最小特征子集。距离相关算法、套索算法（least absolute shrinkage and selection operator，LASSO）和梯度提升决策树算法等常单独或联合用于肿瘤图像的特征选择。Zhang等[20]利用LASSO算法进行特征选择，以非侵入性的方式实现了精原细胞瘤和非精原细胞瘤的鉴别诊断。Chen等[21]在纹理提取的基础上，联合使用距离相关算法、LASSO算法及梯度提升决策树算法进行特征选择，并以线性判别分析和SVM算法建立模型，用于辅助术前脑膜瘤分级。

3 人工智能的临床应用

3.1 肿瘤辅助诊断

利用人工智能使计算机自主学习组织层面上的特征，可实现癌症分期及术前诊断。现有的癌症分期方式存在由于人眼所存在的固有视觉差异而导致分期结果不一致的弊端，人工智能的出现能有效地克服这一弊端。目前，人工智能已在脑肿瘤、骨肉瘤及乳腺癌等多种肿瘤图像中展开了实践，其中研究较多的为脑肿瘤图像。Pan等[22]利用深度学习的自动学习能力，首次将脑肿瘤MRI图像直接输入计算机，并在多期MRI之间联合操作，克服了其他分类方法需要额外设计和选择特征集的缺点，并且具有更好的分类性能。此外，这种方法实现了不同层次训练的内核可视化，呈现了CNN获得的一些自学习特征，打开了算法“黑匣子”。Tian等[23]以MRI最优纹理特征建立了SVM分类器，对胶质瘤进行分类与分级，证明纹理特征对于非侵入性分级胶质瘤的分类与分级比直方图参数更有效，有助于不同等级的胶质瘤患者的临床决策。最近，Kutlu和Avci[24]利用CNN的特征提取能力、离散小波变换（discrete wavelet transform，DWT）的信号处理能力和长短时记忆（long short-term memory networks，LSTM）的信号分类能力，提出了一种对脑肿瘤MRI图像进行分类的方法——CNN-DWTLSTM。与传统的k近邻算法以及SVM等分类算法相比，CNN-DWT-LSTM显示了更强的分类能力，其对脑肿瘤进行分类的准确率可达98.6%。此外，人工智能也常用于术前辅助诊断，Huang等[25]从结直肠癌门静脉期CT中提取放射影像学特征，利用LASSO算法实现数据降维、特征选择和放射学特征构建，并采用多变量 logistic回归分析构建预测模型，可减少结直肠癌术前对淋巴结的盲目清扫。

3.2 肿瘤疗效评估

人工智能可对肿瘤患者新辅助放化疗的效果进行评估，以减少不必要的损害。Nie等[26]选取48例接受新辅助化放疗的患者，利用其T1/T2成像、弥散加权MRI和动态增强MRI检查数据，提取了103个影像特征，并采用单因素分析法评价各单项指标预测病理完全反应或良好反应的能力。利用ANN方法建立模型，选择最佳的预测集对不同的响应组进行分类，并利用受试者工作特征曲线计算预测性能，建立了比传统成像指标具有更高预测值的模型，实现了直肠癌新辅助放化疗效果的定量化精准评估。

3.3 肿瘤预后预测

人工智能还可用于预后的监测，并且已在多种肿瘤中实现临床应用。Song等[27]对非小细胞肺癌治疗前图像的强度、形状和纹理特征进行特征提取，并利用LASSO-Cox构建反映靶向治疗无进展生存期的预测模型，实现对表皮生长因子受体突变的晚期肺癌患者靶向治疗无进展生存期的个性化精准预测。此外，Huang等[25]从结肠癌患者门静脉期CT图像中提取放射影像学特征，采用LASSO回归模型进行数据降维、特征选择和放射影像学特征构建。利用多变量logistic回归分析建立预测模型，绘制K-M生存曲线，用于监测结肠癌术后局部复发及远处转移。Xu等[28]通过Cox比例风险模型结合正向特征选择，提取鼻咽癌患者亚区放射组学特征，构建预测预后的影像生物标志物，结果表明分区域PET/CT影像学分析有助于预测鼻咽癌患者的无进展生存期，同时也为传统的预测因素提供了补充信息。

综上所述，人工智能通过对大量数据集进行训练学习，能发现人眼无法分辨的细节和主观因素难以总结的普适规律，减少医师因主观因素所致的诊疗误差，使肿瘤诊断由人的主观判断转为客观判断。此外，人工智能还可以以非侵入方式将病理信息融入人体的结构和功能显像中，进一步提高肿瘤诊断的灵敏度及特异度。目前，一些癌症中心已经开始使用它们协助工作，但人工智能仍存在算法缺陷、算法黑匣子和隐私安全等诸多问题。随着算法的优化和硬件设备的革新，人工智能必将带领我们进入一个肿瘤学的新时代。

利益冲突本研究由署名作者按以下贡献声明独立开展，不涉及任何利益冲突。

作者贡献声明张佳佳负责论文的撰写；樊鑫、秦珊珊负责论文的修改；余飞负责命题的提出及论文的审阅。