APP下载

深度学习和影像组学在脑胶质瘤中的研究进展

2022-11-21李洁刘光耀樊凤仙胡万均白玉萍张静

磁共振成像 2022年4期
关键词:组学胶质瘤分型

李洁,刘光耀,樊凤仙,胡万均,白玉萍,张静*

作者单位:1.兰州大学第二医院核磁共振科,兰州 730030;2.兰州大学第二临床医学院,兰州 730030;3.甘肃省功能及分子影像临床医学研究中心,兰州 730030

脑胶质瘤是中枢神经系统最常见的原发性肿瘤,跨越儿童到老人各个年龄段。在全身肿瘤中,胶质瘤五年病死率排第三,尤其是胶质母细胞瘤(glioblastoma,GBM)的中位总生存期仅约为12~15 个月[1-2]。由于低级别弥漫性胶质瘤具有向高级别转变的特征,无法达到完全治愈,使脑胶质瘤成为最具破坏性的癌症代表之一,患者术后神经功能障碍、精神障碍,生活质量下降以及巨大的经济负担都会影响患者生活质量,因此胶质瘤的早期诊断及分级、基因突变状态、规范治疗、疗效评估对优化患者术后护理、提高术后生活质量至关重要。人工智能的快速发展,为精准医疗带来曙光[3],尤其在医学影像领域的发展最可观[4]。影像组学能挖掘常规影像所不能显示的内部特征,反映胶质瘤复杂的异质性信息。如何应用人工智能技术和影像组学方法提高脑胶质瘤术前诊断能力并应用于治疗决策是目前研究的热点。笔者针对基于MRI 的深度学习(deep learning,DL)和影像组学在脑胶质瘤鉴别诊断、分级、基因分型及预后等方面的研究现状进行综述,并探讨以后的发展方向。

1 DL概述

人工智能是计算机科学的一个分支,能够分析复杂的医学数据,其快速发展为未来精准、个体化医疗带来曙光,可用于许多疾病的诊断、治疗和预测结果,其实现主要依靠机器学习和DL。DL[5]是一门源于人工神经网络的研究,本质是一个高度复杂的非线性回归方法,运算程序较复杂。DL 属于机器学习方法的一个分支,传统机器学习算法如决策树、随机森林、支持向量机(support vector machine,SVM)等需要预先进行人工分割并提取特征,而DL 可以准确高效地自动提取数据特征,避免了手工分割的烦琐性及误差性,大大节约了人力、时间和财力。DL 模型较多,目前常用的是卷积神经网络(convolution neural network,CNN)模型。

2 影像组学概述

影像组学是一种图像分析方法,是荷兰学者Lambin 等[6]于2012 年提出,将其定义为“采用高通量技术从影像图像中提取成像特征,创建可利用的数据库”。影像组学方法的具体步骤包括获取图像、病变ROI 勾画及分割、提取影像学特征、特征筛选、建立预测模型并验证等[7]。影像组学主要有两种类型:基于特征的影像组学(即经典影像组学)和基于DL 的影像组学(deep learning-based radiomics,DLR),前者不需要大型数据集,而后者需要更大的数据集[8]。DLR 通过对图像进行归一化、直接从深度神经网络来获得影像组学特征,与经典的影像组学方法不同,不涉及额外的特征提取操作,因此不会因为特征计算而引入额外的错误[9]。影像组学具有非侵入性、客观性、准确性及可重复性较高的特点,在肿瘤性病变中发展最快,目前已广泛应用于胶质瘤、肺癌、乳腺癌、前列腺癌等肿瘤的诊断、分期或分级、基因预测、治疗效果评价以及预后判断等方面。

3 DL和影像组学在脑胶质瘤中的应用

脑胶质瘤属于脑内最常见的原发性肿瘤,随着WHO 中枢神经系统肿瘤分类方法的更新,胶质瘤的分级、基因分型越来越详细[10]。胶质瘤的治疗以手术切除为主,切除范围、放化疗方法、疗效以及生存期与肿瘤级别及基因分型有密切关系。胶质瘤病理组织学检查是一种传统且可靠的诊断方法,但它通常需要很长时间、复杂的程序才能获得病理结果[11]。术前穿刺活检也可以作为标准,但属于有创性操作,且活检不能获得完整肿瘤的组织,无法提供肿瘤真实的信息。因此胶质瘤的术前MRI成为胶质瘤诊断、治疗决策、预后评估等方面的重要支柱[12]。目前常规序列包括T1 加权成像(T1 weighted imaging,T1WI)、T2加权成像(T2 weighted imaging,T2WI)、液体衰减反转恢复(fluid attenuated inversion recovery,FLAIR)序列、T1WI对比增强序列(T1 contrast enhancement weighted imaging,T1CE);功能序列包括扩散加权成像(diffusion weighted imaging,DWI)、扩散张量成像(diffusion tensor imaging,DTI)、灌注加权成像(perfusion weighted imaging,PWI)等。基于常规和功能MRI的DL和影像组学已广泛用于脑胶质瘤术前鉴别诊断、分级、基因分型及预后等方面研究[13-14]。

3.1 脑胶质瘤鉴别诊断

脑胶质瘤的MRI 表现与其他肿瘤、非肿瘤性病变会有重叠相似之处,例如低级别胶质瘤与脑炎、高级别胶质瘤与脱髓鞘病变、GBM 与原发性中枢神经系统淋巴瘤(primary central nervous system lymphoma,PCNSL)和转移瘤等,因此准确鉴别脑胶质瘤与其他疾病是影像诊断的第一步。

Zhang等[15]应用DL方法鉴别GBM、PCNSL和脱髓鞘病变,AUC达到了0.954~1.000,Nakagawa 等[16]应用多序列MRI 构建影像组学模型区分GBM与PCNSL,取得了0.98的高AUC值,结果证明DL 和影像组学在脑胶质鉴别诊断方面具有较高的效能。但是,关于二者能否为影像医生节省更多的时间,多个研究团队对此进行了研究。Wu 等[17]分别构建Alexnet、ResNet-50 和Inception-v3 三个卷积网络模型以区分弥漫性胶质瘤与脑炎,结果显示三个模型的AUC 值均超过了0.9,而两名神经放射科医生评估的AUC 分别为0.891、0.770。Han 等[18]分别建立基于T2WI的单参数影像组学模型和基于T2WI、T1WI的多参数影像组学模型以区分脑炎与Ⅱ级胶质瘤,AUC 为0.980、0.988,明显高于两位影像医师评估的AUC (0.661、0.722)。但以上研究样本量较小,其结果还需慎重解释。

总体而言,DL 和影像组学在胶质瘤鉴别方面具有良好的性能,可能相当于、甚至略高于影像医生的诊断水平。但是以上研究均是针对单发病灶,而实际工作中多发性病灶鉴别更加困难;而且DL 和影像组学对于体积较小病灶无法判断,可能与二者自身局限性有关;未来尚需进一步优化计算机算法提高其性能。

3.2 脑胶质瘤术前分级

依据2007年WHO中枢神经系统肿瘤分类将脑胶质瘤由低到高分为Ⅰ~Ⅳ级,级别不同,侵袭、浸润特征不同,治疗方案与预后也存在差异,术前分级是制订治疗计划的首要问题[19]。既往影像医生根据肿瘤部位、形态、边缘、内部信号及强化特征进行主观判断分级,导致术前分级欠准确。影像组学最早应用于胶质瘤是预测术前分级。穆建华等[20]基于T2WI、T1CE图像,结合三种机器学习方法建立了六种单序列影像组学模型以区分高级别(Ⅲ级和Ⅳ级)与低级别胶质瘤(Ⅰ级和Ⅱ级),AUC 值均在0.8 以上。Tian 等[21]从常规MRI、DWI和动脉自旋标记(arterial spin labeling,ASL)图像中提取特征,使用SVM分类器构建影像组学模型,区分Ⅱ级与Ⅲ级和Ⅳ级的AUC 为0.987,准确率为96.8%,区分级Ⅲ级与Ⅳ级的AUC为0.992,准确率为98.1%。诸多研究证明,影像组学已成为一种有前途的非侵入性胶质瘤分级方法,多参数模型较单序列模型效能较好,而且将功能MRI 纳入模型后,效能亦得到提升。但并不是序列越多越好[22],寻找最佳组合序列是以后研究的探索方向。

与影像组学方法相比,DL 在术前神经胶质瘤分级中的应用性能更高[23]。Li 等[24]分别开发了影像组学和CNN 模型预测胶质瘤分级,CNN 模型的准确率、AUC 都优于影像组学模型。Gutta 等[25]使用CNN 方法对237 名胶质瘤患者进行级别分类,与传统机器学习相比,CNN 模型的准确率提高了23%。常用的CNN 模型有2D CNN、3D CNN。Zhuge 等[26]对同一组数据分别应用2D-Mask R-CNN 和3D-ConvNet 进行Ⅱ级胶质瘤与Ⅲ级、Ⅳ级分类,准确率分别为96.3%、97.1%,显示3D CNN 稍优于2D CNN DL 网络,这与Mzoughi 等[27]的研究结果一致。其原因在于3D CNN 是将整个肿瘤体积传送到学习网络中,利用了整个肿瘤空间信息。也有研究提出将DL 与影像组学结合探索其性能。Zhang 等[28]基于DTI 衍生的图像提取了深度特征、纹理特征和形状特征,采用SVM 构建分类模型,实现了98%的最高准确率,AUC 达到了0.99,与其他研究相比,模型性能确有提高,但是二者结合的研究较少,未来还需进一步探索其在胶质瘤分级以及其他应用方面的能力。

以上研究均是依据2007版WHO中枢神经系统肿瘤分类进行的。2021 年《Neuro-Oncology》发布了第五版WHO 中枢神经系统肿瘤分类,提出首先需要明确胶质瘤基因分型,才能进一步对进行肿瘤分级[29]。以后胶质瘤的分级研究应按照最新版本进行,但DL与影像组学的方法依旧适用。

3.3 预测胶质瘤基因分型

2016年WHO中枢神经系统肿瘤分类增加了基因分型,认为结合细胞形态和基因分型,能更准确地指导临床制订辅助放疗、化疗等方案。最新版分类亦强调了基因分型在胶质瘤分类、分级中作用。其中,异柠檬酸脱氢酶(isocitrate dehydrogenase,IDH)基因突变与术后制订化疗方案有关,1p/19q共缺失状态在胶质瘤分类、分级中挥着核心作用,O6-甲基鸟嘌呤-DNA甲基转移酶(O6-methylguanine-DNA methyltransferase,MGMT)启动子的甲基化与高级别胶质瘤术后治疗的有效性相关[30-31]。由于术后经病理组织检测基因分型需要的时间较长,延误了胶质瘤患者的治疗,因此,急需在术前基于MRI特征预测胶质瘤基因分型以满足临床治疗需要。目前以预测IDH突变状态的研究较广泛、成熟。

无论是基于常规MRI、还是功能MRI,影像组学和DL 在预测胶质瘤基因分型同样具有较大的潜能[32-33]。Chang 等[34]应用2D CNN 学习分析259 名胶质瘤患者的常规MRI 图像(T2WI、T1WI、FLAIR、T1CE)的特征,对IDH-1 突变状态、1p/19q 共缺失状态和MGMT启动子甲基化状态进行分类,准确率分别为94%、92%、83%。Choi等[35]开发了一种基于动态磁敏感对比灌注MRI图像的DL 网络模型,对463 名胶质瘤患者的IDH 基因型进行分类,验证集、测试集的准确率分别为92.8%、91.7%,AUC 分别达到了0.98、0.95。最新的MRI 技术如酰胺质子转移成像(amide proton transfer,APT)也被证明是预测脑胶质瘤基因分型的重要序列[31]。

虽然多序列MRI 模型在肿瘤分级方面的诊断性能较高,但在预测IDH 基因型时,与单序列模型诊断性能相当[36]。Bangalore 等[37]使用3D Dense-UNets训练网络,分别创建了基于T2WI图像的单序列模型,和基于T2WI、FLAIR、T1CE图像的多序列模型,结果显示两种模型在预测IDH基因突变状态方面的准确率分别为97.14%、97.12%,AUC 分别为0.98、0.99,差异无统计学意义,Kim等[36]基于功能磁共振图像的研究结果与其一致。但是薛彩强[38]等研究认为应用T2WI 和T1CE 的联合序列模型预测MGMT 启动子甲基化效能优于单一序列。综上所述,预测胶质瘤基因分型的最佳组合序列还有待进一步研究。

3.4 脑胶质瘤预后评估

3.4.1 脑胶质瘤术后放疗后真、假性进展的鉴别

胶质瘤尤其是高级别胶质瘤术后需要常规进行放射治疗,但放疗会引起邻近脑组织放射性坏死,早期MRI 表现与肿瘤复发浸润难以鉴别,这将会潜在性延误复发患者的治疗时机。因此区分真、假性进展对脑胶质瘤的进一步治疗决策至关重要,是胶质瘤术后随访的重大挑战。已经证明多参数MRI组学、DL为二者鉴别提供了有力工具,诊断性能明显优于神经影像医生[39]。多项研究[40-41]证明在鉴别胶质瘤放疗后真、假性进展时,多序列MRI模型性能优于单个序列,影像组学与DL结合的模型性能较优。

Kim等[42]将DWI、PWI纳入鉴别GBM真假性进展的多序列影像组学模型,AUC 值高于基于常规MRI、DWI、PWI 等单序列模型,明显提高了诊断性能。Metz 等[43]发现DTI 的衍生图,尤其是各向异性分数图,在预测GBM 复发方面亦具有较大潜力。尽管功能MRI 能够提供一些定量指标来量化胶质瘤术后残腔周围的异常信号,基于功能MRI 的影像组学和DL 在鉴别胶质瘤术后真假性进展方面优于常规MRI,但是功能成像操作复杂度高、检查时间过长,且费用较高,可重复性不强,实际效果并不理想。

3.4.2 脑胶质瘤术后生存预测

随着医疗技术逐渐发展,脑胶质瘤治疗取得了较大的进展,但高级别胶质瘤的患者存活率仍然很低,尤其GBM 中位总生存期仅约为12~15 个月,五年生存率不到10%,能否利用人工智能早期预测胶质瘤无进展生存期和总生存期是患者及家属、研究者关注的问题。已有研究证明在不需要考虑胶质瘤级别的情况下,基于MRI 的影像组学可用于预测胶质瘤的生存情况[44-45]。但是手动分割的影像组学特征在观察者内和观察者间的变异性很敏感,DL的自动工作流程可以避免这种差异。Feng 等[46]基于3D U-Net DL 网络开发了一种分割、提取影像组学特征的线性模型来预测患者的总体存活率,在低级别胶质瘤、GBM中均具有较高的预测准确率,并取得2018年BraTS挑战赛冠军的佳绩,为胶质瘤生存期预测研究提供了基石。Han等[47]的研究证明结合了深度特征和影像组学特征的模型可以有效将高级别胶质瘤患者分为长期和短期生存者。

除了肿瘤本身级别、异质性及基因分型与预后相关外,患者的年龄、体能状态、切除范围等临床因素也影响预后。影像组学与DL 通过挖掘肿瘤内部影像特征,与临床因素结合,提高了预测术后生存期的能力。Zhang 等[48]利用从多参数MRI中提取特征和临床风险因素相结合构建了用于评估GBM 患者生存期的影像组学列线图,训练集、验证集的一致性指数分别是0.971和0.974。Huang等[49]将降维后的MRI特征与年龄、肿瘤分级等临床特征结合到随机森林回归模型中进行生存预测,亦显示了较好的优势。

以上对于胶质瘤术后生存预测的研究多为回顾性研究,纳入的患者术后治疗方案不统一,而且影响患者生存期的因素除了研究中所提到的年龄、体能状态、手术及影像特征之外,还有患者心理因素、术后营养状况等难以评估的因素,因此在未来的研究中,应前瞻性纳入统一治疗方案的患者,还可以与基因组学、代谢组学、蛋白质组学等信息相结合,增强对肿瘤内部信息的辨别能力,提高生存预测能力。

4 总结

DL 和影像组学以非侵入性方式提高了脑胶质瘤术前诊断、分级的准确性,预测基因分型方面性能良好,且与临床因素结合能评估术后生存期。但目前研究的样本量较小,且数据单一,可靠的预测模型需要大量数据进行训练,建立多中心的数据库十分必要,未来挑战在于创建适用于多中心数据的更稳定的方法。利用DL 和影像组学方法帮助诊断以及治疗脑胶质瘤势必成为未来发展的主流方向。

作者利益冲突声明:全体作者均声明无利益冲突。

猜你喜欢

组学胶质瘤分型
长链非编码RNA在胶质瘤中的研究进展
成人高级别脑胶质瘤术后复发相关因素分析
肺炎克雷伯菌RAPD基因分型及其与氨基糖苷类药敏分型对比研究
复发胶质瘤组织中miRNA-200c的表达 及作用机制研究
CT三维及X线在股骨转子间骨折分型的可靠性
填充型纳流液相色谱长柱的蛋白质组学分析性能考察
亲水作用色谱/质谱联用方法用于膀胱癌患者血清代谢组学研究
学生学习方式创新谈
IgG、Integrinβ6、P16在人脑胶质瘤中的表达及其临床意义
本草基因组学