APP下载

影像组学在乳腺癌淋巴结转移中的研究进展

2020-12-20吴佩琪

分子影像学杂志 2020年1期
关键词:组学分类器淋巴结

吴佩琪

深圳市盐田区人民医院(南方科技大学盐田医院)放射科,广东 深圳 518081

乳腺癌的发病率正逐年递增,全世界每年约有130万人诊断为乳腺癌,并且有40万人死于该病[1]。有研究统计,中国女性最常见肿瘤是乳腺癌,占所有女性癌的15%,死亡率在女性恶性肿瘤中排第4位[2],乳腺癌已成为妇女健康的最大威胁。原发灶和区域淋巴结转移情况是乳腺癌患者预后的两个重要因素[3],其中淋巴结状态是评价肿瘤负荷的重要依据,准确的腋窝淋巴结(ALN)分期对局部治疗计划的选择、全身综合治疗决策和预后判断等具有重要的指导作用。目前临床上常用的传统影像学检查方法,包括超声、钼靶、CT和MRI等,难以在术前对乳腺癌患者淋巴结转移情况进行精准评价,传统影像学检查在评估乳腺癌淋巴结转移方面仍存在很大挑战。影像组学作为一种高通量的图像定量特征数据挖掘技术,可以提取肉眼不可见的图像深层次信息并用于建立临床诊断、预后和预测模型,成为目前学术研究的一大热点,影像组学已逐步开始应用于乳腺癌淋巴结转移的预测。

1 影像组学定义及其工作流程

1.1 影像组学定义

影像组学的概念由Lambin等[4]首先提出,即从放射影像的图像中高通量地提取大量的影像特征。Lambin等[5]提出,影像组学是一种高通量的图像定量特征数据挖掘技术,应将影像组学提取的数据和患者的临床信息、免疫组化信息及基因信息等数据结合起来,应用于临床决策支持体系,以提高诊断、预后和预测的准确性,搭建起医学影像与精准医疗之间的桥梁。影像组学主要有两个方面的优势:能对影像大数据进行高通量特征提取,获得丰富的病灶深层次特征;能解析影像与临床信息的关联性,借此为临床提供有价值的精准诊断信息[6]。

1.2 影像组学工作流程

目前影像组学技术已发展成为融合影像、基因、临床等信息的辅助诊断、分析和预测的方法,其基本流程主要包括医学影像采集、图像分割、特征提取与筛选、模型与分类器的构建等步骤[7]。

1.2.1 医学影像采集 影像组学分析的首要步骤就是进行影像数据采集,如超声、钼靶、CT和MRI等[8],一般采集的图像均以医学数字成像和通信格式储存于图像存档和通信系统中,确保所采集的数据管理有序,并便于存取和检索,为影像组学研究提供了极大便利。

1.2.2 图像分割 图像分割是影像组学分析的关键步骤,准确的图像分割对于图像特征提取具有重要意义。目前图像分割可分为人工分割、半自动分割和自动分割,一般认为人工分割的精度最高,可作为“金标准”,但缺点是可重复性差、耗时较长。自动分割则通过一些图像分割算法,提高了分割速度,但分割准确性有待进一步提高。半自动分割一般是由计算机对目标区域进行自动分割后,再由影像科医师进一步细化目标区域轮廓,从而在提高分割速度的同时达到更好的分割准确性,因此实用性更强[9]。目前图像分割算法比较经典的是基于阈值的分割算法、基于边缘的分割算法和基于区域的分割算法,此外,随着深度学习技术的发展,基于人工神经网络、卷积神经网络等的图像分割方法也逐渐应用于临床研究中[10-11]。

1.2.3 特征提取与筛选 提取目标区域内的高维度特征数据以定量描述其属性是影像组学的核心。传统影像学对病灶的评估主要依赖于影像医师肉眼提取的定性特征,如病灶边缘是否规则、强化模式等,在计算机中,这些定性表型的特征描述统称为“语义”特征[12]。传统影像学对乳腺癌灶进行视觉分析时存在主观性强的缺点,而影像组学通过计算机可提取到图像深层次定量特征。目前研究中常提取的影像组学特征包括形态特征、一阶统计特征、纹理特征和小波特征等四大类[7]。形态特征描述的是病灶所在区域三维空间的形状和大小。一阶统计特征即灰度直方图特征,属于一维统计信息,描述的是图像内体素的强度分布情况。纹理特征描述的是灰度的空间相关特性或体素强度的空间分布,提供了图像上不同灰度级的相对位置信息,其分别从灰度共生矩阵、灰度游程长度矩阵和灰度区域大小矩阵特征进行纹理描述,其中灰度共生矩阵特征是目前图像特征描述方法中应用最为广泛的一种纹理特征,描述的是图像中灰度值的空间依赖性,也可以反映纹理模式和灰度空间的内在联系[13]。小波特征是在直方图特征和纹理特征的基础上,进一步使用多尺度的小波滤波处理,然后对不同小波域的图像进行特征提取,从而获得更加精准的影像特征信息[14]。

在一定的样本量下,特征向量维数过高时会增加计算的复杂程度,使预测模型的性能下降,造成“维度灾难”,对所提取的大量影像组学特征进行降维将有助于预测模型性能提升、减少模型训练时间、避免模型过度拟合、提高模型泛化能力。特征降维的具体方法包括特征抽取和特征选择两类。特征抽取是指通过已有特征的组合建立一个新的特征子集,其主要思想是原始空间中样本之间的距离在低维空间中得以保持,最常用的无监督学习方法是主成分分析和聚类分析,最常用的监督算法是线性判别分析(LDA),又称Fisher线性判别[15]。特征选择是指不经过变换,直接从原始特征集合中选择一个子集作为目标特征向量,目前常见的特征选择方法包括过滤式、包裹式和嵌入式三类[15]。过滤式方法以排序技术为选择变量的标准,使用适当排序准则对变量进行评分,并设定阈值筛选变量,该法适用于非常高维的数据集,计算简单、速度快,其中文献报道较为有效的是Wilcoxon检验[16]、最小冗余最大相关性[17]和互信息特征选择[18]等。包裹式方法计算量较大,应用相对较少,常用的有遗传算法和粒子群优化算法。嵌入式方法是在学习过程中搜索最佳特征子集的方法,该法注意了数据之间的相互依赖性以及与分类器的交互,是目前研究的热点,常用的包括最小绝对收缩与选择算子(Lasso)[19]、递归特征消除[20]、支持向量机(SVM)[17]和决策树[21]等。

1.2.4 模型与分类器的构建 建立预测模型是影像组学分析为临床提供辅助工具的关键步骤,用于建模的方法包括基于统计学和基于机器学习的方法。基于统计学的建模方法主要包括Logistic回归和偏最小二乘回归法。Logistic回归简便易行,一般用于二分类预测模型构建,也可用于多分类预测模型,是目前影像组学研究中最受欢迎且较为常用的建模方法。偏最小二乘回归法则主要用于多元回归建模,尤其是各变量内部高度线性相关时,该法更有效[22]。机器学习是指从已知数据中获得规律,并利用规律对未知数据进行预测的方法,属于人工智能中一个新的研究领域,可用于自然语言处理、图像识别、生物信息学以及风险预测等,分为有监督学习和无监督学习两种。常用的有监督学习分类器包括SVM[17]、随机森林[23]和决策树[21]等,常用的无监督学习分类器包括k邻近算法、K-means和高斯混合聚类等[24]。机器学习算法中SVM和随机森林两个模型在文献报道中表现都很稳定,应用较为广泛[25]。

2 影像组学在乳腺癌淋巴结转移中的研究进展

有研究对109例乳腺癌患者ALN状态进行了钼靶、CT和MRI评估[26],结果显示,钼靶、CT和MRI诊断ALN转移的敏感度分别为14.0%、93.0%和95.3%,特异度分别为84.8%、57.6%和65.2%,准确度分别为56.9%、71.6%和77.1%。另有研究比较了超声、钼靶、CT和MRI在195例乳腺癌患者ALN状态评估方面的价值[27],结果发现4种影像学检查方法单独诊断ALN转移的敏感度最高者为MRI(82.1%)、特异度最高者为钼靶(96.6%)、准确度最高者为CT和MRI(均为79%),当4项检查联合应用且检查结果一致时,诊断ALN转移的敏感度、特异度和准确度分别为70.2%、97.5%和92.9%。以上研究结果表明,目前临床上常用的传统影像学检查方法,包括超声、钼靶、CT和MRI等,难以在术前对乳腺癌患者淋巴结转移情况进行精准评价,传统影像学检查在评估乳腺癌淋巴结转移方面仍存在很大挑战。目前国内国际上已有基于影像组学方法预测乳腺癌ALN或前哨淋巴结(SLN)转移的相关研究报道,大大提高了乳腺癌淋巴结转移预测的准确性。

2.1 基于MRI的影像组学在乳腺癌淋巴结转移中的研究进展

目前基于MRI影像组学预测乳腺癌淋巴结转移的研究已相对丰富。有研究[28]提取了72例乳腺癌患者动态对比增强磁共振成像(DCE-MRI)图像中6大类共385个影像组学特征,降维选择后得到均匀度、全角度集群突出方差、全角度相关性、长行程优势及表容比5个影像组学特征用于建立乳腺癌ALN转移预测模型,训练集中AUC、敏感度、特异度、准确度分别为0.953、0.893、0.926、92.6%(50/54),验证集中AUC、敏感度、特异度、准确度分别为0.944、0.900、1.000、88.9%(16/18),结果提示基于影像组学特征构建的预测模型能无创地对乳腺癌ALN转移风险做出有效评估,但该研究样本量较小,并存在一定的选择偏倚,可能影响统计学效能。Cui等[29]研究提取了102例乳腺癌患者的DCE-MRI图像中的影像组学特征,采用Lasso法进行特征筛选,对每个特征进行了单独分析,然后进行特征组合分析,结果发现组合特征的效果明显优于任何单个特征。进一步采用SVM、KNN和LDA3个分类器在5倍交叉验证中进行ALN转移状态预测,结果表明,SVM分类器预测乳腺癌ALN转移的效果显著高于KNN分类器和LDA分类器,AUC、准确度分别为0.861 5、89.54%。该研究提示基于DCE-MRI影像组学特征的预测模型对乳腺癌患者ALN转移具有良好的预测价值。有研究从411例乳腺癌患者的术前DCE-MRI图像中提取了808个影像组学特征,采用SVM构建了一个由12个与ALN转移状态相关影像组学标签组成的影像组学标签预测模型[30],但该模型预测能力中等,训练集和验证集中的AUC分别为0.76和0.78。进一步采用Logistic回归,结果乳腺癌患者临床特征与影像组学标签开发列线图,发现该列线图对ALN转移具有出色的预测能力,训练集和验证集中的AUC为0.84和0.87,该研究提示基于DCE-MRI的影像组学标签列线图可以用作协助临床医生评估乳腺癌患者ALN转移的工具。Dong等[31]研究提取了146例乳腺癌患者T2加权脂肪抑制(T2-FS)和弥散加权(DWI)MRI图像上癌灶的10 962个影像组学特征和4个非影像组学特征,采用Logistic回归进行SLN转移风险预测模型构建,结果显示,由T2-FS图像提取影像组学标签组成的预测模型在训练集、验证集中的AUC分别为0.847、0.770,由DWI图像提取影像组学标签组成的预测模型在训练集、验证集中的AUC分别为0.847、0.787,两种图像提取的影像组学特征组成的联合模型在训练集、验证集中的AUC分别为0.863、0.805,提示充分利用从解剖学(T2-FS)和功能性MRI(DWI)图像中提取的乳腺癌特有的纹理特征,可提高影像组学预测乳腺癌SLN转移的性能。Liu等[32]对62例乳腺癌患者的DCE-MRI图像中提取了肿瘤灶的感兴趣体积,采用K最佳和Lasso法从所提取的1 409个影像组学特征中进行特征筛选,最终获取了6个特征作为模型构建的最佳特征,并采用Logistic回归、XGboost和SVM分类器等3个分类模型进行乳腺癌SLN转移风险预测模型建模,结果发现SVM模型预测性能最高,其AUC、准确度和灵敏度分别为0.83、0.85和0.71,提示结合原发肿瘤特征和DCE-MRI影像组学特征对乳腺癌SLN转移风险进行预测非常有应用前景,但该研究样本量较少,可能影响统计学效能。另一研究团队进行了类似研究[33],该团队对163例乳腺癌患者的DCE-MRI图像提取了肿瘤灶的590个影像组学特征,采用Lasso法进行特征筛选,最终获取了6个特征作为模型构建的最佳特征,并采用Logistic回归将患者临床病理特征和影像组学标签进行乳腺癌SLN转移风险预测模型建模,所建立的模型在训练集和验证集中AUC分别为0.869和0.806,结果同样提示结合乳腺癌患者临床病理特征和DCEMRI影像组学特征的预测模型对乳腺癌SLN转移风险预测具有广阔的应用前景。

2.2 基于非MRI影像的影像组学在乳腺癌淋巴结转移中的研究进展

目前基于超声、钼靶等非MRI影像的影像组学在预测乳腺癌淋巴结转移的研究相对较少。Yu等[34]对426例早期浸润性乳腺癌患者的超声图像进行手动分割后,采用Lasso法进行影像组学特征筛选,得到了14个选定的影像组学标签,该影像组学标签模型仅能达到中等预测效果,训练组和验证组中AUC分别为0.78和0.71,进一步采用多元Logistic回归构建了包括乳腺癌肿瘤大小,超声诊断的ALN状态和影像组学标签在内的列线图,则达到了较好的预测性能,训练组和验证组中AUC分别为0.84和0.81,具有较好的临床实用性。Zhou等[35]对843例乳腺癌患者的超声图像进行了影像组学研究,采用3种不同的卷积神经网络进行了训练,其中性能最佳的模型预测ALN转移的AUC达到了0.89,准确度、灵敏度和特异度分别为80%、85%和73%,高于具有6年以上专业训练经验的超声科医师的准确度(66%)、灵敏度(66%)和特异度(69%),提示基于深度学习的乳腺癌超声影像组学淋巴结预测模型能为临床提供无创的辅助诊断工具。Yang等[36]对147例乳腺癌患者的钼靶图像进行了影像组学特征提取,并采用Lasso回归方法进行特征降维建立了10个影像组学标签,然后采用SVM评估影像组学标签的性能,通过将影像组学标签与临床病理风险因素相结合开发了乳腺癌ALN转移预测的列线图,达到了较好的预测性能,AUC为0.895,该研究认为,基于钼靶的影像组学标签列线图为乳腺癌患者术前预测ALN状态提供了较为可靠且非侵入性的工具,可用于优化当前乳腺癌患者的治疗策略。

3 小结

综上所述,作为一个医工交叉的研究领域,影像组学技术近年来得到了飞速发展,成为了国内外研究的热点。影像组学可充分挖掘肉眼不可见的深层次影像特征,其在乳腺癌ALN转移方面的应用方兴未艾,尤其是基于MRI的影像组学在乳腺癌淋巴结转移预测方面研究成果已经大量涌现,影像组学有望为乳腺癌患者的个体化精准诊疗提供可靠依据,应用前景十分广阔。相信随着计算机技术,尤其是深度学习等人工智能技术对影像组学技术的完善,影像组学将更进一步发展,在医学领域中发挥更大作用。

猜你喜欢

组学分类器淋巴结
学贯中西(6):阐述ML分类器的工作流程
影像组学在肾上腺肿瘤中的研究进展
喉前淋巴结与甲状腺乳头状癌颈部淋巴结转移的相关性研究
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
基于朴素Bayes组合的简易集成分类器①
蛋白质组学技术在胃癌研究中的应用
基于动态分类器集成系统的卷烟感官质量预测方法
淋巴结肿大不一定是癌
一种自适应子融合集成多分类器方法