基于影像组学对数字化乳腺断层摄影中肿块病变的鉴别诊断研究

2022-01-11郑惠中姜婷婷简嘉豪厉力华顾雅佳彭卫军

中国癌症杂志 2021年12期

尤超，郑惠中，姜婷婷，简嘉豪，范明，厉力华，吴炅，顾雅佳，彭卫军

1.复旦大学附属肿瘤医院放射诊断科，复旦大学上海医学院肿瘤学系，上海 200032；

2.杭州电子科技大学生物医学工程与仪器研究所，浙江杭州 310018；

3.复旦大学附属肿瘤医院乳腺外科，复旦大学上海医学院肿瘤学系，上海 200032

乳腺癌是女性最常见的恶性肿瘤，发病率逐年上升［1］。数字乳腺体层合成（digital breast tomosynthesis，DBT）技术可减少病变和正常腺体组织的重叠，提高病灶检出率和诊断准确度，目前已逐步推广应用于乳腺癌的筛查及诊断体系［2-3］。

近年来，越来越多学者对DBT的诊断价值展开研究并取得一定进展，但研究大多数基于传统形态学特征［4］。随着影像组学和人工智能在医学影像领域的广泛应用，基于全数字化乳腺X线摄影（full-field digital mammography，FFDM）建立的乳腺癌诊断模型，相比于传统模型表现出更高的预测准确度［2，5-6］。DBT多角度摄片成像，能为乳腺癌诊断模型提供更多的影像学特征，因而进一步探索DBT的临床应用价值亦成为研究的关注点［7-8］。本研究以乳腺肿块病变为研究主体，旨在探索DBT的影像组学在肿块病变鉴别诊断中的价值，为其提供更多的特征，使其在乳腺癌鉴别诊断中发挥更大作用。

1 资料和方法

1.1 临床资料

回顾并分析2019年4月—2020年8月复旦大学附属肿瘤医院符合以下标准的患者。纳入标准：①经临床检查乳腺发现可疑病灶；② 行DBT检查证实为肿块病变；③经手术后病理学检查证实。排除标准：①有单侧或双侧乳房植入物；② 有单侧或双侧乳房切除术病史或有乳腺切开手术史；③DBT检查前行穿刺活检后确诊为乳腺癌。

143例患者符合上述标准纳入本研究，其中1例患者为双侧乳房各1个良性病灶，选用双侧乳房图像分析，其余均为单侧单发病变，选用单侧乳房图像分析。最终本研究数据集共计144个病灶，其中良性65个，恶性79个。

1.2 数字化乳腺X线断层摄影

1.2.1 图像采集

采用美国Dimensions公司的乳腺断层X线摄影系统。所有受检者均行头尾（cranio-caudal，CC）位和内外斜（medio-lateral oblique，MLO）位双体位投照。患者在每个体位的同一压迫条件下由设备自动同时完成FFDM和DBT扫描。DBT成像中，X线管在乳腺周围以15°扫描角度进行一系列低剂量曝光，以生成乳腺组织3D容积重组图像。重组DBT图像数据集包括厚层（1 cm）、薄层（1 mm间距切面）的图像。

1.2.2 病灶标注

使用开源软件VGG Image Annotator（VIA）图像标注工具（Visual Geometry Group），由1名从事乳腺影像诊断的放射科医师（工作年限为10年）独立阅片对肿块的轮廓进行勾画，标记如图1所示，包括起始层面，表示肿块的顶部（图1A）；中间层面，即肿块最大径所在层面图像（图1B），终止层面，表示肿块的底部（图1C）。肿块的具体位置坐标将由程序通过计算轮廓的外接矩取得，从而获得肿块的标注信息。

图1 肿块轮廓勾画Fig.1 Mass delineation

1.2.3 构建病灶三维掩膜（mask）矩阵

首先创建与原影像相同宽度、高度的全零矩阵，将原影像数据按顺序叠加，构建三维原始影像数据矩阵。其次，从标注文件中提取病灶轮廓的坐标点数据，根据坐标数据，在三维原始影像矩阵中将轮廓内坐标数据置一，得到原影像的掩膜文件。最后，将掩膜信息同样按顺序叠加，根据标注文件病灶数据，构建病灶的三维掩膜数据矩阵，用于后续特征提取。

1.3 基于DBT影像组学模型的建立

影像组学分析主要包括3个部分，提取影像组学特征、构建算法模型及模型检验。

将预处理后的原始影像按顺序排列组合成三维矩阵，使用pyradiomics包在CC位、MLO位提取病灶影像特征，单个体位获得特征109个，包括病灶的形态学特征、统计特征以及纹理特征。其中形态学特征18个，统计特征16个，纹理特征75个。本研究融合不同体位提取的特征作为特征集合，进行良恶性鉴别的研究。按照8∶2的比例划分数据集为训练集与测试集。训练集通过特征递归消除（recursive feature elimination，RFE）的特征选择方法，筛选获得特征数目从20～40的不同的特征集合。采用五折交叉验证的方式进行参数调整，采用逻辑回归（logistic regression，LR）、支持向量机（support vector machine，SVM）以及梯度提升决策树（gradient boosting decision tree，GBDT）3种算法建立良恶性诊断模型，比较并分析几种算法模型在测试集上的效果。

1.4 病理学检查

由1名病理科从事乳腺疾病诊断的主任医师对所有病理切片进行诊断，病理学诊断参照第5版世界卫生组织（World Health Organization，WHO）乳腺肿瘤病理分类诊断标准［9］。

1.5 统计学处理

采用SPSS 22.0及R 3.6.1进行统计学分析。采用χ2检验比较训练集与测试集临床及病理学特征的差异。采用预测模型的受试者工作特征（receiver operating characteristic，ROC）曲线的曲线下面积（area under curve，AUC）及准确度作为主要的预测模型效能评价方法。P＜0.05为差异有统计学意义。

2 结果

2.1 临床病理学结果

经病理学检查证实的144例病灶中，良性病灶65个（纤维腺瘤26个、分叶状肿瘤5个、乳腺病16个、硬化性腺病3个、导管内乳头状瘤12个、炎性病变3个）；恶性病灶79个（浸润性导管癌54个、浸润性导管癌伴导管原位癌成分11个、纯导管原位癌8个、浸润性小叶癌2个、乳头状癌4个）。按8∶2比例划分为训练集112例与测试集32例（表1）。

表1 研究人群临床病理学基本资料Tab.1 clinical data of study population

其中所选取肿块数据集中，病例年龄分布在36～71岁之间。最大直径为113 mm，平均最大直径为30.77 mm，经年龄段分层、腺体密度、肿瘤最大径χ2检验，计算得到P＞0.05，表明随机划分的训练集与测试集数据分布差异无统计学意义。

2.2 影像组学特征的筛选

在肿块良恶性分类上，使用特征递归消除得到不同特征数目的特征子集，在训练集上得到对应的平均AUC值见表2。基于不同数目特征的分类器算法，LR、SVM和GBDT的最佳特征数目分别为20、24和32（图2），相应的最佳特征子集分布见表3。

表3 不同分类器最佳子集特征数目分布Tab.3 Distribution of optimal subset numbers in different classifiers

图2 特征筛选依据图Fig.2 Feature selection basis diagram

表2 不同特征数量在训练集上准确率及AUC值Tab.2 Accuracy and AUC values of different feature numbers

2.3 构建模型

结合网格搜索与交叉验证方法，得到LR、SVM与GBDT这3种分类器模型最佳参数。在相同的训练集上利用对应的超参数重新训练机器学习模型，并在测试集上对各个分类器进行测试，计算评价指标见表4。绘制其对应的ROC曲线。在3种分类器模型中，GBDT模型表现最佳，其准确度为0.81，AUC为0.91（图3）。图4、5为2例影像科医师诊断错误，影像组学模型诊断正确的病例。

表4 不同分类器测试集评价指标Tab.4 Test and evaluation indexes of different classifiers

图3 三种分类器在测试集的ROC曲线Fig.3 ROC curves of the three classifiers in the test set

图4 女性57岁，左乳浸润性导管癌Fig.4 A 57-year-old female patient with left breast IDC

图5 女性37岁，左乳腺病Fig.5 A 37-year old female patient with left breast adenosis

3 讨论

DBT通过X线球管从不同角度对压迫乳腺组织进行多次低剂量快速曝光，重建获取与探测器平面平行的乳腺三维影像。这一技术突破了传统乳腺X线摄影的二维图像重叠的局限，提高了致密性乳腺中病灶的检出，尤其是表现为肿块或结构扭曲征象的病灶。影像组学通过高通量地提取病灶的定量信息，实现病灶分割、特征提取与模型建立，凭借对海量影像数据信息的挖掘、预测和分析，是对肿瘤内部特征进行深层次的剖析。目前，影像组学在乳腺磁共振成像（magnetic resonance imaging，MRI）、超声的研究中已有较多报道，针对乳腺X线的影像组学报道相对较少［3-4，10-12］。

本研究基于影像组学针对DBT的三维图像对乳腺肿块病变的辅助诊断展开。在乳腺X线摄影的影像组学对乳腺癌的辅助诊断方面，早期学者［13］大多使用机器学习方法，针对二维影像进行诊断。由于DBT影像数量较大，且在各个断层上所呈现的病灶形状、大小存在一定差异。针对同一病灶，使用二维影像可能会在不同层面上得到不同的诊断信息。再者，DBT影像的特点是其从不同角度对乳房进行拍摄，所获影像除了包含断层内的信息，还具备断层间信息，对于肿块诊断具有一定价值。因此，理想的肿块分析方法应包括每一层存在的肿块区域，对肿块整体进行组学特征的提取及分析。Fan等［14］基于DBT影像病灶三维纹理特征，研究良恶性诊断，相比二维诊断AUC更高，因此研究DBT影像的三维特征有一定意义。Samala等［15］使用深度卷积神经网络（deep convolutional neural network，DCNN）结合迁移学习策略，DBT肿块诊断结果的AUC值达到0.81。然而，其研究仍然是针对DBT中的二维影像进行，未探究DBT三维影像信息在诊断方面的价值。Li等［16］比较三维DBT影像与二维FFDM影像在DCNN对乳腺肿块的良恶性分类效能，发现具有迁移学习DCNN在鉴别恶性、良性和正常组织上更优，且DBT上训练的DCNN精度优于FFDM。本研究在方法上，利用图像标准化构建三维原始影像数据矩阵，再通过标准轮廓坐标得到原图像的掩膜文件，最终利用掩膜信息叠加获取病灶的三维掩膜数据矩阵。这种针对三维医学影像数据获取层间和层内信息，构建三维掩膜矩阵的方式，整合更多特征信息可能会对更加准确的检测提供帮助［17］。

本研究采用LR、SVM与GBDT 3种分类器研究基于影像组学对DBT三维肿块良恶性鉴别的诊断价值，发现在3种分类器模型中，GBDT模型表现最佳，在测试集中准确度为0.81，AUC值达到0.91。由于DBT三维肿块提取影像组学特征较多，属于线性模型的逻辑回归方法不容易处理。GBDT算法与SVM与LR算法相比较，具有以下三点优势［18］。第一，GBDT算法使用串行化的策略，继续学习上一个学习器拟合的残差，对数据的拟合能力大大增强，偏差减小，准确性提高。第二，GBDT能够较灵活地处理连续数据与离散数据，能从中筛选出为合适的特征子集。第三，在相对少的调参时间情况下，使用一些健壮的损失函数，对异常值的鲁棒性也很好。因此，与SVM及LR相比，GBDT能达到更好的准确度与AUC，模型更加稳定。

本研究存在若干方面的局限性，亟待后续研究的深入和改进。首先，本研究中共纳入乳腺肿块数据144个，数据量偏少，模型泛化能力较弱。今后将通过样本量扩充、纳入不同机型样本，以提高模型的泛化能力。同时在算法选择中纳入一些其他临床及病理学特性，以便判断结合ROC曲线能否更全面地反映模型效能。其次，本研究针对DBT影像肿块的良恶性诊断开展，可提供给医师的诊断信息仍显不足。后续在此基础上，拟基于DBT对分子亚型预测等临床问题进行探索。第三，在后续研究中，将考虑补充DBT数据中影像医师的诊断评估结果，并且进一步纳入人工智能的深度学习方法，将影像医师诊断、影像组学诊断、人工智能诊断三者进行比较。此外，本研究采用了提取DBT影像组学特征的研究方法，而基于DBT深度学习算法可以更好地消除诸如感兴趣区勾画等人为因素干扰，未来应通过深度学习路径进一步开展DBT的诊断价值研究。

综上所述，基于影像组学的DBT图像特征对乳腺肿块病变的鉴别诊断具有较好的临床价值。其中GBDT模型由于其集成学习的优势，表现效果最佳。