APP下载

基于乳腺X线摄影影像组学列线图预测BI-RADS 4~5类钙化病灶恶性风险

2023-03-20徐文杰邓水堂安永玉王健敖炜群谢宗玉杨昭王小雷茅国群

浙江医学 2023年3期
关键词:线图组学恶性

徐文杰 邓水堂 安永玉 王健 敖炜群 谢宗玉 杨昭 王小雷 茅国群

数字乳腺X线摄影(mammography,MG)是当前乳腺癌诊断和筛查的首选检查方法之一。MG图像显示钙化为乳腺癌最重要的特征之一,但非典型钙化判断肿瘤良、恶性较困难。根据乳腺影像报告与数据系统(breast imaging reporting and data system,BI-RADS)标准,对于诊断为BI-RADS 4类的钙化病灶需要活检以明确恶性风险[1],但此类钙化恶性概率范围甚大,为2%~95%,而文献报道阳性预测值仅为32.9%~34.0%[2-3]。另外部分钙化由于影像学上有较多重叠,判定BI-RADS 4C或5类较难。当前,影像组学已广泛用于临床研究,列线图是近年来在影像组学研究中推荐使用的一种形象、直观的风险评估模型方法,在乳腺MG检查中的研究已有开展[4-5],但对于BI-RADS 4~5类钙化的深入研究较少。本研究旨在探讨基于乳腺MG检查的影像组学列线图在预测钙化恶性风险中的价值,现将结果报道如下。

1 对象和方法

1.1 对象 回顾2017年1月至2020年12月浙江省立同德医院49例和蚌埠医学院第一附属医院262例女性患者MG检查图像及病历资料,MG检查均诊断为BI-RADS 4~5类的可疑恶性钙化。纳入标准:(1)MG图像显示有明确钙化灶,周围无明确肿块;(2)患者MG检查后1个月内完成穿刺活检或手术治疗,有完整手术病理资料;(3)图像质量清晰,满足钙化分析。排除标准:(1)无完整手术病理资料及长期影像随访结果者;(2)术前曾行化疗、放疗患者;(3)MG图像质量差,影响钙化判断者;(4)2个及以上手术病灶。排除术前放化疗4例及2个及以上手术病灶患者15例,最终纳入292 例,年龄22~77(47.28±9.93)岁,其中恶性171例(浸润性癌89例,导管内癌79例,髓样癌1例,化生癌1例,黏液腺癌1例),良性121例(纤维腺瘤33例,腺病77例,乳头状瘤4例,其他良性病灶7例)。采用Python随机分类函数按照7∶3比例分为训练集204例和验证集88例。本研究经浙江省立同德医院和蚌埠医学院第一附属医院医学伦理委员会批准。

1.2 方法 采用美国Hologic Selenia(Hologic Medical Systems,Boston)全数字化乳腺X线机(浙江省立同德医院)和德国Siemens Mammomat Inspiration数字化乳腺X线机(蚌埠医学院第一附属医院)。拍摄部位包括双侧乳腺头尾位(craniocaudal,CC)和内外斜位(mediolateral oblique,MLO)。拍摄时均采用自动曝光系统。

1.3 图像评估 由2位4年以上乳腺亚专业的放射诊断医师(1位主治医师,1位主任医师)在对病理检查结果不知情的情况下按照美国放射学院(American College of Radiology,ACR)第5版BI-RADS标准评估以下影像指标并记录:(1)乳腺密度分型分为脂肪型、散在纤维腺体型、不均匀致密型及极其致密型,前两型归为非致密型,后两型归为致密型;(2)钙化形态分为无定形、细小多形性、粗糙不均质、细线状或细分支状;(3)钙化分布分为簇状、段样、线样、区域性及弥漫性;(4)BI-RADS分类依据钙化特征综合评估。当2位医师意见不一致时由第3位乳腺专业的主任医师进行评估,且为最终评估结果。

1.4 影像组学特征提取及筛选 同样由以上2位诊断医师利用ITK-SNAP软件对乳腺目标钙化灶的CC和MLO图像进行手动分割,先由1位医师勾画感兴趣区域(region of interest,ROI),然后由另1位医师对所勾画ROI进行审核,意见不统一时共同商讨决定勾画范围。如患者为弥漫钙化则选取相对集中且风险较高区域分割。为避免数据异质性,对所有DICOM图像进行重采样归一化到相同的分辨率(1 mm×1 mm×1 mm)。采用Python中的扩展软件包pyradiomics进行特征提取。对提取的特征采用Z-score标准化处理将每种特征量纲缩放到相同的数量级。应用R语言(版本3.6.1,http:www.rproject.rog)的最小冗余最大相关(minimum redundancy maximum relevance,mRMR)软件对上述特征进行分析。利用训练集里的影像组学数据,采用mRMR的多变量方法,在去除冗余和低重现性特征后,基于启发式评分标准识别最重要的特征,将排名前30位的特征再用最小绝对值收敛和选择算子(least absolute shrinkage and selection operator,LASSO)方法进行筛选。

1.5 模型构建 影像组学模型:选取从CC、MLO图像中筛选的特征,运用logistic回归计算影像组学评分并建立影像组学模型(单一CC模型、单一MLO模型和CC+MLO模型);临床模型:比较良、恶性组患者的年龄、绝经状态、钙化形态、钙化分布、BI-RADS分类的差异,通过单因素及多因素logistic回归分析筛选出差异有统计学意义的独立危险因素,建立临床诊断模型;联合模型:采用多因素logistic回归分析,联合筛选出的临床独立危险因素和影像组学评分建立联合模型。最后基于联合模型构建列线图。

1.6 统计学处理 采用SPSS 22.0统计软件。计量资料以表示,组间比较采用两独立样本t检验;计数资料以例(%)表示,组间比较采用χ2检验。采用ROC曲线评估各模型的诊断效能,计算AUC、灵敏度、特异度和准确度。采用校准曲线及决策曲线评估列线图在预测乳腺钙化恶性风险中的一致性和临床价值。P<0.05为差异有统计学意义。

2 结果

2.1 良、恶性患者临床特征的比较 良性组和恶性组患者年龄、绝经状态、钙化形态、钙化分布、BI-RADS分类方面比较差异均有统计学意义(均P<0.01),但乳腺密度比较差异无统计学意义(P>0.05)。训练集和验证集在年龄、绝经状态、乳腺密度及钙化分布方面比较差异均无统计学意义(均P>0.05),但在钙化形态、BI-RADS分类方面比较差异均有统计学意义(均P<0.05)。训练集和验证集中钙化的恶性率分别为60.3%(123/204)、47.7%(42/88),差异无统计学意义(P>0.05)。见表1。

表1 良、恶性患者临床特征的比较

2.2 乳腺钙化恶性的危险因素分析 经单因素logistic回归分析显示,年龄、绝经状态、钙化形态、钙化分布和BI-RADS分类是预测乳腺钙化恶性风险的危险因素;多因素logistic回归分析显示,年龄(OR=1.075,95%CI:1.028~1.125,P<0.01)、BI-RADS 分类(OR=4.924,95%CI:2.818~8.605,P<0.01)是预测乳腺钙化恶性风险的独立危险因素。见表2。

表2 良、恶性组临床特征单因素和多因素logistic回归分析

2.3 影像组学特征 本研究中从CC及MLO图像中均提取到851个高维特征,包括14个形状特征、18个一阶特征、75个纹理特征和744个小波特征。特征经Z-score标准化处理后采用mRMR及LASSO回归模型筛选出与钙化恶性风险相关的组学特征,CC图像的组学特征有4个(4个小波特征),为wavelet.LLH_glcm_Imc2、wavelet.LLH_glrlm_LongRunHighGrayLevelEmphasis、wavelet.HHH_gldm_LargeDependenceHighGrayLevelEmphasis、wavelet.LLL_glcm_JointAverage,MLO 图像的组学特征有6个(2个一阶特征和4个小波特征),为wavelet.LLL_glszm_LargeAreaLowGrayLevelEmphasis、original_firstorder_InterquartileRange、wavelet.LLH_glrlm_Long-RunHighGrayLevelEmphasis、original_glszm_LargeAreaL-owGrayLevelEmphasis、wavelet.LLL_ngtdm_Strength、origin-al_glszm_LowGrayLevelZoneEmphasis。

2.4 3种模型预测钙化恶性风险效能比较 临床模型由两项独立危险因素即患者年龄、BI-RADS分类构建而成。验证集中CC+MLO模型预测钙化恶性风险的效能均高于单一CC模型和单一MLO模型,其AUC分别为0.714、0.697、0.708,在后续的模型效能比较中均采用CC+MLO模型作为影像组学模型。ROC曲线分析显示,在验证集中,与影像组学模型和临床模型相比,联合模型具有更高的效能。在训练集中,联合模型预测钙化恶性风险的灵敏度、特异度、准确度分别为 0.705、0.878、0.775;在 验 证 集 中 分 别 为 0.708、0.900、0.795。在验证集中,与临床模型和影像组学模型相比,联合模型具有最高的特异度、准确度。见表3和图1。

图1 3种模型预测钙化恶性风险的ROC曲线(A:训练集;B:验证集)

表3 3种模型预测钙化恶性风险效能比较

2.5 列线图构建 基于联合模型,构建可视化的临床-影像组学列线图,以个性化评估钙化恶性风险,见图2。在该列线图中,与年龄相比,BI-RADS分类和影像组学评分占据了评分标度的较大部分,表明BIRADS分类和图像影像组学特征参数在预测钙化恶性风险中起主导作用。图3为校准曲线,表示列线图预测的恶性风险值和实际病理之间具有良好一致性。图4为决策曲线,显示临床-影像组学列线图在预测乳腺钙化恶性风险方面具有较高的净获益。

图2 基于联合模型构建的预测钙化恶性风险的列线图

图3 影像组学诺谟图预测钙化恶性风险的校准曲线

图4 3种模型的决策曲线图

3 讨论

根据ACR BI-RADS标准,BI-RADS 4类钙化需要活检,5类需要手术。但4类钙化恶性风险为2%~95%,跨度甚大,有部分患者实施了不必要的活检。另外,在临床实际工作中,BI-RADS 4C和5类较难把握。以往一些研究显示机器学习的方法可以为钙化病灶的诊断提供支持,包括影像组学[6]。本研究从292例患者的CC和MLO图像中各提取851个特征,通过mRMR及LASSO回归筛选出4个及6个最有价值的影像组学特征构建组学模型,共创建3个影像组学模型,分别是单一CC和单一MLO模型以及CC+MLO模型,结果显示验证集中CC+MLO模型预测钙化恶性风险的效能均高于前两者,其AUC为0.714。这与彭程宇等[7]和 Lei等[8]研究结果相仿。

以往研究表明,乳腺癌的发生除了与病灶本身的特征相关外还与多项临床因素有关[9]。本研究对照病理检查结果发现良性组和恶性组在年龄、绝经状态、钙化形态、钙化分布及BI-RADS分类中差异均有统计学意义,与既往研究相符[9-11]。进一步多因素logistic回归分析证实年龄、BI-RADS分类是预测乳腺钙化恶性风险的独立危险因素。因此,本研究纳入以上两个指标构建了临床模型,结果显示在验证集中,该模型预测钙化恶性风险的AUC为0.833,优于影像组学模型。

为进一步探讨模型的效能,本研究又联合临床独立危险因素-影像组学特征构建了联合模型,并应用ROC曲线比较临床模型、影像组学模型、联合模型效能,结果显示联合模型的诊断效能较好,在训练集和验证集中其AUC均最高,在验证集中其特异度及准确度均高于前两者。联合模型特异度、准确度的提高可以减少假阳性的发生,避免不必要的活检和手术,同时降低假阴性,减少乳腺癌漏诊率。但在诊断灵敏度方面,联合模型不具有优势,在训练集中低于临床模型,在验证集中低于影像组学模型。分析原因可能为联合模型采用了年龄、BI-RADS及组学特征多个分层指标,因此降低了灵敏度,但其特异度和准确度均有提高。

列线图是一种可视化的统计工具,它可以包含多种风险因素,因此它的预测能力比单一风险因素更全面[12]。Lei等[8]应用影像组学的方法研究列线图预测BI-RADS 4类钙化的恶性风险,并纳入绝经状态为临床独立危险因素,结果显示验证集联合模型AUC为0.80。Shen等[9]纳入年龄、钙化分布、最大钙化直径和钙化数量4个危险因素,联合组学特征构建了预测MG无定形钙化列线图,结果显示验证集中AUC也为0.80。本研究最后基于联合模型构建了临床-影像组学列线图,验证集AUC为0.844,优于前两者。研究结果的差异考虑可能与病例来源及临床危险因素的选择有关。另外,在本组列线图中,直观显示与年龄相比,BI-RADS分类和影像组学特征占据了评分标度的较大部分,表明后两者在预测钙化恶性风险中起相对主导作用。校准曲线显示在训练集及验证集中,列线图预测恶性风险值和实际病理之间具有良好的一致性。决策曲线进一步证明该列线图在预测乳腺钙化恶性风险方面具有较高的净获益。因此,笔者认为基于联合模型的列线图可用于预测乳腺MG钙化恶性风险,其效能优于单一的BI-RADS分类和影像组学。

本研究还存在一些局限性:(1)本研究病例数总体偏少,且来源于两家医院,机器类型不同,可能导致结果有偏倚。但研究结果显示联合模型诊断效能较好,而且一定程度也增加了模型泛化的能力。未来研究中会加大样本量、进一步细分病例来源深入研究。(2)部分患者为致密型乳腺,图像未加压摄片,一些细小多形钙化显示不清,易与无定形钙化混淆;而且有些钙化形态特殊,很难完全准确归类到分类中,对结果可能有一些影响。(3)本研究尚缺乏外部验证,目前无法进一步评估其普遍适用的效能,未来研究将进一步补充收集病例,不同中心病例加以验证。

综上所述,本研究证实了基于临床-影像组学特征构建的联合模型对乳腺BI-RADS 4~5类钙化恶性风险预测效能优于单独临床模型及单独影像组学模型。基于联合模型构建的列线图直观显示恶性风险概率,具有较好的临床应用价值,可以作为乳腺癌筛查的辅助检测工具。

猜你喜欢

线图组学恶性
恶性胸膜间皮瘤、肺鳞癌重复癌一例
预测瘢痕子宫阴道试产失败的风险列线图模型建立
基于箱线图的出厂水和管网水水质分析
卵巢恶性Brenner瘤CT表现3例
口腔代谢组学研究
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
东山头遗址采集石器线图
24例恶性间皮瘤临床分析
代谢组学在多囊卵巢综合征中的应用
多层螺旋CT在甲状腺良恶性病变诊断中的应用