APP下载

基于薄层CT的三维影像组学在预测亚厘米磨玻璃样肺腺癌浸润程度的价值

2020-08-28谭明瑜赵伟马伟玲孙英丽金倞李铭

放射学实践 2020年8期
关键词:浸润性组学腺癌

谭明瑜,赵伟,马伟玲,孙英丽,金倞,李铭

随着低剂量CT(low-dose computed tomography,LDCT)肺部疾病筛查的广泛推广,临床上表现为磨玻璃样的肺小结节(ground-glass nodules,GGNs)越来越常见[1],其中很大一部分结节的直径小于10 mm。大多数亚厘米大小的GGNs最后被病理证实为早期肺腺癌,但目前对这类病变的治疗方案以及管理策略还存在较大的争议。一般来讲,不典型腺瘤样增生(atypical adenomatous hyperplasia,AAH)和原位腺癌(adenocarcinomas in Situ,AIS)等浸润前期病变的生长速率较慢,只需要定期随访即可,即使后期需行手术治疗,患者的5年生存率也接近100%;而微浸润性腺癌(minimally invasive adenocarcinoma,MIA)和浸润性腺癌(invasive adenocarcinoma,IA)等浸润性病变一般需要择期或立即手术治疗[2-3]。因此,在术前准确诊断肺腺癌的浸润程度显然十分重要。

尽管以往已经有多位研究者推荐以10 mm为界值来区分GGNs肺腺癌的浸润前病变与浸润性病变[4-5],但仍有不少亚厘米级的GGNs最后被证实为MIA或IA[6-7]。由于亚厘米大小的肺腺癌处于肿瘤的早期阶段,发展缓慢,较少出现传统的提示为恶性的影像学征象,临床上诊断相对困难。近年来通过挖掘隐藏在图像之中的大量肉眼不可见、具有很大临床价值的信息来辅助临床决策制定、进而达到精准医疗的方法,也就是影像组学,已经成为研究热点[8-9]。

目前,关于影像组学鉴别肺腺癌浸润程度的研究相对较少,尤其是针对亚厘米级的GGNs。本研究旨在探讨基于术前薄层CT图像的三维影像组学分析在预测亚厘米级磨玻璃样肺腺癌浸润程度中的临床应用价值。

材料与方法

本研究为回顾性分析,已经我院伦理委员会批准,豁免患者知情同意书。

1.研究对象

回顾性分析华东医院2013年1月-2017年7月符合本研究要求的394例患者共446个亚厘米大小磨玻璃结节的影像学资料。纳入标准:①具有完整的肺部薄层CT平扫图像;②CT图像上结节最大直径≤10mm;③在CT图像上表现为磨玻璃结节,包括纯磨玻璃结节和部分实性结节;④经手术病理证实为肺腺癌。排除标准:①术前接受过新辅助放化疗等相关治疗;②图像质量不佳,影响定量分析。记录患者的临床资料,包括年龄、性别、吸烟史等。

将2013年1月-2015年12月收治的253例患者共286个结节作为训练集:男74例,女212例;年龄22~77岁,平均(54.4±11.4)岁。

将2016年1月-2017年7月收治的141例患者共160个结节作为验证集:男45例,女115例;年龄16~80岁,平均(54.5±13.4)岁。

2.CT检查方法

CT扫描机型包括GE Discovery CT750 HD、GE LightSpeed VCT 64排、Somatom Definition Flash、Somatom Sension 16,各CT机型的扫描参数及扫描的结节数量详见表1。所有患者取仰卧位,在深吸气后屏气状态下进行扫描。本研究选用距手术时间最近的一次CT平扫图像进行后续的分析,两者的间隔时间为1~96天,中位数为7天。

2.结节分割以及标注

所有的CT图像先由PACS以DICOM格式导出,然后导入开源医疗图像处理及导航软件3D Slicer 4.8.0(Brigham and Women’s Hospital),对肺结节进行标注(图1~2)。先由一位低年资医师使用软件内标注工具在所有肺结节所在层面的CT图像上逐层对结节进行感兴趣区(ROI)的勾画,尽可能剔除结节外的血管、支气管以及胸膜等结构,随后由一位高年资医师对标注结果进行审核、修改,包括位置、边界等信息,最后每个结节所有层面的ROI融合成其容积感兴趣区(volume of interest,VOI),所有结节的VOI内的全部CT数据以NII(脱敏格式)格式导出用于后续影像组学特征的提取。

表1 各CT机型的扫描参数及结节数量

图1 a~d) 患者,女,22岁,右肺上叶GGO,经病理证实为原位癌,采用3D-slicer软件逐层对结节进行分割和标注。 图2 a~d) 患者,男,58岁,左肺上叶GGO,经病理证实为浸润性腺癌,采用3D-slicer软件逐层对结节进行分割和标注。

3.影像组学特征提取

使用Matlab 2016b软件对446个GGNs进行像素归一化处理后,每个结节共提取了475个影像组学特征,包括灰度直方图特征、灰度共生矩阵特征(gray-level co-occurrence matrix,GLCM)和灰度游程矩阵特征(gray-level run lengths matrix,GLRLM)[10]。所有计算影像组学特征的公式详见以往的研究[11]。

4.可重复性分析

对提取的475个特征进行可重复性分析,分析方法:总样本的446个结节中随机选取60个GGNs,让两位分别有7年和16年胸部影像诊断经验的放射科医师分别独立进行病灶的分割和标注。一个月后,有7年经验的医师再对这60个结节进行分割。采用组内相关系数(inter-class correlation,ICC)对2位医师勾画的不同ROI所得到的475个特征进行一致性分析,ICC>0.75认为其一致性较好。其余的386个结节均由具有7年经验的医师进行分割,由具有16年经验的医师进行审核(具体实验流程见图3)。

5.CT形态学特征的评估

所有患者的CT图像均由2位放射科医师(分别有25年和15年胸部影像诊断经验)独立进行评估,对CT形态学特征的评估内容:结节的大小、类型(窗位-700HU,窗宽1500HU)、形态、边界、CT值及邻近血管改变等。结节大小的测量取横轴面的最大径,类型分为纯磨玻璃结节和混合磨玻璃结节,形态包括圆形、卵圆形和不规则形,边界分为清晰(定义为无分叶和毛刺)和不清晰,胸膜牵拉定义为连结结节和胸膜之间的细小纤维灶,血管改变定义为穿过病灶的血管增粗、扭曲或病灶周围血管聚集[12],支气管改变定义为穿过病灶的支气管增粗、扭曲或者支气管阻塞。CT值为3次ROI测量值的平均值,勾画ROI是尽可能避开血管和支气管。

图3 研究步骤和流程示意图。

6.术后病理检查

所有GGNs的病理结果均由具有5年以上临床经验的病理科医师按照最新的指南进行评估[3],分为AAH、AIS、MIA和IA,其AAH和AIS定义为浸润前病变,MIA和IA定义为浸润性病变。

7.Logistic回归模型分析

本研究中采用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)的方法在训练集中筛选出具有鉴别意义的特征[13],随后基于筛选出的特征来计算影像组学标签值。分析临床特征、传统影像学征象以及影像学标签在训练集的两组病变之间的差异,将差异有统计学意义的特征纳入多因素回归分析,建立Logistic回归模型。对回归模型的独立验证在验证集上进行,内部验证在低年资医师第二次标注的60例数据和高年资医师第一次标注的60例数据上进行。使用AUC值来评价列线图的效能。

8.统计学分析

分别使用R 3.4.3(http://www.Rproject.org)、SPSS 23.0和MedCalc软件对数据进行统计学分析。对连续变量使用独立样本t检验或克瓦氏H检验(Kruskal-Wallis H)检验,对分类变量使用卡方检验。LASSO算法使用“glmnet”工具包进行特征降维,筛选出具有鉴别诊断价值的影像组学特征。多因素回归分析用于模型的建立,ROC曲线用于评价多变量logistic回归模型的预测效能。以P<0.05为差异有统计学意义。

结 果

1.临床资料和CT征象的组间比较

446个GGNs中,134个(30.04%)为浸润前病变,312个(69.96%)为浸润性病变。训练集和验证集中患者的基本临床信息和影像学征象详见表3。统计分析结果显示,训练集和验证集中结节的大小、类型、边界、形态、血管改变及CT值在浸润前病变及浸润性病变间的差异均有统计学意义(P<0.05),其余临床特征及传统影像学征象的组间差异无统计学意义(P>0.05)。

2.影像组学特征的分析

对医师提取的影像组学特征进行可重复性分析,低年资医师两次标注获得的各项纹理参数值的一致性均较好,ICC为0.7883~0.9914;低年资医师与高年资医师对同一组结节(60例)进行标注后获得的各项纹理参数比较,一致性均较好,ICC为0.7513~0.9787。由此得到的127个较为稳定的特征被纳入后续分析。随后,在286个结节组成的训练集中,采用LASSO算法筛选出13个对鉴别亚厘米肺腺癌浸润程度最具价值的特征(图4)。每个结节可根据公式(1)计算得到相应的影像组学标签(radiomic signature,RS):

RS=3.037495+0.1483×mean_50_0+6.75E-08×Correlation_45_90_0+0.00211967×mean_50_1-1.36E-05×LRE_0_1-0.0002457×Contrast_45_90_1+0.00166204×SD_25_1.5-0.0087193×LRE_0_1.5-0.0513177×LRE_90_1.5+1.72E-05×Contrast_0_135_1.5-1.68E-05×Contrast_ 45_90_1.5+0.00417945×SD_10_2+2.53E-05×Contrast _45_45_2+6.69E-05×RLN_135_2.5

(1)

训练集和验证集中浸润性病变的影像组学标签值均高于浸润前期病变(表2),差异均有统计学意义(P<0.05)。ROC曲线分析结果显示,在训练集和验证集中影像组学标签的AUC值分别为0.696(95%CI:0.630~0.760)和0.674(95%CI:0.588~0.761)。

3.多变量logistic回归分析

在GGOs的临床资料、常规CT征象及影像组学标签中,有7个特征在浸润性和非浸润性GGOs组间的差异有统计学意义(表2),将这7个特征纳入多因素logistic回归分析,结果显示,CT值和影像组学标签为独立预测因素(表3)。基于这2个独立危险因素建立logistic回归模型:

logit(P)=3.170+0.06×CT值+1.068×影像组学标签

(2)

在训练集中(图5),回归模型、CT值和影像组学标签鉴别浸润性和非浸润性GGOs的AUC分别为0.785(95%CI:0.730~0.840,敏感度为72.9%,特异度为71.1%)、0.742(95%CI:0.681~0.802,敏感度为72.4%,特异度为68.7%)和0.696(95%CI:0.630~0.760,敏感度为52.7%,特异度为78.3%),回归方程的预测效能优于CT值和影像组学标签,且差异有统计学意义(P=0.0392;P=0.0007)。在验证集中(图6),回归模型、CT值和影像组学标签鉴别浸润性和非浸润性GGOs的AUC分别为0.704(95%CI:0.618~0.790,敏感度为62.4%,特异度为70.6%)、0.683(95%CI:0.595~0.772,敏感度为65.1%,特异度为64.7%)、0.674(95%CI:0.588~0.761,敏感度为55.0%,特异度为72.5%),回归模型的预测效能优于CT值,两者间的差异有统计学意义(P=0.0074)。

表3 影像表现及影像组学标签的多因素回归分析结果

讨 论

本研究结果显示,基于CT值和影像组学标签建立的回归模型能较好地无创性预测亚厘米大小肺腺癌的浸润程度,ROC曲线下面积(AUC)为0.704,高于CT值及影像组学标签的AUC(分别为0.683和0.674),回归模型的预测效能优于CT值(P<0.05)。虽然验证集中回归模型的AUC值与影像组学标签间的差异无统计学意义,但仍可见影像组学标签预测效能相对较高的趋势。

本研究分析了影像组学特征、临床特征以及传统影像学征象在鉴别亚厘米大小磨玻璃样肺腺癌浸润程度方面的价值,结果显示,大部分临床特征及影像特征在浸润前期病变及浸润性病变之间的差异无统计学意义,笔者分析可能的原因:首先,对这些形态学特征鉴别GGNs的浸润程度的价值,尚存在一定的争议[14],有研究表明直径不能作为判定良、恶性的依据[15-16];圆形磨玻璃结节为恶性的可能性要大于多边形[17];另有研究发现大约有50%的炎性病变中也会出现空洞征[18]。此外,以磨玻璃结节为主要表现的肺腺癌,往往处于肿瘤早期阶段,提示恶性可能的影像学征象往往出现较少。本研究中经多因素分析,最终仅CT值和影像组学标签为独立预测因素,CT值增高与病变的良、恶性有关,这与以往的研究结果基本一致[19-20],通常认为CT值的升高是肿瘤细胞增多所致[21]。

图4 利用Lasso算法筛选有鉴别意义的影像组学特征。a)lasso模型中使用十倍交叉验证方法,筛选出效能最好的特征集合,垂直虚线表示最佳λ取值对应的log(λ)值,本研究共选出13个特征;b)lasso模型中使用十倍交叉验证方法筛选出的组学特征的特征系数收敛图,图中的每一条曲线代表了每一个自变量系数的变化轨迹。 图5 训练集中logistic回归模型的ROC曲线。 图6 验证集中logistic回归模型的ROC曲线。

尽管影像组学在医学中的应用十分广泛,但特征的稳定性(主要与扫描参数 、病灶的分割等因素有关)以及冗余性都是研究者需要关注的问题。本研究中所纳入的均为亚厘米大小的磨玻璃结节,手动分割病灶不仅受到主观因素的影响,病灶本身也给分割带来了难度,比如直径过小、边界欠清等。此外,本研究提取的影像组学学特征为三维特征,容易受到像素之间空间位置的影响。因此,本研究中采用了像素大小归一化处理、可重复性分析以及LASSO降维等措施来避免特征不稳定以及冗余性带来的影响,最终筛选出13个稳定且预测效能较好的影像组学特征来建立影像组学标签,其ROC曲线下面积(AUC)为 0.674(95%CI:0.630~0.760)。Xue等[22]学者也进行了类似的研究,所建立的影像组学列线图预测磨玻璃结节浸润程度的AUC为0.79(95%CI:0.71~0.88)。而本研究中的研究对象是亚厘米级的磨玻璃结节,诊断难度更大。根据影像组学理论,我们所提取的特征能够反映肿瘤的空间异质性、微环境和基因表达状态等[23]。但是要准确解释影像组学特征与复杂生物学模式之间的确切联系仍然具有很大的挑战性。其实,将多个影像组学特征合并成一个影像组学标签的做法能够简化分析流程,更有利于临床的实际应用[11,24]。本研究中所建立的logistic回归模型能够很好地区分浸润前病变和浸润性病变,证明了这种方法的可行性。

本研究存在以下不足:其一,为单中心回顾性研究,仅仅纳入亚厘米大小的GGNs,样本数量有限,不排除存在数据选择偏移的可能;其二,本研究纳入的病例采用了几种不同的CT机型进行扫描,扫描条件和参数存在一定的差异,也可能对分析结果产生一定的影响。因此,本研究的结论可能尚需要进一步采用前瞻性、多中心、标准化和大样本的研究来验证。

总之,本研究分析了GGNs的传统影像学和影像组学两方面的危险因素,在兼顾实用性和准确性的基础上,结合CT值和影像组学标签,建立了一个能够更好地预测亚厘米GGNs浸润程度的logistic回归模型,相比传统影像学方法,此模型具有较好的预测价值,有望用来辅助临床决策。

猜你喜欢

浸润性组学腺癌
特殊浸润性表面构建及其抑制酸奶黏附的研究
管状腺癌伴有黏液腺癌分化结直肠癌临床病理与免疫组织化学特征
影像组学在肾上腺肿瘤中的研究进展
云南地区多结节肺腺癌EGFR突变及其临床意义
十二指肠腺癌88例临床特征及相关预后因素
以盆腔巨大包块就诊的宫颈微偏腺癌2例报告
浸润性乳腺癌的超声诊断与临床病理学对照分析
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
同期经尿道手术治疗非肌层浸润性膀胱癌(NMIBC)合并良性前列腺增生(BPH)患者的效果观察