APP下载

基于增强CT 影像组学列线图预测单发肝细胞癌GPC3 表达状态

2022-06-08徐雅慧谢双双王建李思聪刘佳鑫张雅敏叶兆祥沈文

国际医学放射学杂志 2022年3期
关键词:勾画线图组学

徐雅慧 谢双双 王建 李思聪 刘佳鑫 张雅敏 叶兆祥 沈文

原发性肝癌已成为全球第三大癌症死亡原因,5 年内病人总生存率仅为18%[1]。肝细胞癌(hepatocellular carcinoma,HCC)是最常见的肝癌类型,对于单发早期HCC 病人,肝部分切除术是其主要治疗方式,但术后5 年内复发率高达70%[2-3]。HCC 的高复发率、高死亡率与肿瘤的高度异质性相关[4-5]。越来越多的研究[6-7]表明,特异性生物标志物和分子靶点在HCC 的早期诊断、靶向治疗、预后评估中具有重要的临床意义。磷脂酰肌醇蛋白聚糖3(glypican-3,GPC3) 是HCC 特异性相关抗原,在HCC 组织中过表达,而在正常肝组织中不表达或低表达,故而GPC3 可用于HCC 术前诊断、免疫治疗及预后评估等[8-9]。目前术前评估HCC 病灶GPC3 表达状态的方法有限且准确度不高。随着计算机技术的发展,影像组学在各种疾病诊断和治疗评估中的应用日益广泛,可以检测到肉眼无法识别的病灶特征,这些特征可能与肿瘤的生物学行为有关。既往研究[10-11]采用影像组学特征评估HCC 免疫因子Ki-67、CK-19 的表达状态,均取得了较好的预测效果。增强CT 是HCC 病人术前常规应用的影像检查手段,检查费用相对低廉、检查时间短,因此本研究采用增强CT 影像组学特征术前评估HCC 的免疫因子GPC3 表达状态,以期在术前鉴别出GPC3 阳性表达的HCC 病灶,为后续的临床治疗和随访方案的制定提供参考。

1 资料与方法

1.1 研究对象 回顾性纳入2014 年7 月—2021年1 月在天津市第一中心医院和2015 年12 月—2020 年8 月在天津医科大学肿瘤医院行部分肝切除术后经病理证实为单发HCC 的152 例病人,男121 例、女31 例,年龄28~85 岁,平均(59.22±10.64)岁。纳入标准:①术后进行GPC3 免疫化学染色;②术前1 个月内行腹部增强CT 检查;③临床信息完整。排除标准:①CT 影像存在伪影;②既往接受过经导管动脉化学栓塞、放疗、部分肝切除等治疗。天津市第一中心医院病例作为训练集(106 例),天津医科大学肿瘤医院病例作为验证集(46 例)。

1.2 设备与方法 采用东芝Aquilion 64 层CT、GE Revolution CT、GE Discovery 64 层 螺 旋 CT、GE Lightspeed 16 层螺旋CT、西门子双源CT 和西门子128 层CT 设备扫描。病人取仰卧位,扫描范围自膈顶至双肾下级。扫描参数:管电压120 kV,自动调节管电流,扫描层厚和层间距均为5 mm,重建层厚为1.25 mm 或1.2 mm,旋转时间0.5 s/r,FOV 350~400 mm×350~400 mm,矩阵256×256 或512×512,西门子双源CT 和西门子128 层CT 螺距为0.900∶1,其他CT 扫描设备螺距为0.984∶1。所有病人均经肘静脉团注对比剂碘海醇(含碘350 mg/mL,上海通用电气药业),注射剂量1.0~1.5 mL/kg 体质量,流率3.5~4.0 mL/s。采用对比剂示踪触发技术,触发点设置于腹主动脉起始处,注射对比剂15 s 后开始检测扫描,触发阈值为120 HU,腹主动脉内CT 值达120 HU时扫描动脉期,30 s 后进行门静脉期扫描。

1.3 临床资料、病理评估标准及分组 收集病人临床信息(包括性别、年龄、有无病毒性肝病)以及术前实验室检查指标[包括血清总胆红素(TBIL)、白蛋白(ALB)、血清甲胎蛋白(AFP)、癌胚抗原(CEA)、糖类抗原199(CA199)、谷草转氨酶(AST)及谷丙转氨酶(ALT)]。每个医院分别由一位病理科医生评估本院病例的GPC3 表达状态,将同一视野GPC3 免疫反应性肿瘤细胞≥5%定义为GPC3 表达阳性[12]。根据GPC3 的表达状态分别将训练集和验证集进行分组,训练集(106 例)中阳性组83 例,阴性组23 例;验证集(46 例)中阳性组35 例,阴性组11 例。

1.4 影像组学列线图构建

1.4.1 病灶勾画 由2 位分别具有3 年和5 年腹部影像诊断经验的放射科医生采用开源的3DSlicer 4.10.2 软件(https://download.slicer.org/)依据肝脏局灶性病变CT 和MRI 标注专家共识(2020 版)[13]分别对动脉期及门静脉期病灶逐层勾画兴趣区(ROI)。勾画原则:①首先在动脉期、门静脉期中选取病灶轮廓显示最清楚的期相勾画,然后参照该期相,对剩余期相进行逐层勾画。②勾画病灶时剔除病灶周围血管包绕、异常灌注区。③对于有包膜强化的病灶,无论包膜是否完整,勾画时均应将包膜勾画于病灶内;对于包膜不强化的病灶,需将未强化的包膜标注入病灶中。部分HCC 病灶密度与肝背景差异不大,病灶边界模糊,勾画困难,则由另1名有10 年腹部影像诊断经验的审核医师指导勾画。由3 年腹部影像诊断经验的放射科医生在增强CT 横断面影像上评估肿瘤直径。

1.4.2 特征提取 采用3D-Slicer 软件内的Radiomics 包对勾画好的ROI 进行特征提取,提取前将所有的图像进行标准处理。首先为了减少图像尺寸对结果的影响,将所有的图像重采样到统一尺寸上,并进行图像灰度均一化处理,然后采用高斯拉普拉斯滤波器及小波滤波器进行滤过,动脉期和门静脉期分别得到1 130 个特征。

1.4.3 特征筛选、列线图构建及验证 使用Python3.7中的“pingouin”程序包对训练集中2 次勾画ROI 提取的特征进行观察者间一致性分析,排除ICC<0.75的特征[14]。采用Python3.7 中的“StandardScaler”、“Levene”、“LassoCV”程序包分别实现数据标准化、单因素分析和十折交叉验证的最小绝对值收敛和选择算子(least absolute shrinkage and selection operator,LASSO)回归,通过优化回归参数(λ),使得大部分特征系数降为零,选取其余非零系数特征,获得与GPC3 表达高度相关的影像组学特征。将训练集中筛选获得的影像组学特征用于计算每例病人的影像组学评分(Radscore)得分,Radscore=其中βi为特征权重,Xi为特征值,β0为常数项,取值0.048 7。建立影像组学列线图。选取临床资料中在GPC3 阳性组和阴性组中差异有统计学意义的指标进行二元logistic 回归分析,获取HCC GPC3 表达阳性组的独立预测因素,建立临床列线图。联合影像组学Radscore 得分及临床列线图建立联合列线图,并在验证集中分别对3 个列线图的诊断效能进行验证。

1.5 统计学方法 采用SPSS 25.0 和R 4.0.3 软件进行数据分析。采用Kolmogorov-Smirnov 检验分析计量资料的分布状态,符合正态分布的计量资料用均数±标准差(±s)表示,2 组间比较采用独立样本t检验;非正态分布的计量资料用中位数(四分位间距)[M(P25,P75)]表示,2 组间比较采用Mann-Whitney U 检验。计数资料用例表示,2 组间比较采用χ2检验。采用受试者操作特征(ROC)曲线分析列线图鉴别GPC3 阳性组和阴性组的效能,计算曲线下面积(AUC)、敏感度、特异度,采用DeLong 检验比较列线图预测效能的差异。通过量化所有阈值概率下的净获益,进行决策曲线分析,以确定列线图的临床实用性。在训练集中建立列线图,在验证集中对列线图的诊断效能加以验证。P<0.05 为差异有统计学意义。

2 结果

2.1 GPC3 阳性组和阴性组病人临床资料比较及临床列线图的建立 训练集2 组间血清AFP、TBIL、AST、CA199 及有无病毒性肝炎的差异均有统计学意义(均P<0.05),而病人的年龄、性别、血清ALB、CAE、ALT、肿瘤最大径的差异均无统计学意义(均P>0.05),见表1。训练集中二元logestic 回归结果显示,血清AFP [优势比(OR)=6.101,P=0.024]和CA199(OR=1.054,P=0.039)是建立临床列线图模型的独立影响因素,用于建立临床列线图。验证集中2组间血清AFP、CA199 的差异有统计学意义(均P<0.05),见表2。

表2 验证集GPC3 阳性组和阴性组病人临床资料比较

2.2 影像组学特征筛选和影像组学列线图的建立 训练集动脉期及门静脉期分别获得4 个和3个与GPC3 阳性表达高度相关的影像组学特征,特征名称及其权重见图1,特征相关性热图见图2。训练集中采用Radscore(OR=4 739.172,P=0.001)建立影像组学列线图。在验证集中采用相应的影像组学特征计算每个病人的Radscore 得分。

图1 训练集中与GPC3 表达状态相关的影像组学特征名称及权重

图2 训练集影像组学特征相关系数热图。绿色代表2 个特征为正相关,红色代表负相关。每一格的数字代表相关系数。

2.3 联合列线图的构建及其校准曲线分析 训练集中二元logistic 回归分析结果显示,血清AFP、CA199 和Radscore 是建立联合列线图的独立影响因素,基于以上3 个指标构建联合列线图,结果显示Radscore 得分最高(OR=13 300.044,P=0.001),其次是血清AFP(OR=8.503,P=0.013),最低是CA199(OR=1.090,P=0.028)(图3)。校准曲线显示联合列线图对GPC3 阳性表达的预测概率与实际概率一致性良好(图4)。

图3 训练集联合列线图。可根据每例病人的血清AFP、CA199 和Radscore 分别绘制每个指标与列线图评分之间的垂线,从而得到每个指标所对应的分数值;然后将3 个指标的分数相加得到总评分;最后绘制总评分与列线图预测概率之间的垂线,从而得到病人GPC3 阳性表达的预测概率。

图4 训练集联合列线图校准曲线。实际曲线与理论曲线贴合尚可,提示联合列线图对GPC3 阳性表达的预测概率与实际概率一致性良好。

2.4 训练集和验证集3 种列线图的预测效能比较 训练集中,联合列线图的AUC 高于影像组学列线图(P=0.021)和临床列线图(P<0.001),联合列线图的敏感度最高,而临床列线图的特异度最高;验证集中,联合列线图的AUC 值高于影像组学列线图(P=0.045)和临床列线图(P=0.041),联合列线图的敏感度和特异度均最高,详见表3。训练集和验证集3 种列线图预测GPC3 阳性表达效能的ROC曲线见图5。

图5 3 种列线图预测GPC3 阳性表达的ROC 曲线。A 图为训练集,B 图为验证集。

表3 训练集和验证集3 种列线图预测GPC3 阳性表达的效能

2.5 3 种列线图的决策曲线分析 应用全部病人APF、CA199、Radscore 值绘制决策曲线,结果显示当阈值概率>16%时,联合列线图决策曲线的净获益高于假设全部病人GPC3 表达阳性的净获益,而且当阈值概率在16%~86%时联合列线图的临床净获益高于临床列线图和影像组学列线图(图6)。

图6 3 种列线图预测全部病人GPC3 表达的决策曲线

3 讨论

3.1 HCC GPC3 表达状态术前评估现状 免疫因子GPC3 作为HCC 组织病理特征的重要组成部分,对HCC 早期诊断具有辅助作用,更是制定治疗方案、评估HCC 病人预后的重要因素[15-16],但是,术前评估HCC 病人GPC3 表达状态的手段有限且准确度较低。目前临床检测HCC GPC3 表达状态的方法有病理穿刺活检,但其属有创性检查,且可能会出现采样误差[16-17];HCC GPC3 血清学检查的阳性率仅为52.8%,结果不稳定[18-19]。近期已有研究尝试采用病人影像学数据获取高通量的影像组学信息,预测HCC 病人GPC3 表达状态,如Geng 等[20]从53 例HCC病人的磁敏感加权成像(SWI)影像中提取影像组学特征,进行Spearman 相关性分析,结果显示1 个影像组学特征与GPC3 表达显著相关(P<0.05),AUC为0.760;结果表明SWI 序列可以预测HCC 病灶GPC3 表达状态。但该研究是基于多发HCC 病灶,病灶间差异较大,并未说明每个HCC 病灶与GPC3状态的一一对应关系,因此结果可信性不高,而且病例数较少,无法避免数据过度拟合,也未进行内部或外部验证,因此结果说服力不强。Gu 等[21]采用293 例HCC 病人的MR T1WI 延迟期影像进行病灶勾画和特征提取,经ROC 曲线分析显示,训练集和验证集影像组学列线图AUC 分别达到了0.879、0.871;联合病人术前血清AFP 水平建立联合列线图,训练集和验证集中联合列线图AUC 较影像组学列线图分别提高了0.047、0.043。该研究采用所有病人的AFP 和影像组学特征进行决策曲线分析,结果显示联合列线图临床净获益高于临床列线图,进一步证实了影像组学特征可用于预测HCC 病灶GPC3 表达状态,并能使临床获得收益。但该研究仅采用了单个序列进行影像组学评估,可能遗漏其他MR 检查序列中与GPC3 表达状态相关的信息,因此有必要对其他序列进行影像组学研究。上述2 项研究仅采用了MRI 的单一序列,可能遗漏某些重要信息,而且Gu 等[21]研究并未论证影像组学列线图和联合列线图间的差异是否具有统计学意义。因此有必要采用多序列评估单发HCC 病灶GPC3 表达状态,并评估各模型间的差异及临床获益情况。

3.2 增强CT 影像组学鉴别GPC3 阳性组和阴性组的实用性分析 增强CT 是HCC 病人术前常规的影像学检查手段,价格相对低廉、检查迅速。本研究提出了一种基于术前单发HCC 多期增强CT 的影像组学列线图,动脉期和门静脉期分别获得4 个和3 个与GPC3 表达状态高度相关的影像组学特征,影像组学列线图在训练集和验证集中均取得了较高的预测性能,AUC 值分别为0.842、0.726,因此基于增强CT 影像的影像组学特征可作为术前鉴别GPC3 阳性HCC 的预测指标,这也表明影像组学具有在微观水平上捕获并量化肿瘤的免疫表型及组织病理学特征的潜力。本研究在数据分析过程中,最初训练集曾使用包括延迟期的三期增强CT 影像,进行初步结果分析后发现,延迟期提取的影像特征的结果并未对列线图的诊断效能起到提升作用,而且勾画图像过程费时、费力,故而舍弃了延迟期数据。

3.3 GPC3 表达阳性组和阴性组临床信息比较结果分析 本研究结果表明GPC3 阳性组和阴性组间病人AFP、TBIL、肝炎状态的差异存在统计学意义,这与Gu 等[21]研究结论一致。Gu 等[21]研究还认为病人年龄、肿瘤直径与GPC3 表达状态相关,这与本研究结论不一致,原因可能是2 个研究纳入的样本间可能存在选择偏倚。本研究发现血清AFP 是GPC3 阳性的潜在独立危险因素,这与以往研究[22-23]的结果一致,可能是GPC3 与AFP 共享锌指转录因子、AFP调节因子2(Arf2)和同源异型盒2(Zfh2)所致[24]。本研究显示HCC GPC3 阳性组和阴性组间最大径的差异无统计学意义,这与Tsuchiya 等[25]的研究结果一致,因此GPC3 有可能成为早期HCC 和小肝癌诊断的潜在生物标志物。本研究还显示HCC 病人术前指标CA199 是影响GPC3 表达阳性的另一个独立危险因素。目前有关CA199 与GPC3 阳性HCC关系的研究尚未深入,需要今后进一步研究探讨。

3.4 列线图结果分析 本研究结果显示在临床列线图中训练集AUC 值为0.787,略低于验证集(0.803),可能是由于本研究结果显示AFP、CA199是GPC3 表达阳性的重要独立危险因素,可用于建立临床列线图。其中AFP>400 ng/mL 者在训练集和验证集占比均约45%(分别为35/83、16/35),但验证集中GPC3 阳性组和阴性组CA199 中位数均高于训练集,因此验证集病例与临床列线图的拟合度更高,预测结果更好。在影像组学列线图中,训练集AUC 值(0.842)高于验证集(0.726),可能的原因是影像组学列线图训练时采用的病例数偏少,导致模型的稳定性不够,产生了过拟合,因此验证集AUC值较训练集偏小,因此需要未来收集更多单发HCC病例,加入到列线图的构建中。本研究联合列线图校准预测曲线与标准曲线贴合尚可,提示联合列线图对GPC3 阳性表达的预测概率与实际概率一致性良好。联合列线图进一步提高了诊断效能,训练集和验证集中AUC 值达到了0.918、0.896。决策曲线分析显示当阈值概率>16%时,联合列线图具有较高的净获益值,而且当阈值概率处于16%~86%时,联合列线图的临床净获益高于临床列线图和影像组学列线图。这表明影像组学特征和病人临床因素具有互补性,可为今后的影像组学研究提供新思路。

3.5 局限性 本研究尚存在一些不足:首先,研究病例数较少,影像组学列线图建立过程中可能出现了过拟合,因此需要未来大样本数据进一步验证。其次,训练集和验证集采用多台不同型号扫描设备,虽然提取影像组学特征前对所有图像进行了重采样和灰度均一化处理,但是并不能完全排除不同设备对影像组学特征的影响,需要未来的研究进一步解决不同机构、不同设备图像标准化问题。

3.6 小结 基于增强CT 影像的影像组学列线图可作为术前鉴别GPC3 阳性HCC 的预测指标,联合列线图可以提高对GPC3 表达状态的预测效能,实现了术前较为准确地评估单发HCC 病灶GPC3 表达状态的目标,有助于临床医生更全面评估HCC 病灶病理生理行为,选择最佳的个体化治疗策略,为更准确评估病人预后情况提供了新的分析思路。

猜你喜欢

勾画线图组学
影像组学在肾上腺肿瘤中的研究进展
两种自动勾画软件对危及器官勾画结果对比分析
放疗中CT管电流值对放疗胸部患者勾画靶区的影响
一些图运算的调和指标与调和多项式的线图∗
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
蛋白质组学技术在胃癌研究中的应用
预测瘢痕子宫阴道试产失败的风险列线图模型建立
找一找
考古学勾画早期中国历史文化图景