APP下载

T2WI序列纹理分析联合机器学习的影像组学术前预测肾透明细胞癌的病理分级

2020-09-08石博文叶靖段绍峰赵泓博刘路路许晴

中国医学影像学杂志 2020年8期
关键词:特征参数组学纹理

石博文,叶靖,段绍峰,赵泓博,刘路路,许晴

1.大连医科大学,辽宁大连 116044;2.江苏省苏北人民医院影像科,江苏扬州 225001;3.上海GE 医疗公司,上海 210000;4.扬州大学,江苏扬州 225001;*通讯作者 叶靖 18051061289@163.com

肾脏肿瘤是泌尿系统常见肿瘤,常无明显症状,多因体检发现,且多为恶性[1]。肾细胞癌是泌尿系统中恶性度较高的肿瘤,也是最常见的肿瘤之一,其中最常见的病理类型是肾透明细胞癌(clear cell renal cell carcinoma,ccRCC),约占肾脏肿瘤的60%。2016年,WHO 提出的新分级指南Fuhrman 核分级[2]在目前病理学分级系统的应用最广泛,也是判断预后的独立指标之一,Fuhrman 分级与肿瘤的生长速度和患者的预后密切相关,术前准确分级对手术的治疗及预后极为重要[3]。目前常规影像学检查对肿瘤术前病理分级的诊断价值有限,而影像组学作为一种无创方法,利用大量自动化数据特征化算法将感兴趣区(ROI)转化为可以进行发掘处理的特征空间数据,结合机器深度学习,能够对肿瘤病变内在的异质性进行定量分析,并与病理分级进行关联[4]。本研究拟探讨基于磁共振T2WI 图像纹理分析联合机器学习的影像组学对术前预测ccRCC 病理分级的价值。

1 资料与方法

1.1 研究对象 收集2016年6月—2019年6月我院MR 诊断报告提示为肾癌并经术后病理证实为ccRCC 的63 例患者,根据Fuhrman 分级标准[2]分为高级别ccRCC 29 例(Ⅲ级+Ⅳ级),低级别ccRCC 34 例(Ⅰ级+Ⅱ级),男43 例,女20 例,年龄27~82 岁,平均(58.4±11.02)岁。纳入标准:①手术病理证实为ccRCC 并进行Fuhrman 分级;②术前进行常规MRI检查,无明显影响图像纹理分析的伪影;③病灶均为单发且初发首治。

1.2 MRI 检查 63 例患者均进行常规肾脏MRI 平扫,使用GE Discovery MR750 3.0T MR 扫描仪,患者扫描前均禁饮食8 h,横轴面T2WI 采用呼吸触发脂肪抑制PROPELLER 序列(RTr Ax fs T2 PROPELLER),扫描范围覆盖全部肾脏,T2WI 扫描参数:TR 4800 ms,TE 74 ms,回波链长度28,矩阵320×320,层厚5 mm,层间距1.0 mm,视野40 cm×40 cm。

1.3 图像处理 在医院影像归档和通信系统(PACS)以DICOM 格式导出纳入研究患者的肾脏MRI 图像。将获得的T2WI 图像导入ITK-Snap 软件(version3.8.0,www.itk-snap.org),然后勾画ROI。由一位具有10年工作经验的影像诊断医师操作软件并对图像进行判读,采用盲法以手动方式在横断位T2WI 图像上勾画ROI(图1),勾画原则:①在病灶最大层面勾画出病灶的最大范围;②ROI 边缘距离病灶边缘约2 mm,尽量避免将肾脏正常组织画入其中。由另一位高年资影像诊断医师检查勾画结果,最后将获取的ROI 图像以NIFTI 格式保存。

图1 男,42 岁。A.横断位磁共振T2WI 示右肾肿瘤;B.红色区域为手动勾画感兴趣区,术后病理证实为右肾透明细胞癌Ⅲ级

1.4 数据采集

1.4.1 特征提取 将获取的T2WI 原始图像和勾画完成的ROI 图像分为高级别ccRCC 和低级别ccRCC,分别导入A.K.软件(Artificial Intelligent Kit),先进行图像预处理,主要对异常值进行处理,使图像标准化。然后将预处理后的图像再次导入A.K.软件提取病灶纹理特征,共396 个特征,包括6 类特征参数:直方图特征、形态学特征、灰度共生矩阵参数(grey level co-occurrence matrix,GLCM)、基于GLCM 的Haralick 特征参数、游程矩阵参数(run length matrix,RLM)、灰度连通区域矩阵参数(gray level size zone matrix,GLSAZM)。

1.4.2 特征筛选与统计学方法 使用A.K.软件内置R 语言算法自动进行统计分析。首先采用A.K.软件提取T2WI 图像上的396 个影像组学特征,使用单因素方差分析特征参数,采用Mann-WhitneyU检验或t检验,剔除两组参数间差异无统计学意义的参数,此步骤筛选出89 个两组之间差异有统计学意义的影像组学特征参数。然后采用Spearman 相关性分析进行特征去冗余,剔除自相关性系数>0.9 的纹理参数,在第一步的基础上进一步筛选出10 个特征参数。

1.4.3 构建模型 将病例以7∶3 随机分为训练集与测试集,使用降维后获得的8 个特征参数建立随机森林(random forest,RF)机器学习模型,70%的ROI 样本(低级别23 例,高级别20 例)作为训练组训练机器学习模型,30%的样本(低级别11 例,高级别9 例)作为测试组对模型的准确性进行测试,计算准确度、敏感度、特异度,并获得ROC 曲线及曲线下面积(AUC)。

2 结果

2.1 影像组学特征提取 采用最小绝对收缩算子算法(least absolute shrinkage and selection operator,LASSO)进行特征值降维,采用交叉验证筛选各个特征在最佳log(lambda)时的系数,获得与高、低级别ccRCC 鉴别相关的特征参数5 个,分为4 类。其中,直方图参数1 个:uniformity;形态学参数1 个:Compactness 2;GLCM 2 个:Correlation_AllDirection_offset7_SD 和GLCMEntropy_AllDirection_offset7_SD;RLM 1 个:LongRunHighGreyLevelEmphasis_angle90_offset7(图2)。

图2 经三步筛选在最佳log(lambda)时的系数(coefficient),获得最具特征的5 个参数

2.2 构建RF 机器学习模型及效能评价 使用A.K.软件中的RF 模型对上述5 个影像学特征参数进行分类训练和测试,计算得训练集准确度、敏感度、特异度及ROI曲线下面积(AUC)均为100%,获得训练集ROC 曲线;测试集准确度、敏感度、特异度及AUC 分别为85%、100%、72%、0.87,获得测试集ROC 曲线(图3)。

图3 筛选出的5 个特征参数构建RF 机器学习模型,A 为训练集ROC 的AUC 为1,B 为测试集ROC 的AUC 为0.87

3 讨论

临床上对不同病理级别的ccRCC 需采用不同的手术方案,高级别ccRCC 一般采取根治性肾切除术,但对于低级别ccRCC,为了最大限度地保留肾单位,避免给患者带来肾功能下降及心血管事件发生的风险,通常行肾脏局部切除术或腹腔镜等创伤较小的手术[5],因此术前明确ccRCC 的病理分级至关重要。

影像组学方法是指对图像提取定量影像学特征,并通过分割、特征提取、模型建立等得到图像的灰度变化、体素空间关系等特征,从而实现对疾病的精准预测、诊断及预后评估等[6-7],这不仅避免了观察者本身对于影像特征解读的主观偏向,还能深度挖掘并整合影像图像中大量的人眼无法识别和区分的数字化信息,从而提高疾病的诊断效能,且非侵入性的影像组学检查无损伤,可重复检查[8]。MRI 具有高分辨率、无电离辐射损失、可提供多参数功能成像等优势,T2WI序列图像组织分辨率更高,对病灶显示更为清晰。T1WI、DWI 序列图像对病灶的大小、边缘显示不及T2WI 序列图像。CT 扫描作为检出和诊断肾脏肿瘤的常用方法,具有一定的辐射性;CT 增强扫描需要注射对比剂,有引起对比剂过敏的风险,并增加肾功能不全患者的肾脏负担。此外,病灶碘含量值受扫描时相、血管异常等因素的干扰,容易影响高、低级别组间差异的显著性[9]。因此本研究采用基于磁共振T2WI 图像影像组学对高、低病理级别的ccRCC 病变进行研究。

既往研究已证实通过影像组学诊断肾脏肿瘤性病变的可行性。王平等[10]采用CT 增强图像影像组学模型鉴别ccRCC 与非透明细胞癌,显示良好的诊断效能。Juntu 等[11]使用支持向量机分类器对86 例良性和49 例恶性肾脏软组织肿瘤患者的MRI 影像进行纹理分析,发现基于T1WI 的纹理分析鉴别软组织肿物良恶性的AUC 值(0.93)高于肉眼诊断的AUC 值(0.90)。白旭等[12]研究证实发生不同部位转移的ccRCC 原发灶基于T2WI图像的影像组学特征差异有统计学意义。然而,利用磁共振T2WI 图像纹理分析联合机器学习的影像组学预测ccRCC 术前病理分级的相关研究目前鲜有报道。

本研究采用磁共振T2WI 图像影像组学构建RF机器学习模型,探讨高、低病理级别ccRCC 病变的异质性,研究采用的影像图像来自同一台MRI 设备,手动勾画肿瘤病变区域,并进行图像预处理,以减小个体差异及采集误差,保证了提取特征的可靠性。最终筛选获得直方图参数、形态学参数、GLCM 及RLM 4类特征参数。直方图参数与图像像素有关,其中均匀度参数描述了图像纹理的均匀程度。GLCM 反映间隔一定距离的一对像素在既定方向上成对出现的频率,而RLM 反映具有某灰度值的像素于既定方向上连续出现的频数,能在一定程度上反映图像的对比度,表明纹理模式中的异质性。这4 类参数描述了图像灰度的对称性、纹理的均匀程度以及灰度分布的不确定性和随机性。而灰度均值和灰度分布的不均匀性特征又代表肿瘤的生物学侵袭性。高、低级别ccRCC 在T2WI图像影像组学特征上存在差异,其原因可能是与低级别ccRCC 相比,高级别ccRCC 病灶存在以下特点:①成分复杂,肿瘤内常并发坏死、出血;②肿瘤新生血管丰富、纡曲,分支更不规则,血供存在差别;③肿瘤细胞的密度较大,细胞外间隙相对小;④高级别ccRCC细胞核较大且中重度不规则。

本研究构建RF 机器学习模型,分析基于T2WI图像与高、低级别ccRCC 鉴别相关的5 个特征参数。RF 算法是一种集成机器学习方法,它利用随机自助法重采样技术和节点随机分裂技术构建多棵决策树,通过投票得到最终分类结果[13]。RF 算法泛化能力强,不容易过拟合,训练速度快,可并行计算,而且对样本缺失值不敏感。本文计算得RF 模型下训练集准确度、敏感度、特异度、ROI 的AUC 均为1;测试集准确度为85%、敏感度为100%、特异度为72%、AUC为0.87。本研究测试集的准确度为85%,表明测试集能较好地模拟训练集,训练集与验证集拟合度较好,本研究构建的RF 模型可重复性高。李小虎等[14]对34 例ccRCC 患者进行基于CT 图像的影像组学分析,构建RF 模型鉴别低级别和高级别ccRCC,证明影像组学结合RF 模型对ccRCC 术前病理分级预测有价值,AUC 为0.88,与本研究AUC 值相似,其敏感度为79%,较本研究中的敏感度(100%)低,可能是由于T2WI 组织分辨率更高,对分级的诊断价值可能高于CT。He 等[15]利用CT 纹理分析联合机器学习对227 例ccRCC 病例进行研究,证实在提取的556 个纹理特征中CIF-minMSEM 参数具有很好的诊断效能,其正确率为(94.06±1.14)%,较本研究中的正确率(85%)高,尽管该研究采用CT 图像,但其采用MaZda(version4.6)软件进行纹理提取和分析,该软件可能较本研究采用的A.K.软件性能更为成熟。此外,本研究样本量较少,导致准确性略低。

本研究的局限性为:①二维的ROI 可能会遗漏一些影像学特征,ROI 的选择为肿瘤的最大层面,影像学纹理分析仅反映该层面ROI 的异质性,不能完全反映该肿瘤组织整体的异质性;②本研究为回顾性分析,且各病理级别组样本相对较少;③尽管影像组学为肿瘤的术前病理分类提供了较好的应用结果,但其医学解释有待进一步研究。后期将收集更多样本,并在三维ROI 的基础上进行前瞻性研究。

总之,基于磁共振T2WI 纹理分析联合机器学习的影像组学对鉴别诊断高、低级别ccRCC 具有一定的价值。

猜你喜欢

特征参数组学纹理
影像组学在肾上腺肿瘤中的研究进展
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
蛋白质组学技术在胃癌研究中的应用
冕洞特征参数与地磁暴强度及发生时间统计
融合LPCC和MFCC的支持向量机OSAHS鼾声识别
基于BM3D的复杂纹理区域图像去噪
基于交通特征参数预测的高速公路新型车检器布设方案研究
使用纹理叠加添加艺术画特效
TEXTURE ON TEXTURE质地上的纹理