APP下载

基于CT影像组学鉴别骨肌系统良恶性病变的辅助诊断系统

2021-09-03周平程丰飞任波王健张冉柴象飞

中国医疗设备 2021年8期
关键词:组学恶性辅助

周平,程丰飞,任波,王健,张冉,柴象飞

1.山东省兰陵县人民医院 影像科,山东 临沂 277799;2.新疆医科大学第一附属医院 影像科,新疆 乌鲁木齐 830011;3.慧影医疗科技(北京)有限公司,北京 100192

引言

骨肌系统为机体内各器官及系统提供保护作用,组成部分包括骨髂、韧带、肌腱及肌肉[1]。根据流行病学的报告,在我国骨肌系统的病变呈多样化,组织成分复杂[2],其恶性肿瘤常常会发生远处转移,复杂的组织来源使骨肿瘤诊断依赖于穿刺活检[3],但实体肿瘤的穿刺结果具有一定的局限性,其诊断及治疗的研究进展相对缓慢。近年来,CT技术在诊断精度上已取得了长足的进步[4],并且CT动态增强扫描技术的临床影像学诊断中较为普及,在肌肉骨骼系统早期病变定性研究方面具有一定的优势[5]。若能在早期发病时及时针对不同病症进行相应的救治,可大大降低死亡率,因此有必要进一步研究骨肌系统疾病的早期诊断方法[6]。

目前,迅速发展的人工智能(artificial Intelligence,AI)为解决这一问题提供了新的思路和方法。影像组学(radiomics)可将图像转换为可进行分析计算的特征值,利用机器学习算法对数据进行分析以提供临床决策支持[7]。目前很多研究都将其应用于影像学的临床诊断中,尤其是在肺部、肝脏、脑部、血管、骨骼分析等领域智能算法已经非常成熟,能够辅助医师进行图像处理,提高了诊断的准确性[8]。在临床使用场景中,目前的解决方案都是将AI算法与云计算相结合,进行灵活的模块化部署[9]。由于云平台有存储空间大和计算能力强这两大优势[10],因此基于云技术将智能诊断系统与医院影像归档和通信系统(Picture Archiving and Communication Systems,PACS)进行高效对接,能够更好的实现骨肌系统数据集成管理、模型的存储、调用以及辅助诊断结果的提供,进而有效防范漏诊、误诊安全风险,提高整体医疗质量水平[11]。

1 资料与方法

本研究基于影像组学的分析方法,运用云技术搭建了一套针对骨肌系统良恶性病变诊断的智能系统,辅助研究者便捷地使用医学数据进行鉴别骨肌系统良恶性的相关研究,进而得到高精度、高稳定性的模型。

1.1 建立标准数据库

本研究收集了2010年7月至2019年12月期间在兰陵县人民医院影像科检查中发生骨肌系统病变的162例影像数据,其中男性93例,女性69例;年龄37~65岁,平均年龄51.9岁;其中48例行CT平扫,114例行CT平扫+增强扫描,病理类型如表1所示。本研究已征得医院医学伦理会批准。

表1 162例患者的骨肌系统病理类型统计[n(%)]

1.1.1 纳入和排除标准

纳入标准:① 具有骨肌系统病变的患者,并经常规CT检查;② 经手术病理明确诊断结果。排除标准:① 无完整的CT影像资料及病理诊断报告;② 无血液病等重大疾病。

1.1.2 检查方法

患者均采用飞利浦Brilliance iCT 256层螺旋极速CT机,各部位的扫描范围、条件按照该部位的标准扫描条件进行。扫描层厚及间距均为2 mm。增强扫描,对比剂采用碘佛醇(浓度:320 mgl/mL,江苏恒瑞),注射速率3.0~3.5 mL/s,在对比剂注射45~55 s后行增强扫描。薄层重建为层厚1.0 mm,层间距0.5 mm标准算法的容积包。

1.2 影像组学工作方法

影像组学工作流程主要包括:图像获取与分割、特征提取与筛选、模型建立与分析。其流程示意图如图1所示。

图1 影像组学工作流程

首先通过CT成像方法获取含解剖结构及功能代谢信息的162例标准化图像。由2名放射线科主治医师进行双盲阅片,使用3DSlicer基于阈值、区域生长以及主轮廓模型等方式选取病灶最大层面沿轮廓边缘进行手动分割病灶[12],并保存ROI。然后利用pyradiomics工具包(https://pyradiomics.readthedocs.io/)对ROI提取高通量特征1409个,其中包括一阶统计量特征、形态学特征、纹理特征和高阶滤波特征等,并对其进行数据标准化,以定量化表征病灶信息。经过对上述两位医师的标注结果进行ICC检验后筛选出P>0.85的特征1337个。再采用梯度降维实现特征选择,即通过统计学中独立t检验预筛选得到P<0.05的特征后,最后利用器学习LASSO正则化将得到的影像组学特征进行降维处理,最终筛选得到9个与骨肌系统两个性病变高度相关的特征,见图2。共有8个特征属于小波变换滤波处理后的高阶特征,其中2个一阶统计量特征,6个特征为纹理特征(其中3个为灰度级共生矩阵特征,3个为灰度级长度矩阵特征);1个特征为强度统计特征。

图2 降维后得到的9个放射组学特征及其在LASSO模型中的系数

得到降维的特征和特征值以后,利用SVM、KNN、LR等机器学习方法结合临床诊断结果和其他的临床信息建立三种分析模型,进行鉴别诊断。最后通过各种评价指标对模型测试集的结果进行评估,对比讨论后将最优结果作为后续搭建系统中所调用的模型。分类问题常见的评价指标主要有模型的准确率、敏感度(即召回率)、特异度、漏诊率、误诊率、F1分数(F1-score)和ROC曲线下面积(AUC)等。

1.3 云技术下的系统搭建

基于云计算的系统平台能够为骨肌系统影像的管理、存储和同享,以及嵌入通用的智能算法模型提供可能。本研究基于汇医慧影(北京)医疗科技有限公司已有的云技术分布式系统架构的设计基础,将训练结果最优的良恶性鉴别分析模型进行嵌入,进一步完成了系统的搭建。本系统自下而上分为数据资源、辅助诊断模型、应用服务和WEB前端,整个系统的整体架构设计如图3所示。从数据资源的基础层到中间的辅助诊断模型和应用服务,再到最上层WEB前端,连接方式都采用统一的接口调用,从而建立起一套标准的系统架构。

图3 系统整体架构设计图

首先,主要进行骨肌系统良恶性病变辅助诊断系统的核心设计,也就是前端浏览器和后端服务的搭建。上层的WEB前端部分设计了登录页面,检查列表页面,阅片页面并配有多种阅片工具按钮、标注列表模块和标注显示模块以及生成的阅片报告页面,运用最新的HTML5编码技术和JavaScript语言实现页面的搭建、显和交互操作,布局合理,功能齐全。与WEB前端通过接口直接进行链接的是系统的多样化应用服务,其采用B/S(浏览器/服务器)结构,对各种功能模块进行垂直划分,主要包括用户服务部分、图像处理单元和模型调用模块。其用户服务部分在用户登录系统后提供课题管理、成员管理以及数据库管理等功能。图像处理单元实现接收、解析、查询影像等操作。同时应用服务层还负责将训练好的模型进行调用,给出诊断结果。后端服务中的辅助诊断模型层是本系统十分关键的一个模块。它通过与最下端的数据资源对接,将接收到的影像进行统一处理,与医生对病灶的分割结果一并进行保存,然后运用影像组学方法的对其进行智能分析,训练出预测模型以供应用服务层进行调用。

本系统是在云计算的基本三层框架下,添加了辅助诊断层用于训练和保存智能诊断模型,并针对每层的功能和负责的业务逻辑进行了重新划分,利用云计算能够分布式部署的优势逐一完成模块化,利用数据接口对不同类型的消息调用我们已建立的良恶性鉴别算法模型,从而得出辅助诊断的结果返回给前端显示界面,建立一个完整的辅助诊断系统,实现高效、准确地帮助临床诊断和决策。

2 结果

2.1 影像组学模型分析结果

本研究中构建的三种机器学习模型中,SVM算法经过多次训练调整参数后得到了最优模型,将其进行保存。训练集和测试集中对良恶性的分类结果如表2~3所示。

表2 SVM、KNN、LR模型在训练集上的结果

表3 SVM、KNN、LR模型在测试集上的结果

在训练集和测试集上,三种算法构建的模型对良性和恶性的分类准确度分别为0.97、0.97(训练集)、0.93、0.92(测试集)、0.93、0.91(训练集)、0.83、0.77(测试集)和 0.85、0.88(训练集)、0.72、0.75(测试集)。从训练集的结果可以看出,SVM算法的建模效果良好,良性和恶性的F1-score分别为0.95和0.87,训练集的总体AUC为0.97,而且在测试集上同样是SVM模型表现最优,测试集的总体AUC为0.92(图4)。

图4 SVM模型分别在训练集和测试集上的ROC曲线

通过上述3个模型试验及相关分析可看出,在训练和测试样本保持一致相同的情况下,本研究比较SVM、KNN和LR共3种分类模型,试验结果表明SVM分类效果优于KNN和LR分类模型,针对影像组学分析模型在CT医学图像提取到的特征出现维度较高、数据冗余等问题,特征的筛选十分重要,改进模型的特征筛选结果可大幅提高模型的分类效果。尤其是本研究建立的基于影像组学的SVM分类模型拟合能力强,分类准确度高,模型总体的AUC值,灵敏度、特异性等评价指标优于其他2个模型,这证明了通过SVM分类模型判断分析不同骨肿瘤的为良性或者是恶性具有明显的优异性。

2.2 辅助诊断系统功能详解

搭建基于云技术的辅助诊断系统主要目的在于针对骨肌系统的良恶性病变进行辅助诊断,对其前、后端的设计进行智能化改进来满足医生的多元化需求。辅助诊断流程如图5所示,可以概括为以下几个方面:上传医学图像数据至云端、提取二维切面、用户交互式标注二维切面上的病灶区域、影像组学模型的训练、存储与调用及给出预测结果。

图5 系统的工作流程图

应用服务层与院内CT设备或PACS对接后获取图像信息,相当于本系统的服务资源中心,提供可将患者病历数据、医疗影像数据等信息解析入库后提供分布式的数据存储和数据处理服务,实现了数据的大规模聚集和长时间保存,可进一步提高数据的利用效率。应用服务层不仅集成了原有的多种数据治理功能,还支持接入上层Web前端和下层的影像组学辅助模型,从而共同构建了一个开放式、模块化、可扩展的智能辅助诊断系统。

在影像组学模块中主要包括影像组学数据预处理模型、降维后特征名称、影像组学模型的加载与应用等。利用本系统四层架构设计中的数据资源层实现院内数据的对接,系统后端嵌入训练好的模型,以META格式文件存储到系统的测试模块,通过加载己训练好的模型,选择应用到输入到网络的图像数据上即可进行预测。

Web前端以阅片页和诊断结果界面为主,其产生的服务请求消息通过接口到达服务应用层,经过处理后将相应的服务结果返回Web前端进行显示。同时,对于输入为DICOM格式的图像来说,Web前端也支持窗宽窗位的设定,以满足影像组学模型对图像的输入预处理要求。最终系统界面在右侧将显示该患者的预测良恶性分类的概率,见图6。将骨肌系统良恶性病变鉴别算法和医学影像云平台相结合,在满足医生阅片的基础上更进一步,使得医生可以更加便捷地查看骨肌系统病变良恶性的预测结果,发挥了在线计算的灵活性。

图6 辅助检测系统界面示意图

最后,本系统充分考虑了医学影像数据的安全性与隐私性,利用云计算高安全、高可用和高并发的优势,利用加密存储、数据脱敏和安全传输协议,从技术层面上实现了医疗影像数据的安全保障,使得医疗影像在移动化、数字化、智能化的三个维度的高度统一。

3 讨论

本研究致力于骨肌系统良恶性辅助诊断算法的原理和具体实现步骤、基于云计算的系统架构设计以及智能化辅助诊断算法与云计算系统的集成,为医生提供高效、可靠的诊断结果。

从本研究中建立的模型诊断精度而言,SVM的AUC、灵敏度最高,分别是93%、98%;在对良恶性两种类别的特异度上SVM和LR模型对良性的特异度高于恶性,而KNN模型则对恶性特异度更高,因此SVM在特异度、灵敏度、准确度方面均较高,适合用于大多数情况下骨肌系统良恶性病变的鉴别诊断,而KNN判别方法的诊断效能为79%~85%,诊断效果相对而言较差,但其对恶性肿瘤的高特异性也可用于相应的实际使用场景中进行鉴别诊断,如恶性病变较多的肿瘤医院。本研究建立的模型说明影像组学分析方法对骨肌系统病变,尤其是在骨肿瘤良恶性的临床诊断上具有一定的价值,结合患者特点的SVM模型提高了鉴别不同类型骨肿瘤良恶性的准确性。

同时,本系统不仅能够实现移动阅片,而且借助图像后处理技术和影像组学方法的结合,能对于可疑病变定量分析并且给出预测良恶性的结果。除了在骨肌系统病变研究领域中可以使用平台方便地得到结果外,对于已得到的高稳定性模型还可以提供进一步的临床实际应用的功能。国内外的研究表明,如果患者在骨肌系统发生恶性病变的早期能够尽早诊断,就能尽早地进行手术治疗,从而将患者的五年生存率提高至60%以上[13]。因此,对早期骨肌系统发生病变的患者进行良恶性的预测具有重要的意义。

本研究中构建的系统交互响应时间短,可以在较少的时间内获得骨肌系统良恶性诊断的结果,整个处理流程可以在几十秒内完成;并且易于学习,因为它们涉及简单的操作和简洁的图形界面,让没有编程能力的用户都可以轻松学习该系统的操作;通过简洁友好的网页界面实现交互式诊断;可以作单机运行,也可以异地运行,达到了安全性与可协作性的要求。本系统可以帮助医疗资源相对匮乏的基层医院或社区医疗机构在骨肌系统疾病诊断领域获得较高的诊疗水平。

影像组学通过高通量获取一阶、二阶、高阶纹理特征进行定量分析,能够运用数学方法分析图像,具有无创、准确、可重复等优点[14]。现有不少研究希望通过影像组学获取更多有价值的诊断信息。Larhmam等[15]则尝试利用SVM与递归特征消除相结合的方法同时进行特征选择与模型构建,动态观察改变特征选择数量对模型准确性的影响,发现选择少量恰当的特征构建模型即可实现相对高的转移与非转移椎体分类精度,同时该研究尝试通过网格搜索嵌套交叉验证设置SVM的方法解决骨肿瘤等小型数据库机器学习问题。

此外,影像组学还可对有相似影像学表现的不同骨肿瘤进行鉴别。Li[16]分析了154例颅底脊索瘤和56例软骨肉瘤患者的多参数磁共振图像(Multi-Parameter Magnetic Resonance Imaging,mpMRI),通过最大相关性最小冗余和递归特征消除算法从1941个特征中选取11个特征构建单序列及多序列SVM分类模型。在训练队列中,相比于单序列模型多序列模型分类性能显着改善(P<0.05),其在训练和验证队列中AUC分别达到了0.97和0.87。另一项基于多参数磁共振特征构建影像组学模型以鉴别骨盆骨肉瘤与尤文氏肉瘤的研究也取得了不错的结果[17],表明影像组学在骨肿瘤鉴别诊断中有较大价值。还有研究对鉴别3种不同骨肿瘤进行了尝试。Yin等[18]回顾性分析了54例脊索瘤、30例骨巨细胞瘤和36例骨转移瘤患者的mpMRI,通过LASSO回归算法筛选特征后构建RF分类模型,联合T2加权脂肪抑制序列和增强T1加权序列特征构建的三分类模型AUC可达0.773,准确度为0.711。还有研究基于CT及增强CT图像,比较3种不同特征选择算法和3种不同机器学习算法构建的脊索瘤与骨巨细胞瘤分类模型发现,可以通过选择恰当的特征选择方法和分类方法提高影像组学分类诊断效能[19]。

本实验还存在一些局限,如实验的病例为单中心样本,病例相对较少,得到的结果难免有一定的偏倚;另外,本文采用的是横断位病变最大层面图像研究,对层面的选择难免有主观偏倚,故仍需要对本实验进行优化改进。在本系统的下一步使用中,将会更加便捷地收集到更多患者数据,可进一步对模型进行迭代更新。

目前越来越多医院的影像科已经部署了基于传统的本地计算机辅助设计(Computer Aided Design,CAD)系统进行辅助诊断[20],但是在我国存在着数量庞大的基层医院和医疗机构因资金、资源、医疗水平等各种客观的限制而没有购买和安装独立的影像CAD系统,并且这些医院和机构往往缺乏高水平的影像科技术专家来日常维护系统[21]。针对这一普遍情况,本文通过研究骨肌系统良恶性病变诊断的影像组学方法并实现算法模型的云端化,有效辅助基层医院、机构和影像科医生的诊断决策。

猜你喜欢

组学恶性辅助
小议灵活构造辅助函数
倒开水辅助装置
恶性胸膜间皮瘤、肺鳞癌重复癌一例
卵巢恶性Brenner瘤CT表现3例
口腔代谢组学研究
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
减压辅助法制备PPDO
提高车辆响应的转向辅助控制系统
24例恶性间皮瘤临床分析
代谢组学在多囊卵巢综合征中的应用