APP下载

基于MRI的肾囊性病变2005版BosniakⅡ~Ⅲ类阅片者间一致性分析

2021-08-14孙松梅张晓晶于梅艳王美凤叶慧义王海屹

解放军医学院学报 2021年5期
关键词:阅片年资囊肿

孙松梅,白 旭,李 林,张 晶,张晓晶,许 伟,于梅艳,王美凤,叶慧义,王海屹

1 解放军医学院,北京 100853;2 解放军总医院第二医学中心 放射诊断科,北京 100853;3 解放军总医院第五医学中心 放射诊断科,北京 100039;4 解放军总医院 医学创新研究部 医院管理研究所,北京 100853;5 解放军总医院第一医学中心 放射诊断科,北京 100853;6 首都医科大学附属北京中医医院,北京 100010

肾囊性病变(cystic renal mass,CRM) 包括良性病变与恶性病变,对CRM 的良恶性进行鉴别是临床决策的关键。现行的2005 版Bosniak 分类系统依据CRM 囊肿的大小、囊壁及分隔厚度、分隔数目、分隔钙化及是否存在强化等情况,将CRM 分为Ⅰ、Ⅱ、ⅡF、Ⅲ、Ⅳ五个类别,为CRM的良恶性鉴别提供了影像学依据[1]。该系统最初是基于CRM 的对比增强CT 图像建立的,因此国内外对Bosniak 分类阅片者一致性的研究多采用CT 阅片结果[2-4]。文献检索显示,Bosniak 分类的阅片者间变异度大(6%~75%),尤其是在Ⅱ~Ⅲ分类中[5-6]。这是因为Ⅰ类和Ⅳ类CRM 影像特征较为典型,易于鉴别;而Ⅱ~Ⅲ类的CRM 囊肿形态多样、影像特征复杂而不易鉴别。Bosniak 各类囊性病变恶性概率变异度也较大,如Bosniak Ⅱ、ⅡF、和Ⅲ的恶性比例分别为9% (95%CI:5%~14%)、18% (95%CI:12%~26%)、51% (95%CI:42%~61%)[5]。尤其是Bosniak Ⅲ类的CRM 中,良性患病率很高(约49%)[7]。这意味着行手术的病例中有接近一半的CRM 是良性的。近年来,由于MRI 检查可提供更为详细的囊性病变的影像信息,其临床应用日益广泛。研究表明MRI 可以提供有关CRM 囊肿壁或分隔的更多影像特征[8-11]。本研究将基于MRI 图像,依据2005 版Bosniak 分类系统评估Ⅱ~Ⅲ类病例阅片者间一致性,以期为更好开展CRM 临床决策提供依据。

资料与方法

1资料 收集解放军总医院第一医学中心图像存档和通信系统(picture archiving and communication system,PACS)中2009 年1 月-2018 年12 月完成常规肾MRI 平扫及增强检查的全部患者资料,由一名高年资腹部影像专家(具有30 年工作经验)参考CRM 2005 版Bosniak 分类标准筛选入组(表1)。纳入标准:1) 符合2005 版Bosniak Ⅱ、ⅡF 和Ⅲ类的CRM(强化实性成分少于病变25% 的肾病变);2) 术后病理证实为CRM;3) 在术前6 个月完成常规肾MRI 平扫及增强检查。排除标准:1)MRI 图像质量不佳或信息不完整;2)CRM 最终确诊为感染、炎症或血管疾病、外伤后病变或实性肿瘤伴显著坏死;3)多囊肾疾病(以双肾出现无数液性囊泡为主要特征);4)肾细胞癌相关综合征囊性病变,如Von-Hipple-Lindau 综合征等。最终有123 例患者的123 个CRM 纳入研究。本研究经过解放军总医院第一医学中心医学伦理委员会批准(批准文号:S2020-070-01),免除受试者知情同意。

表1 肾囊性病变2005 版Bosniak 分类系统[7]Tab.1 Details of 2005 Bosniak classification of cystic renal masses

2图像采集 磁共振图像通过不同的MR 扫描仪采集,场强分别为3.0 T 和1.5 T。扫描序列包括横轴位脂肪抑制T2 加权(axial fat-suppressed T2-weighted)、冠状位脂肪抑制T2 加权(coronal Fat suppressed T2-weighted)、横轴位T1 加权(axial T1 weighted)、横轴位多时相对比增强T1 加权(axial multiphase contrast material-enhanced T1-weighted)以及冠状位对比增强T1 加权(coronal contrastenhanced T1-weighted)。

3阅片 首先由一名高年资腹部影像专家R1 对MRI 图像进行判读,选取所有Ⅱ~Ⅲ类病例作为一致性分析对象,并对图像进行随机编号。另外3 名影像医师R2~R4(分别具有21 年、20 年和18 年工作经验),基于MRI 图像,依据2005 版Bosniak 分类系统,在1 周之内独立判读所有图像并记录分类结果。高年资专家(R1)和3 名影像医师(R2~ R4)的判读均在盲态下进行,即除影像信息外,不知晓病理诊断及患者其他临床信息。这在客观上必然会出现高年资专家阅片结果与病理不相符的情况,对此并未根据病理结果请专家R1 重新判读,而是维持该专家盲态下的阅片结果。

4样本量计算 一致性分析需要满足的样本量根据Bujang 和Baharum[12]的建议计算,假设最初阅片者没有一致意见(K1=0),本研究所期望的Cohen’s Kappa 系数的最小值为0.5(K2=0.5),把握度(power) 和Ⅰ类错误分别确定为80.0% 和0.05,则需要至少20 例病例。本研究的总体样本量满足此要求,不同病理类型中,只对满足样本量要求者进行分析。

5统计学分析 所有统计分析均运用Stata/MP 16.0 (StataCorp LLC)软件完成。对病例的病理类型、大小、部位等基本情况进行描述分析。阅片者间一致性以多评估者Cohen/Conger's Kappa 系数衡量[13],采用Kappaetc 命令并附以有序加权选项Wgt(ordinal)计算加权系数kw;利用Parr 和Tolley推荐的Jackknife 方法计算kw的95%CI[14-15]。分别计算全部病例和Bosniak 各分类病例、各病理类型病例的kw系数。该系数的判断标准:0.2 及以下,较低的一致性;0.21~0.40,一致性一般;0.41~0.60,中等程度一致;0.61~0.80,高度一致;0.81~1.00,几乎完全一致[16]。

结果

1CRM 病例特征 纳入的123 例病例中,男性84 例,女性39 例,年龄16~71(49.1 ± 11.1)岁;左肾病变70 例(56.9%),右肾病变53 例(43.1%)。病变直径8.8~97.0(49.05 ± 11.10) mm。单纯囊肿61 例,占49.6%,良性肿瘤15 例,占12.2%,包括囊性肾瘤(cystic nephroma,CN) 7 例、混合性上皮和间质肿瘤(mixed epithelial and stromal tumors,MEST) 8 例;恶性肿瘤47 例,占38.2%,包括低恶性潜能多房囊性肾肿瘤(multilocular cystic renal neoplasm of low malignant potential,MCRNLMP)10 例、透明细胞肾细胞癌(clear cell renal cell carcinoma,ccRCC) 37 例。各病理类型病例主要临床特征见表2。

表2 Ⅱ~ Ⅲ类肾囊性病变的临床特点Tab.2 Clinical Characteristics of classification Ⅱ to Ⅲcystic renal masses

22005 版Bosniak Ⅱ~Ⅲ类病例典型MRI 图像 2005 版Bosniak 分类系统依据CRM 囊肿的大小、囊壁及分隔厚度、分隔数目、分隔钙化及是否存在强化等情况,将CRM 分为五个类别,其中Ⅱ~ Ⅲ类病变的形态多样,特征复杂且不易鉴别,典型病例MRI 图像见图1~图3。

图1 男性,48 岁,右侧肾脏囊性病变,单纯性囊肿 A:T2WI 上病变内可见个一分隔(箭头);B:T1WI 上病变呈现均匀的低信号;C:在增强T1WI 的实质期图像上囊壁光滑,宽1 mm,分隔没有强化,根据2005 版Bosniak 分类,病变被归为Ⅱ类Fig.1 MRI images of a 48-year-old man with right-sided cystic renal mass,a simple cyst A:The lesion shows one septa(arrowhead) on T2-weighted imaging;B:Homogeneous hypointensity shows on T1-weighted imaging;C:The lesion has 1-mm-wide smooth wall with no enhancement of septa on axial nephrographic phase contrast-enhanced T1-weighted imaging;and it is classified as class Ⅱ according to Bosniak classification,version 2005

图2 男性,71 岁,右侧肾囊性病变,单纯性囊肿 A:T2WI 上病变可见多(≥ 4)个分隔;B:T1WI 上病变呈现为不均匀低信号;C:在增强T1WI 实质期图像上轻度增厚的分隔强化(箭头)。由于可以感知的多个分隔强化,根据2005 版Bosniak 分类,病变被归为ⅡF 类Fig.2 MRI images of a 71-year-old man with right-sided cystic renal mass,a simple cyst A:The lesion shows multiple (four or more) septa on T2-weighted imaging;B:Heterogeneous hypointensity shows on T1-weighted MRI scan;C:The lesion has enhancement of mildly thickened septa (arrowhead) on axial nephrographic-phase contrast-enhanced T1-weighted imaging;and it is classified as class ⅡF for more septa with perceived enhancement according to Bosniak classification,version 2005

图3 男性,38 岁,左侧肾囊性病变,肾透明细胞癌 A:T2WI 上病变可见少量分隔;B:在T1WI 上病变呈现不均匀低信号;C:在增强T1WI 实质期图像上病变内不规则增厚的分隔强化(箭头);由于存在多个不规则增厚的分隔伴可测量的强化,根据2005 版Bosniak 分类,病变被归为Ⅲ类Fig.3 MRI images of a 38-year-old man with left-sided cystic renal mass,clear renal cell carcinoma A:The lesion shows a few septa on T2-weighted imaging;B:Heterogeneous hypointensity shows on T1-weighted imaging; C:The lesion has irregular enhancement of septa (arrowhead) on axial nephrographicphase contrast-enhanced T1-weighted imaging;and it is classified as class Ⅲ for the irregular enhancing septa with measurable enhancement according to Bosniak classification,version 2005

3阅片结果 高年资专家R1 判断为Bosniak Ⅱ、ⅡF、Ⅲ类的例数分别为24 例(19.5%)、49 例(39.8%)、50 例(40.7%)。在61 例单纯囊肿病例中,高年资专家R1 判读为Ⅱ、ⅡF、Ⅲ类的例数分别为20 例、30 例、11 例;良性肿瘤15 例中,R1 判读为Ⅱ、ⅡF、Ⅲ类的例数分别为0 例、8 例、7 例;恶性肿瘤47 例中,R1 判读为Ⅱ、ⅡF、Ⅲ类的例数分别为4 例、11 例、32 例,恶性率分别为16.7%、22.4%、64.0%。不同病理类型CRM 阅片者R1~ R4 分类情况见表3。

表3 不同病理类型CRM 阅片者R1~ R4 的Bosniak 分类情况Tab.3 Bosniak ratings of MRI of CRMs across pathological types by 4 radiologists

4阅片结果一致性分析 R2~R4 阅片者与R1 阅片者的一致性结果见表4。阅片者R3 判读为ⅡF 类的病例数(41 例)与阅片者R1 判读为ⅡF 类的病例数(49 例)一致性最高,达83.7%,其次为阅片者R4 判读为Ⅲ类的病例数(31 例) 与阅片者R1 判读为Ⅲ类的病例数(50 例),一致性达62.0%。除此之外,其他判读结果与阅片者R1 判读一致的比例均未超过50%。由表5 可见,对于全部病例3 名阅片者(R2~ R4)的一致性kw系数是0.43,95%CI为0.33~ 0.52,显示为中等程度一致。其中,Ⅱ类病例3 名阅片者的kw系数为0.05,显示一致性较低;ⅡF 类和Ⅲ类病例的kw系数分别为0.34、0.29,显示一致性一般。按不同病理类型分单纯囊肿、良性肿瘤、恶性肿瘤的kw系数分别为0.33、0.16、0.31,一致性一般或较低。而良性肿瘤病例的kw系数95%CI较单纯囊肿、恶性肿瘤和全部病例更大,考虑是由于良性肿瘤的病例数较少而使标准误较大所导致。不同病理类型的Bosniak 各类别病例中,一致性系数最高的是被归为ⅡF 类的单纯囊肿,kw为0.31;其次是被归为Ⅲ类的恶性肿瘤,kw为0.26,均显示一致性一般;最小的是被归为Ⅱ类的单纯囊肿,kw为0.14,显示一致性较低。而由于归为Ⅲ类的单纯囊肿、全部良性肿瘤和归为Ⅱ、ⅡF 类的恶性肿瘤病例数小于一致性分析所要求的最低样本量20 例,故未计算其kw系数。

表4 阅片者R2~ R4 对Bosniak Ⅱ~Ⅲ类CRM 图像分类结果Tab.4 Ratings of MRI images of Bosniak Ⅱ-Ⅲ CRM by rater R2 -R4

表5 3 名阅片者依据2005 版Bosniak 分类标准判读CRM 阅片结果一致性Tab.5 Agreement of three radiologists on category Ⅱ-Ⅲ MRI of CRM according to Bosniak classification system (2005)

讨论

依据2005 版Bosniak 分类系统,基于CT 图像的Ⅱ、ⅡF 和Ⅲ类病例的阅片者间一致性低、变异度大,致使恶性检出率差异大,不能很好地辅助临床决策。与CT 相比,MRI 具有更高的组织分辨率,可以更好地显示在CT 图像上不明显的分隔和不清晰的强化[17-19]。本研究依据一名高年资腹部影像专家参考2005 版Bosniak 分类系统的阅片结果,筛选出CRM 分类为Ⅱ~Ⅲ 类的MRI 图像123 例,研究3 名影像医师阅片的一致性。结果显示,3 名阅片者对Bosniak Ⅱ~ Ⅲ类CRM 的MRI图像判读结果的一致性总体不高。对于全部病例,3 名阅片者的一致性中等;单纯囊肿、良性肿瘤、恶性肿瘤的阅片结果均显示一致性一般或较低,而Ⅱ类病例的kw系数仅为0.05,远低于ⅡF 类和Ⅲ类病例。该结果印证了Ⅱ~Ⅲ类CRM的阅片者间一致性总体不高,与国内外文献报道相符[6,20]。吴斌等[21]利用42 个肾囊性病灶的CT、MRI 资料(其中CT 检查29 例,MRI 检查18 例,CT 及MRI 均检查6 例)研究发现,高低年资医生之间Ⅱ、ⅡF 和Ⅲ类的一致性系数K 分别为0.222、0.545 和0.545,低于两组医生在Ⅰ类(K=0.843)、Ⅳ类(K=0.715) 和全部病例的一致性(K=0.626)。结果还表明,单纯囊肿的一致性系数高于良性肿瘤和恶性肿瘤。这或许是由于单纯囊肿影像特征较为典型而更容易使不同阅片者达成一致。阅片者R2~R4 阅片经验(分别具有21 年、20 年及18 年经验) 相近,根据表3 的结果,这3 名阅片者的一致性与经验没有明显关联,且因没有低年资阅片者作对比,故本研究尚无法得出经验与一致性关系的确定结论。对此问题有赖于增加低年资阅片者的数据进行分析。

2005 版Bosniak 分类系统关于Ⅱ、ⅡF 和Ⅲ类CRM 的分类标准对囊肿壁及分隔厚度、分隔数目、钙化的形态等影像特征没有给出明确定义,不够细致与量化,使阅片结果更多依赖阅片者的经验[6,11,20]。这是导致阅片者一致性不高的主要原因之一。其次2005 版Bonsiak 分类标准是基于对比增强CT 图像建立的,是否完全适用于MRI 尚有待商榷。再者,研究者数量、研究样本量会导致不同研究之间一致性的差异,既往文献多研究两名阅片者的一致性,而本研究采用3 名阅片者,一致性程度必然会随人数增加而降低。本研究样本量大于目前多数国内研究,这或许也是一致性不高的原因。同时,由于一致性系数本身的计算方法、加权方法有多种,不同研究采用的计算方法不同。Lucocq 等[22]的研究利用复杂肾囊肿(≥ ⅡF 级) 的CT 和MRI 图像,比较患者做检查时医生报告的分类结果与泌尿科专家多学科会诊报告结果的一致性,而一致性系数采用线性和二次方加权的Kappa 统计量。因此,在比较不同文献一致性系数的大小时,应充分考虑这些因素。本研究显示,Ⅱ类病变的恶性率为16.7%,ⅡF 类病变的恶性率为22.4%,Ⅲ类病变的恶性率为64.0%,与Schoots 等[5]的系统综述得到的结果相比,ⅡF 类恶性率位于其95%CI(ⅡF 类95%CI:12%~26%) 内,Ⅱ类和Ⅲ类恶性率高于95%CI(Ⅱ类和Ⅲ类95%CI:5%~14%、42%~61%)上限。

以上问题反映了2005 版Bosniak 分类标准存在的不足,本研究也验证了2005 版Bosniak 分类标准基于MRI 图像的一致性并不理想。2019 版Bosniak 分类系统[23]是继2005 版的修订与更新,尚处在评估阶段。新版分类系统正式纳入MRI 影像特征,提出MRI 分类标准,并进一步完善了诸如囊壁厚度、囊壁是否光滑、分隔数量、分隔厚度、形态及是否强化等内容,通过弥补这些不足,期望提高阅片者间分类的一致性,然而修订后的2019 版Bosniak 分类系统是否能够达到修订目的尚需要临床和科学研究的进一步评估。

本研究局限性在于,作为回顾性研究,研究所使用的MR 扫描仪参数不一,可能会对阅片结果造成影响,因此本研究结果尚需前瞻性研究的验证。综上,本研究基于MRI 图像,依据2005 版Bosniak 分类系统对Ⅱ~ Ⅲ类病例的图像进行判读,不同阅片者显示中等程度的一致性。从不同类别看,Ⅱ类病例显示一致性较低;ⅡF 和Ⅲ类病例显示一致性一般;按病理类型看,单纯囊肿、良性肿瘤、恶性肿瘤的一致性一般或较低;而对于各类病例,单纯囊肿的阅片者间一致性高于良性肿瘤和恶性肿瘤。

作者贡献声明:直接参与酝酿和设计实验:孙松梅,叶慧义,王海屹;实施研究:孙松梅,白旭,李林,张晶,张晓晶,于梅艳,王美凤,王海屹;采集数据:孙松梅,白旭,张晶,张晓晶,于梅艳,王美凤;分析/解释数据:孙松梅,白旭,李林,许伟,叶慧义,王海屹;起草文章:孙松梅;对文章的知识性内容作批评性审阅:叶慧义,王海屹;统计分析:孙松梅,李林;获取研究经费/行政、技术或材料支持:王海屹;指导/支持性贡献:许伟,叶慧义,王海屹。

利益冲突:无。

猜你喜欢

阅片年资囊肿
《住院医师规范化培训教学阅片指南(2022年版)》解读
阅片列表在耳科住院医师颞骨CT影像阅片教学的应用与实践
计算机辅助检测系统(CAD)在16层CT低剂量肺癌筛查肺结节检出中的应用价值
2019年资管行业十大猜想
哪些表现提示我们得了巧克力囊肿
会厌囊肿术后并发会厌部分缺损1 例
SP-1000i全自动推片染色仪及CellaVision DM96自动阅片仪在形态学检验人员镜下比对中的应用
PDCA循环管理法在急诊科低年资护士培训中的应用
横卧哑铃形Rathke囊肿1例
骨内腱鞘囊肿的MRI诊断