APP下载

基于ROC理论评价单色显示器对肺结节检出效能的影响

2010-09-07尹建东廖伟郭启勇卢再鸣马跃

中国医科大学学报 2010年1期
关键词:单色放射学读图

尹建东,廖伟,郭启勇,卢再鸣,马跃

(中国医科大学 附属盛京医院影像科,沈阳 110004)

软阅读模式下显示器的选择对放射诊断准确率的影响已成为影像诊断质量控制和质量保证研究的一个重要课题[1]。单色液晶显示器亮度比较高、空间分辨率比较大、有较低的眩光和较好的同向调制传递函数[2],这些都会对影像识读的结果产生重要影响,所以近来备受推崇。但该种显示器由于分辨率不同造成价格差异很大,另外显示器对临床疾病检测效能的高低除了受其本身物理参数的影响外,还受到观测者自身肉眼视觉系统的生理限制,所以高、中、低分辨率的显示器在疾病检出效能方面是否具有显著性差异还存在疑问,本研究通过使用同一品牌而不同分辨率的单色液晶显示器对肺结节检出效能进行比较研究,旨在为医院影像科诊断显示器的合理配置及制定符合我国国情的相关行业标准提供参考依据。

1 材料与方法

1.1 材料

1.1.1 试验器材和仪器:影像诊断工作站3台,对应3台医用单色液晶显示器 (liquid crystal display,LCD)的性能指标,显示器类型分别为Barco Z-2261、Barco Z-3620、Barco Z-5620;空间分辨率分别为1 600×1 200、2 048×1 536、2 560×2 048;像素度分别为 0.270 mm、0.207 mm、0.165 mm;激活屏幕对角线分别为540 mm、528 mm、540.9 mm;校准亮度分别为 500 cd/m2、500 cd/m2、500 cd/m2。为了实现图像显示一致性的要求,3种显示器都进行了基于Barten模型的DICOM校正,且均使用同样的图像阅读软件(东软Neusoft研发),该软件将图像密度采样率的210位灰阶降低为28位进行显示,同时由于胸部影像图空间采样率基本为7 MP左右,大于显示器的显示矩阵,该软件还会对图像横向和纵向的数据进行双线性插值进行压缩显示。所有显示器均调至最适宜读图亮度—500 cd/m2,且距离地板的高度相仿。直接数字化X线摄影(direct digital radiognaphy,DR)系统为Kodak公司的DR 7500,投照条件为115 kV、2.0~2.5 mAs,物片距为180 cm,探测器的像素点距为 143 μm;CT为 Philips公司的 Brilliance 64层CT,扫描参数为 120 kV、150~180 mA,螺距为 1.1,层厚和间隔均为3 mm;室内正常的荧光灯照明。

1.1.2 病例资料的选择:从本院图像存储与传输系统 (picture archiving and communication system,PACS)中在线搜寻2007年10月至2008年4月有胸部后前位DR和CT的影像资料(两者检查时间差不超过7 d),满足如下条件:(1)CT证实有结节的DR图像;(2)DR疑似有结节但CT证实无结节或证实为淡片状炎症的DR图像;(3)胸部DR和CT均无结节表现的DR图像。将前者划为阳性组,后两者划为阴性组,疑似病例主要目的是起干扰作用。结果在6万多幅胸部DR图像中寻到符合条件的93例,其中阳性组38例,疑似结节病例32例,正常病例23例。阳性组按结节直径大小分为0.3~7.1 mm组(A组,19例)和7.5~1.9 mm组(B组,19例)2组,其中A组男8例,女11例,年龄4.0~76.0岁,平均年龄46.7岁,结节平均直径5.5 mm;B组男10例,女9例,年龄20.0~72.0岁,平均年龄51.1岁,结节平均直径10.7 mm。

1.2 操作方法

请放射科3名高年资医师(主任或副主任医师,工作年限>10年)参与读图,所有医师的矫正视力均为1.0以上,以上3名医师均未参与前期病例资料的选取,且是同年资医师中日常工作状态比较稳定的。3名医师分别在3种不同分辨率的显示器上集中进行3次独立读图,每次读图期间医师顺序、显示器类型顺序、病例样本顺序均为随机排序,且每2次读图的时间间隔在1周以上,主要目的是消除同一医师2次读图期间学习的相互影响[2]。医师读图不限时,不限制使用图像后处理工具,尽量与平时实际工作条件相同,本研究不考虑限制使用图像后处理工具的情况。

对肺部结节有无的评判采用5等分法[3~5],具体是:肯定有,肺野中可见直径<3 cm、类圆形、密度比周围组织高的病灶,评分5分;可能有,肋骨及肺纹理重叠中高度疑似有肺内结节,评分4分;不确定,密度差别小、重叠因素多,无法判断结节影存在与否,评分3;可能无,肋骨及肺纹理重叠中局部密度略增高,但结节的可能性比较小,评分2;肯定无,确定肺内无结节,评分1。每名医师给出每幅图像在特定显示器上表现出的相应等级的分数,并记录所见病灶的位置。

1.3 统计学分析

仔细记录每位医师的诊断结果,并与CT证实的结节位置进行比对,若医师未正确描述结节位置,统计时按“可能无”处理[3]。统计分析前对采集到的数据做如下预处理:分别计算2 MP、3 MP、5 MP显示器上各医师的平均分,采用平均评分进行统计分析。

采用SPSS13.0绘制受试者操作特性(receiver operating characteristic,ROC)曲线,计算曲线下的面积(area under curve,AUC),不同诊断效能的比较用Z检验(均为双侧检验),P<0.05表示差异有统计学意义。

2 结果

在不同分辨率的显示器上识读两组肺结节的结果见表1所示。

识读A组或B组肺部结节时,随着显示器分辨率的提高,代表医师诊断效能的参数AUC有所增加,在5 MP影像诊断显示器上AUC最大,但Z检验表明,各显示器之间诊断效能比较差异无统计学意义(识读A组结节时,2 MP和3 MP显示器之间诊断效能比较的Z值为0.370,3 MP和5 MP之间为0.526,2 MP和5 MP之间为0.884;在识读B组结节时,2 MP和3 MP之间的Z值为0.240,3 MP和5 MP之间为0.203,2 MP和5 MP之间为0.448,P均>0.05);在各同分辨率的显示器上识读B组结节的AUC比A组要高,但Z检验表明诊断效能两两比较,差异也无统计学意义(在2 MP显示器上A组和B组之间诊断效能比较的Z值为1.617,3MP显示器为 1.562,5 MP 显示器为 1.363,P 均>0.05)。以上结果表明:在不同分辨率的医用单色液晶显示器上检测两组不同物理尺寸的结节时,诊断效能比较差异无统计学意义。

表1 在不同分辨率的显示器上识读两组肺结节的AUCTab.1 The AUC for the nodular detection of A and B groups on the displays with different resolutions

3 讨论

ROC来源于信号检测理论[6],是一种广泛应用的数理统计方法,该理论早期用于比较不同雷达之间的差异,Lee Lusted于1960年首先将该理论应用于医学诊断,由于ROC曲线法不固定分类界值,同时允许中间状态存在,更符合实际情况,所以现已成为影像检查技术和影像诊断方法效能评价的客观标准。AUC表明了该诊断实验准确度的大小,其值越大说明该诊断试验的准确度越高。采用ROC曲线法可对一个放射诊断系统的效能作出评价,也可对两个或两个以上的诊断系统的效能作出比较,在目前放射学领域新技术和新方法不断出现的情况下显得尤其重要。

挑选合适空间分辨率的显示器时应充分考虑图像本身的采样分辨率,无论在低分辨率的显示器上显示高分辨率的图像;还是在高分辨率的显示器上全屏幕显示低分辨率的图像,都会通过软件处理来对画面的数据进行改动[7]。由于胸部DR影像的分辨率比较大,一般都大于5 MP,所以应尽量挑选分辨率比较高的显示器,以便最大程度显示影像本身的原有数据,使得显示效果接近实际效果。美国计算机在放射学中的应用学会(the Society for Computer Application in Radiology)建议,以基本诊断为目的的影像工作站,其监视器应为肖像型,分辨率不得少于2 K×2 K。我国PACS起步较晚,诊断的准确性与否一直未引起放射学界的足够重视,处于经济上的考虑,不少医院盲目采用空间分辨率1 024×1 280或1 024×768的显示器,殊不知这要冒降低诊断精度的风险。

本试验研究结果表明随着医用单色液晶显示器分辨率的增加,识读不同尺寸的肺结节时AUC有不同程度的增加,尤其对于直径为0.3~7.1 mm的结节变化更大,这说明随着显示器分辨率的增加,放射诊断医师降低了假阴性和假阳性病例的数目,提高了病灶检出的效能,同时也说明显示器分辨率的变化对小尺寸结节检出效能的影响则更大,但不同分辨率显示器之间比较差异却无统计学意义。实验没有限制使用影像后处理工具,数字图像操作与调整是进行数字图像阅读的一个非常自然的行为,只有这样才能将数字图像显示的潜能完全挖掘出来,这可能是造成各个显示器在观测肺结节时没有显著性差异的重要原因,因为前台后处理工具,尤其是放大工具,可以弥补显示器分辨率太低的缺陷,国外也有对于精细诊断(如泌尿系小结石的检测等)用1K和2K显示器的检出效能比较差异无统计学意义,其在研究中也强调了使用后处理工具,尤其是放大工具[8]。

本研究结果和国内吴杰[8]、王先运等[9]及国外Usami等[10]的研究结果相同,与程勇[3]的研究成果不完全一致。国内外关于不同分辨率的显示器对放射诊断准确度影响的研究基本为彩色和单色显示器之间的比较、LCD和CRT显示器之间的比较、不同品牌的医用显示器之间的比较,笔者认为该试验结论除了受显示器分辨率的影响外还受到其他物理参数的影响,比如亮度、调制传递函数、眩光等,即试验结论不足以说明完全是由显示器分辨率的不同引起的。而本研究使用了同一品牌的医用单色液晶显示器,该显示器物理尺寸的近似性、显示亮度一致性和调制传递函数的同向性等,是优于其他类似实验的一个最显著的地方,表明本研究对显示器其他各个影响因素的控制更为严格,即该放射系统的诊断效能主要受显示器分辨率的影响和结节直径大小的影响,而其他额外因素影响较小。

本实验仅对不同分辨率的单色液晶显示器对胸部DR影像图上结节识别的影响进行了初步的研究,结果表明在不限制图像后处理工具的情况下,使用不同分辨率的医用单色液晶显示器识读不同尺寸肺结节时诊断效能相当。今后应在此基础上加大研究的宽度与深度,以便更好指导医院显示器的合理规划,在保证对不同疾病的影像诊断高准确率的前提下,购买那些性能更加可靠稳定但价格相对便宜的显示器,满足“高效率,低成本”的医学影像工作站的购置原则。

[1]陶勇浩,缪竞陶.医学影像学信息系统工作站配置方案的探讨[J].中华放射学杂志,2002,36(6):489-492.

[2]Krupinski EA,Johnson J,Roehrig H,et al.Use of a human visual system model to predict observer performance with CRT vs LCD display of images[J].J Digit Imaging,2004,17(4):258-263.

[3]程勇,陈卫国,张雪林,等.影像诊断工作站显示器的选择对孤立性肺结节识读影响的研究[J].中国医学影像技术,2007,23(2):284-287.

[4]Kim SY,Hwang YJ,Han YH,et al.An ROC study of chest radiographs:2K versus 4K high-resolution soft-copy images[J].J Digit Imaging,2007,20(4):347-351.

[5]杨钧,陈峰,郑凯尔.ROC方法及其在放射学中的应用[J].中国医学影像技术,2000,16(5):407-409.

[6]孙振球.医学统计学[M].2版,北京:人民卫生出版社,2006:650-670.

[7]冈萨雷斯.数字图像处理 [M].2版,北京:电子工业出版社,2003:50-51.

[8]吴杰,王学建,王波,等.不同显示矩阵影像诊断工作站识读肺部小结节的初步研究[J].中华放射学杂志,2004,38(3):295-300.

[9]王先运,刘慧琴,孙勇,等.显示器性能对影像识读影响的实验研究[J].中华放射学杂志,2005,39(11):1213-1216.

[10]Usami H,Ikeda M,Ishigaki T,et al.The influence of liquid crystal display(LCD)monitors on observer performance for the detection of nodular lesions on chest radiographs[J].Eur Radiol,2006,16(3):726-732.

猜你喜欢

单色放射学读图
《放射学实践》入选中国科学引文数据库(CSCD)核心库
《国际医学放射学杂志》2021年总目次
《放射学实践》入选中国科学引文数据库(CSCD)核心库
《放射学实践》入选中国科学引文数据库(CSCD)核心库
单色不单调·灯具篇
读图
彩妆去寻找春天
读图
读图
读图