APP下载

汉佩尔辨识法在酶联免疫吸附试验室内质控中的应用

2015-03-15周月兰苏武锦广西壮族自治区南宁市中心血站530003

检验医学与临床 2015年11期
关键词:箱式正态离群

周月兰,苏武锦(广西壮族自治区南宁市中心血站 530003)



汉佩尔辨识法在酶联免疫吸附试验室内质控中的应用

周月兰,苏武锦(广西壮族自治区南宁市中心血站 530003)

目的 探讨汉佩尔辨识法(Hampel identifier)在室内质控图中的应用,评估其对质控离群值的检出能力。方法 使用弱阳性HIV质控品和常规标本一起检测,连续测定20次,收集原始数据,并在其基础上衍生模拟数据;然后对原始数据和模拟数据进行分析并绘制Z-分数图、Hampel identifier (Zi-分数图)与箱式图,比较3种质控图对离群值的检出能力。结果 对于非正态数据,Hampel identifier与箱式图的离群值检出能力一致,均高于Zi-分数图。结论 使用多种离群值检测方法的功能、应用条件及其限制,防止离群值的漏判。

Zi-分数; 汉佩尔辨识法; 箱式图; 质量控制图; 离群值

目前,基于数据正态性分布特性的Zi-分数图已广泛应用于我国医学实验室质量控制[1-2],但实际应用时,由于受某些外源性及内源性因素的影响,酶联免疫吸附试验(ELISA)检测的质控数据不一定完全符合正态分布,当数据中出现离群值时常被忽略[3-4]。有学者认为箱式图对非正态分布数据离群值的检出能力更强[5-6]。Wilcox[7]推荐使用汉佩尔辨识法(Hampel identifier)的质控方法在国内却鲜有报道。现通过实例及模拟数据,探讨该法的应用条件及优缺点,报道如下。

1 资料与方法

1.1 一般资料 弱阳性(4 NCU/mL)HIV质控品(北京康彻斯坦生物技术有限公司,生产批号:201403001)及常规标本。

1.2 仪器与试剂 全自动酶免分析系统(STAR全自动加样器及FAME全自动酶免分析仪);伯乐公司HIV诊断试剂盒(ELISA),是国家批准检验合格产品,于有效期内使用。

1.3 方法

1.3.1 数据收集 每批样品均平行检测常规标本、试剂盒内阴阳性对照品和弱阳性质控品(1次),并连续测定20次,收集质控数据20例(A组),同时从原始数据中衍生模拟出其他4组数据:B组,怀疑存在1个高值为离群值;C组,怀疑存在1个以上的高值离群值;D组,怀疑存在1个以上的高值离群值(个别离群值很高);E组,怀疑存在1个高值和1个低值离群值。

1.3.3 数据分析 使用Z-分数图、Zi-分数图及箱式图分别对各组数据进行分析,比较3种质控图对质控离群值的检出能力。

1.4 统计学处理 采用SPSS17.0软件计算统计量;夏皮洛-威尔克(Shapiro-Wilk)检验进行正态性检验;MedCalc11.4.2.0英文版绘制箱式图;MicrosoftOfficeExcel2003绘制Z-分数图和Zi-分数图。P<0.05为差异有统计学意义。

2 结 果

2.1 数据统计 原始数据(A组)和衍生模拟数据(B、C、D、E组)经Shapiro-Wilk正态性检验,均P<0.05。

2.2Z-分数图与Zi-分数图的比较A组中,例17 的Z分数为3.03,>3,Zi分数为3.44,>3,Z-分数图和Zi-分数图均检出例17为离群值。B组中,计算获得的20个Z分数绘制成的Z-分数图,检出例20(Z=3.26)为离群值,Zi-分数图也检出例20(Zi=4.06)为离群值。C组中,Z-分数图未检出离群值,Zi-分数图则检出例17(Zi=3.53)、例20(Zi=3.98) 为离群值。D组中,Z-分数图仅检出例20(Z=4.05)为离群值,Zi-分数图则检出例17(Zi=3.53)、例20(Zi=15.71)为离群值。E组中,Z-分数图未检出离群值,Zi-分数图则检出例17(Zi=3.44)、例20(Zi=-3.23)为离群值,见图1~5。

2.3 箱式图分析A组中,例17为离群值。B组中,例20为离群值。C组中,例17、例20为离群值。D组中,例17为离群值、例20为极值。E组中,例17、例20为离群值。见图6。

注:Z-分数图与Zi-分数图比较。

注:Z-分数图与Zi-分数图比较。

注:Z-分数图与Zi-分数图比较。

注:Z-分数图与Zi-分数图比较。

注:Z-分数图与Zi-分数图比较。

2.4Zi-分数图与箱式图的比较 2种质控图检出离群值的总数、例数相一致。

图6 箱式图

3 讨 论

离群值是指样本中的1个或几个观测值,离开其他观测值较远,提示其可能来自不同的总体[10]。本研究利用Z-分数图、Zi-分数图及箱式图,分别对实例及模拟数据的离群值进行分析,本组结果显示:(1)当数据中仅存在1个离群值时(A组、B组),3种方法均能检出,但Z-分数图法不如Zi-分数图法敏感(见图1、图2),A组中第17个检测值的Z分数为3.03时,Zi分数为3.44;B组中第20个检测值的Z分数为3.26时,Zi分数为4.06。(2)当数据中存在2个同一方向离群值时(C组),Zi-分数图、箱式图均能检出,而Z-分数图则不能(见图3),除非存在很大的离群值时(D组),最大的数值方能被检出(见图4),但此时该组的CV值已高达46.48%,远大于ELISA实验批间差异的20%最高限。(3)当数据中存在2个不同一方向(即一高一低)离群值时(E组),Zi-分数图、箱式图均能检出,而Z-分数图则不能(见图5),但第20个检测值(S/CO=1.07)已经非常接近临界值(CutOff值=1),若再小于1时,表明该实验处于失控状态了,而Z-分数图再检出离群值也无实际意义。

Z分数,即单个观察值减去总体均值,得到的差值除以总体标准获得的无因次度量。其用于判断离群值操作简便,但较适于符合正态分布的变量。ELISA受试剂、设备、温度、操作各个环节等多种因素影响,检测数据不一定完全符合正态分布,若出现离群值,其标准差变大,Z分数相应变小其绝对值可能会小于3,离群值出现漏检。当存在多个离群值时,还会出现某个离群值会屏蔽另一个离群值被检出的情况,甚至导致无任何离群值被检出(见图3~5)。

国外学者汉佩尔(Hampel)建议以中位数和中位数绝对偏差(MAD)作为位置和宽度的稳健估计,已有相关报道证明该方法的有效性[7-9]。箱式图的箱子两端分别是上四分位数和下四分位数,中间横线是中位数,两端连线分别是除离群值外的最小值和最大值,另外标记的可能是离群值,其更适于非正态分布资料[9-11]。本研究结果表明,Zi-分数图与箱式图对非正态资料的离群值检出能力是一致的,两者均高于Z-分数图。

本组认为,判断数据是否存在离群值,须考虑数据中是否存在单个或多个离群值,有些检出离群值的方法只可用来检出1个离群值,如Z-分数图。这是否可以称之为“屏蔽效应”,还需做进一步研究,但目前至少可以确定某些离群值的存在会掩盖另一个离群值的检出,甚至导致所有离群值都无法被检出的可能。因此,医学实验室的管理人员,应该掌握多种离群值检测方法的功能、应用条件及其限制,防止离群值的漏判。

[1]陈雪,李书平,赵欣,等.血液核酸筛查利用室内质控品Ct值建立质控图方法初探[J].中国输血杂志,2014,27(11):1154-1155.

[2]罗伟,罗智敏,刘建兵,等.用Excel绘制两种实验室常用室内质量控制图方法[J].检验医学与临床,2013,10(5):620-622.

[3]缪希莉.临床免疫检验质量影响因素分析[J].检验医学与临床,2014,11(3):395-397.

[4]苏武锦,钟周琳,邱昌文,等.四分位极差在血站ELISA质控中的应用研究[J].国际检验医学杂志,2014,35(6):735-737.

[5]David C,Hoaglin-Frederick M,John WT,等.探索性数据分析[M].北京:中国统计出版社,1998:62-101.

[6]官生平.SPC 统计过程管制[M].厦门:厦门大学出版社,2004:104-106.

[7]Wilcox R.Applying contemporary statistical techniques[M].Amsterdam:Academic Press,2003:55-79.

[8]Perarson RK.Outliers in process modeling and identification[J].IEEE Transactions on Control Systems Technology,2002,37(10):55-63.

[9]Liu H,Shah S,Jiang W.On-line outlier detection and data cleaning[J].Computers and Chemical Engineering,2004,67(28):1635-1647.

[10]国家质量监督检验检疫总局.GB/T4883-2008数据的统计处理和解释正态样本离群值的判断和处理[S].北京:中国标准出版社,2008.

[11]孙振球.医学统计学[M].3版.北京:人民卫生出版社,2010:18-19.

The application of Hampel identifier in internal quality control about ELISA

ZHOUYue-lan,SUWu-jin

(Nan-ningBloodCenter,Nanning,Guangxi530003,China)

Objective To study the value of Hampel identifier in internal quality control and to assess the detection ability of quality control outliers.Methods The weak positive quality product of HIV together with routine specimens were detected for 20 times, raw data and simulation data derived on the basis of the raw data were collected and analyzed, Z-scores figure,Hampel identifier (Zi-scores figure),box plot correspondingly were drawed,and the ability of outlier detection about the three kinds of quality control charts were compared.Results Hampel identifier was consistent with the box plot on outlier detection ability for abnormal distribution data,both were superior to Z-score chart.Conclusion Medical laboratory managers should master functions,application conditions and limitations of outlier detection methods to prevent the missing outliers.

Z-scores; Hampel identifier; box plot; quality control charts; outliers

周月兰,女,硕士,主管技师,主要从事临床检验研究。

10.3969/j.issn.1672-9455.2015.11.024

A

1672-9455(2015)11-1555-02

2014-12-25

2015-02-10)

猜你喜欢

箱式正态离群
智能箱式变电站的应用探讨
一种相似度剪枝的离群点检测算法
双幂变换下正态线性回归模型参数的假设检验
基于泛正态阻抗云的谐波发射水平估计
离群数据挖掘在发现房产销售潜在客户中的应用
半参数EV模型二阶段估计的渐近正态性
正态-逆Wishart先验下多元线性模型中经验Bayes估计的优良性
应用相似度测量的图离群点检测方法
一种基于核空间局部离群因子的离群点挖掘方法
箱式分区亭在铁路供电系统中的应用分析