APP下载

利用Excel VBA函数在医学检验中进行四格表统计的教学尝试*

2021-12-22黄海樱陈波周强冀天星陈靖楠

临床输血与检验 2021年6期
关键词:卡方四格阴性

黄海樱 陈波 周强 冀天星 陈靖楠

随着现代医学发展,临床实验室每天有大量数据产生。如何有效搜集、整理和加工这些数据,做出科学决策与结论,都有赖于准确的统计分析。传统的手工计算方法早已被专业统计分析软件如SPSS和SAS等取代。这些专业软件虽然功能强大,但在临床实验室中的普及性不高,软件操作相对复杂,其应用受到制约。而临床实验室常常需要进行的四格表卡方检验的统计方法,主要应用于对阳性率、患病率、发病率等数据的分析,运用Excel软件即可实现。相较于专业统计软件,Excel具有操作简单、易学易用、方便、图形美观和普及性高等优点[1]。在此背景下,笔者采用目前运用广泛的Microsoft Office Excel 2007开发的VBA宏程序,以实现四格表卡方检验,即根据不同数据智能计算出卡方检验、校正卡方检验和确切概率法的值与P值,自动判断是否有统计学意义,简化了繁琐统计操作程序,达到计算准确、迅速、方便、可靠和灵活等特点,省时省力,可提高教学效率。现将使用的体会介绍如下。

材料与方法

1 材料

1.1 配置:主机i3-3240 CPU主频3.00 GHz,2 G内存,450 GB硬盘,VGA彩显。

1.2 软件:Microsoft Windows WIN 10中文版操作系统,Microsoft Office Excel 2010 中文版。

2 方法

2.1 卡方检验的表设置:在Excel工作表建立四格表卡方检验和四格表评估诊断试验的两个sheet,在四格表卡方检验表中设置A12=实验组、BC1=结果、D1=合计、B2=阳性数、C2=阴性数、A3=A实验、A4=B实验、A5=合计、A6=卡方检验、A7=校正卡方检验、A8=确切概率法、A9=采用双侧概率之和、A10=P值和A11=判断,如图1。四格表评估诊断试验的表中设置A12=诊断试验、BC1=金标准、D1=合计、B2=阳性、C2=阴性、A3=阳性、A4=阴性、A5=合计、A6=灵敏度、C6=配对卡方值、A7=特异性、C7=P值、A8=阳性预测值、C8=判断、A9=阴性预测值和A10=正确率,如图2。这样可以完成对表的设置。

图1 四格表卡方检验和评估诊断试验在Excel中的设置

2.2 卡方检验程序的编写:通过Excel的VBA程序界面编写,完成四格表卡方检验和四格表评估诊断试验(配对四格表)的统计功能,并可以保存统计结果到相应帮助菜单。以杨树勤主编卫生部规划教材第三版的《卫生统计学》书上的例子8.1(76~77页)、8.2(78~79页)、8.7(82~83页)和8.8(84~85页)分别进行对比分析,将自行编写的Excel程序对于此例的运算结果,与应用SPSS17.0统计软件对此例的分析结果对比,以此验证本程序的准确性[1]。Excel的VBA程序界面编写如图2。

2.3 四格表卡方检验的统计方法:先计算四格表的实际频数和理论频数(理论频数的计算公式为TRC=nRnC/n,即某个格子行列合计的乘积与总例数的比值)。当n(总例数)≥40且T(所有格子的理论频数)≥5的时,使用卡方检验χ2=(ad-bc)2n/(a+b)(c+d)(a+c)(b+d);当n≥40且1<T<5时;使用校正卡方检验χ2=(|ad-bc|-n/2)2n/(a+b)(c+d)(a+c)(b+d);当n<40或T<1时;可使用四格表的确切概率法,采用P=[(a+b)! (c+d)! (a+c)!(b+d)!]/(a!b!c!d!n!)直接计算表内四个数据的各种组合之概率,取双侧检验的概率值作为判断点P<0.05[2]。

2.4 四格表评估诊断试验(配对四格表)的统计:可靠的、公认的、能正确的将有病和无病区分开的诊断方法,即标准诊断方法称为“金标准”。在临床工作中我们要想判断一项诊断试验对某一疾病的诊断价值,常将该诊断试验的结果与“金标准” 的结果进行比较,计算该诊断试验的灵敏度、特异度、阳性预测值、阴性预测值和准确率来分析其诊断价值。这时就要用到四格表,对于不同的四格表其每一个格子的含义是相同的(见图2):真阳性(A)、假阳性(B)、假阴性(C)、真阴性(D)。配对四格表用于两种检验方法和诊断方法的比较,例如相同患者用两种方法检验或诊断,相同样本用两种方法检测等,其特点是相同对象使用两种不同方法处理。因为评估诊断试验和配对四格表对数据处理一致,故两者的统计分析放在一起,取双侧检验的概率值作为判断点P<0.05。

图2 卡方检验程序的Excel的主界面

2.5 利用Excel VBA函数在医学检验专业的实验数据教学尝试:医学检验会产生很多实验数据,其中许多要进行四格表卡方检验;四格表评估诊断试验;配对设计四格表卡方检验等数据的统计分析统计。利用该软件老师在实验的课堂上产生数据进行即时、快速统计进行统计分析与应用评教评学,验证学生实验的教学效果。

结 果

1 四格表卡方检验 输入参数为:A(A实验阳性数)、B(A实验阴性数)、C(B实验阳性数)和D(B实验阴性数)应为数字,否则有提示框。软件根据上述条件自动输出相应统计描述参数:A+C、B+D、A+B、C+D、A+B+C+D、具体卡方检验、P值和判断,以及与SPSS的验证结果比较,其结果一致(见下划线),只存在有效位数不同,SPSS并不能按条件智能选择卡方值!需人工再次判断分析。Excel程序的验算结果和SPSS的分析结果印证详见图3和表1、图4和表2、图5和表3。

表3 校正卡方检验结果(SPSS的统计结果)

图5 校正卡方检验的统计结果和存储数据(T<1 or n<40,v=1)

表2 校正卡方检验结果(SPSS的统计结果)

图4 校正卡方检验的统计结果和存储数据(1<T<5 and n≥40,v=1)

表1 卡方检验结果(SPSS的统计结果)

图3 卡方检验的统计结果和存储数据(T≥5 and n≥40, v=1)

2 四格表评估诊断试验(配对四格表) 输入参数为:A(真阳性)、B(假阳性)、C(假阴性)和D(真阴性)应为数字,否则有提示框。软件根据上述条件自动输出相应统计描述参数:A+C、B+D、A+B、C+D、A+B+C+D、该诊断试验的灵敏度、特异度、阳性预测值、阴性预测值和准确率(左框内);配对卡方检验、P值和判断(右框内)。以及与SPSS的验证结果比较,其结果一致(见下划线),SPSS只提供P值,没有配对卡方检验值,差别有效位数不同,可见本软件能提供更多统计参数。详见图6和表4的相互印证。

表4 配对卡方检验结果(SPSS的统计结果)

图6 四格表评估诊断试验(配对四格表)的统计结果和存储数据(v=1)

3 四格表的实验室教学的初步应用 老师让学生按照教学实验要求,完成外周血细胞的分类,用百分率表示,老师用此软件将老师的分类结果与学生的进行比较,判断两者是否有差异。外周血细胞共有五种(中性粒细胞,嗜酸性细胞,嗜碱性细胞,单核细胞,淋巴细胞),每个学生与老师的分类结果要比较五次,一个班有二十多学生,所以工作量可想而知,采用此软件后,对学生的实验结果分析所需时间明显较以往的手工判断短,差异极其显著,效率大大提高。

讨 论

χ2检验(chi-square test)是一种用途较广的假设检验方法,应用于计数资料,即比较两个总体率(或构成比),根据不同四格表资料的总例数(n)且所有格子的理论频数T,对应采用不同卡方检验、校正卡方检验、确切概率法和配对卡方检验的统计方法。传统的χ2检验手工计算方法早已被专业统计分析软件,如SPSS和SAS等取代。但因这些软件过于复杂所以在临床实验室中的普及性不高。在此背景下,笔者采用目前运用广泛的Microsoft Office Excel 2007开发的VBA宏程序,以实现四格表卡方检验。当打开Excel文档时自动启动卡方检验程序的主界面(如图2所示),选择四格表卡方检验或四格表评估诊断试验,只需按提示输入四组数据,点击统计按钮,即自动完成分析判断并判断结果(是否有统计学意义),附带统计值、P值和其它参数。如需要数据输出,按数据保存键,即可将统计的数据保存到相应Excel的表格里,便于存档。因为所有的公式和命令均打包在程序里,可保证可靠性。而在通过公式设置计算四格表卡方检验的文献报道[3-5]里,关注点是利用Excel替代卡方检验和校正卡方检验手工计算,并没有提供确切概率法和配对卡方检验的统计方法;且公式单元容易被误删和修改,即使可以设置保护也还存在操作繁琐和保密性不强等缺点。本软件与之相比具有界面简洁、功能更多、更加智能化等特点。该程序能满足实验教学对χ2检验的需求,增加评估诊断试验与配对四格表两者合一(如图6所示),进一步开展功能及其适用性,在今后应用中不断改进。本次的统计数据均来自杨树勤主编卫生部规划教材第三版的《卫生统计学》书上的的样题,以SPSS专业统计软件为标准进行对比验证,两者的统计结果均一致,可以采用有效位数来表达。

确切概率法实现是本文重点和难点,须计算总例数<40或T<1值,|A-T|满足以条件下:各格相等;依次增减四格表某格的数据,可列出周边合计不变条件下各种组合的四格表。当计算所有|A-T|值等于及大于样本|A-T|值的四格表的P值,然后相加获得P值。可见确切概率法计算过程过于繁杂、重复、计算量大与易错、如果单单通过单元公式设置没法实现上述功能,故采取编程的方式比较容易实现,思路清晰。

四格表评估诊断试验(配对四格表)两表合一,因为使用数据相同。诊断试验是判断一项诊断试验对某一疾病的诊断价值,常将该诊断试验的结果与“金标准” 的结果进行比较,灵敏度、特异度、阳性预测值、阴性预测值和准确率来分析其诊断价值。灵敏度是指一项诊断试验将实际有病的人正确地判定为阳性患者的能力,其计算公式为:灵敏度=A/(A+C)×100%;特异度是指一项诊断试验能将实际无病的人正确地判定为非阳性患者的能力,其计算公式为:特异度=D/(D+B)×100%;阳性预测值是诊断试验检查结果为阳性者中确实患有该病的可能性,其计算公式为:阳性预测值=A/(A+B)×100%;阴性预测值是诊断试验检查结果为阴性者中真正为非阳性患者的可能性,其计算公式为:阴性预测值=D/(D+C)×100%;准确率(又称为准确性与正确性)是诊断实验的真阳性者与真阴性者占所检总例数的比例,准确率=(A+D)/(A+B+C+D)×100%。A、 B 、C 、D分别代表真阳性(A)、假阳性(B)、假阴性(C)、真阴性(D)。配对四格表的卡方检验属于计数资料的配对设计,它常用于两种检验方法、诊断方法的比较,如同一批患者以两种方法作检查或诊断,同一批样品用两种方法作检测等,其特点是对样本中观察单位分别用两种方法处理。配对设计的计数资料的数据形式往往表示配对四格表。

利用提供的VBA实现χ2检验统计处理,初步应用效果令人满意,克服手工的不足,提高工作效率,关于具体医学统计学方面知识,请参阅有关医学统计学书籍。通过与SPSS统计软件的验证发现,本软件能根据χ2检验的不同统计条件,智能选择与之相对应的统计方法,并能给出统计学的判断;SPSS统计则可一次性提供χ2检验所有情况的χ2检验值(除配对四格表外)与P值,还需自己依据统计的专业知识准确判断分析,对统计分析者要求更高。另外,SPSS统计数据输入与医学统计的教材不一样,不直观,要转化它的特定的数据形式,增加其统计的难度。毕竟SPSS是专业统计软件,功能强大,满足临床医学对各种不同数据统计分析的要求,必然增加其使用的难度。而本软件在χ2检验使用跟传统医学统计的教材相仿,从数据输入、表达方式和智能分析判断,易学易用,易于理解,实现简单化,软件编写所用到的函数基本上Excel的自带函数就可以完成。

Excel还能处理临床数据、质控数据、质控图和统计代替传统手工绘图方法[6];也能在科室的人事管理、试剂管理和财务管理等方面进行科学管理,有助于科室资料信息管理工作简化、方便、提高效率,节约宝贵时间[7,8]。Excel还具有其他功能,如数据处理、表格制作、图表制作等等,易学易用,计算机技术方面要求不高,易于推广使用。同时还具备兼容性强等特点,如有需要Excel贮存数据方便导入专业统计软件(如:SAS、 SPSS 、Access和FoxPro等数据库),不用重复录入结果,节省统计的时间[9-11]。人们使用Excel非常普遍,通用性强,能满足各行各业的基本统计需求,本次的研究旨在此扩展Excel的χ2检验统计,丰富其统计功能,医务工作者在必要时,可根据自己的要求,展开对Excel数据分析功能挖掘的可行性。

对临床检验专业的实验课产生的检验数据进行初步分析统计,操作简单明了,采用Excel的界面,易学易用,容易上手;同时,增加老师与学生对该软件统计的兴趣,通过了解Excel的函数功能可以实现部分统计,加深统计功能内容理解,达到很好教学效果,引导他们进一步深入了解统计。同时也可以辅助临床老师的数据统计,提高教学工作的效率,也提升自身教学水平,为日后改进与升级打下基础。

利益冲突所有作者均声明不存在利益冲突

猜你喜欢

卡方四格阴性
卡方检验的应用条件
卡方变异的SSA的FSC赛车转向梯形优化方法
玉簪属种质资源收集筛选及耐阴性研究
爆笑四格
爆笑四格
爆笑四格
三大抽样分布的理解与具体性质
爆笑四格
科学期刊发表试验研究阴性结果的重要性