APP下载

非参数Bootstrap法在成本-效果置信区间估计中的应用

2010-09-06谢颖宗欣孙利华沈阳药科大学工商管理学院沈阳市110016

中国药房 2010年22期
关键词:置信区间估计值正态分布

谢颖,宗欣,孙利华(沈阳药科大学工商管理学院,沈阳市 110016)

·药物经济学·

非参数Bootstrap法在成本-效果置信区间估计中的应用

谢颖*,宗欣,孙利华#(沈阳药科大学工商管理学院,沈阳市 110016)

目的:为我国药物经济学评价人员提供一种计算增量成本-效果置信区间的简便、可靠方法。方法:通过查阅、综合总结国外的相关文献,详细介绍了非参数Bootstrap方法的思想和数学特性,并举例说明了构建置信区间的方法。结果与结论:非参数Bootstrap方法作为构建置信区间的一种简便、可靠方法,可应用于药物经济学领域置信区间的构建。但是当数据呈明显偏态或者样本量不够大时,仍需谨慎使用。

非参数Bootstrap法;置信区间;成本-效果比

在药物经济学评价中存在很多不确定因素,这极大地影响了评价结果的信度和效度。按性质可将不确定性因素分为与数据有关的不确定性和与评价过程有关的不确定性。数据中的不确定性通常是由于抽样误差造成,为了降低由抽样误差引起的不确定性因素的影响,可通过计算成本效果点估计的95%置信区间来增加评价结果的可靠性。目前,国内鲜有研究人员对计算成本效果置信区间的方法和应用作详细介绍。笔者介绍一种非参数Bootstrap法计算成本-效果置信区间,以期为药物经济学研究人员提供简便、可靠的评价方法。

1 Bootstrap法的提出背景

药物经济学评价大多与临床试验平行展开。通常临床试验的样本量很有限,且成本数据和效果数据在不同个体间通常具有可变性,尤其是成本数据通常是呈现偏态的,例如,治疗药物引起个别患者严重不良反应的费用,增量成本-效果值(ICER)属于非线性比值的本质也对偏态有一定的影响。所谓的偏态分布是指集中位置偏向一侧,两侧频数分布不对称。当样本增大时,其均数趋向正态分布。因此,传统的以数据呈正态分布为假设条件的统计分析技术,除非样本量足够大,否则不能用来分析数据常呈现偏态分布的药物经济学评价的结果。那么,在无法确定成本和效果数据分布的情况下,该使用什么方法呢?针对以上问题,有学者提出使用非参数Bootstrap方法作为一种模拟抽样分布的方法。

2 Bootstrap法的介绍

2.1 Bootstrap的再抽样思想

Bootstrap法的再抽样方法同一般的抽样方法不同,它采用的是可放回的再抽样方法,即每个数值在一次抽样中,可重复出现。在此,我们举例简单地介绍一下它的可放回的重复抽样思想。如图1所示,假设样本量n=6,均值为4.46,经过3次的可放回重复抽样,可得3个不同的均值。

图1 Bootstrap法再抽样思想Fig 1 The concept for re-sampling of Bootstrap method

2.2 Bootstrap法的应用

在药物经济学领域中,置信区间的计算,除了非参数Bootstrap法外,另外还有2种较为常用的参数方法,它们是泰勒级数展开法(Taylor series method)和Fieller法。

Fieller理论为了避免Ⅰ型错误而降低了检验功效[2],还假设ICER值的分子分母服从二元正态分布。虽然考虑了样本ICER值分布的不对称性,然而,事实上很难证明二元正态分布的假设,特别是当样本很小的情况[3]。此外,该方法可能返回不合理的置信限值,例如:返回一个负值,而实际应用中只可能出现正值[3]。泰勒级数展开法假设成本效果比估计值呈正态分布,且计算的置信区间会不对称地低估区间的上限[4]。

由于成本效果数据通常为非正态分布,而用于计算置信区间的传统参数方法是建立在正态分布的假设上。Bootstrap方法不需要任何关于ICER分布的假设,且一般的统计分析软件都支持Bootstrap用于计算置信区间的功能。笔者建议使用该法计算ICER的置信区间。在此以计算ICER的置信区间为例,对Bootstrap法在置信区间的应用作详细说明。

2.2.1 ICER。成本-效果分析结果最终以ICER进行表示,即分别为实验组和对照组的平均成本,和分别为实验组和对照组的平均效果值。各种用于构建ICER置信限的参数方法已经被提出,例如Box法、Fieller准则和Taylor级数。然而,鉴于成本效果数据分布的未知性质,我们将通过非参数Bootstrap法进行成本效果置信区间的计算。

2.2.2 Bootstrap分布。基于许多重复抽样样本,一个统计量的Bootstrap分布代表了该统计量的抽样分布,而抽样分布是基于许多抽样样本得出的。Bootstrap分布是接近正态的,且其中心非常接近原始样本分布的中心,也就是说,Bootstrap分布的均值作为原始样本的均值估计量几乎没有偏差。Bootstrap标准误差同基于理论得出的估计值非常一致。因此,Bootstrap分布可以很好地模拟抽样分布[5]。

丁勇,桂林电子科技大学计算机与信息安全学院教授、副院长,广西密码学与信息安全重点实验室主任;主要研究方向为公钥密码理论、同态加密、密码安全协议、区块链等;主持国家自然科学基金、中国密码发展基金、国防预研基金、广西区自然科学基金等项目10余项;发表论文60余篇,其中SCI/EI检索30余篇,出版学术专著1部、工信部规划教材1部。

使用实验数据来生成一个关于ICER的Bootstrap分布,要求做到以下几步(假设在实验组有ne名患者和在对照组有nc名患者):

第一,从实验组数据中采用可放回的方式生成ne个成本/效果数据对的样本。然后利用这些数据分别计算和的Bootstrap估计值和。

第二,类似的,可放回的从对照组数据中生成nc个成本/效果数据对的样本。然后利用这些数据分别计算和的Bootstrap估计值和。

关于重复抽样次数B,Efron和Tibshirani表明“理想”的Bootstrap估计值是对应于无限次的Bootstrap再抽样,通常至少为1 000次。重复抽样结束后,将比值按从小(好)到大(差)的顺序进行排列,以便置信区间的计算。

2.2.3 Bootstrap置信区间。Bootstrap在药物经济学中的应用主要是用于构建结果指标(如ICER)的置信区间,即Bootstrap置信区间。它主要有5种方法,分别是正态近似法、Bootstrap百分位方法、偏差纠正百分位法、BCa法和百分位-t法。第1种方法是使用标准误差的Bootstrap估计值且假设统计量的抽样分布呈正态分布来计算统计量的置信区间。因此,当实际上抽样分布为非正态分布时,运用该方法所得的结果是不准确的。在药物经济学领域中,假设ICER的分布呈正态分布是不合适的。第2种方法假设ICER的Bootstrap重复值是无偏颇的,而事实上比值估计量是偏颇的,且Bootstrap重复值将放大样本估计值的偏颇。前2种方法在数据严重失真、抽样分布呈明显偏态分布和评价目标要求较高的准确性或者评价结果的利益关系很大时可信度不够大。事实上,已有研究表明从样本数据计算而来的ICER是总体ICER真实值的有偏估计[6]。后3种方法都考虑了该因素。百分位-t法虽然考虑了估计的抽样分布存在的不对称性,但是它使用了完全不同的方法[1],因此,本文将不对其作具体介绍。BCa法就是通过对标准正态累积分布函数的修正来调整百分位点,它作为偏差纠正百分比法的一种改进,其基本思想同偏差纠正百分比法相同,被证明在各种假设条件下都能很好地构建置信区间[6]。本文仅介绍如何运用简单的偏差纠正百分比法来构建ICER的置信区间,以便于更容易地理解如何通过调整百分位点,从而计算置信区间。

偏差纠正百分位法调整了Bootstrap估计中存在的任何偏差,且就像它的名字显示的,基于百分位的方法就是使用生成的Bootstrap分布的百分位来确定置信区间。以下,笔者将详细介绍如何通过偏差纠正法计算置信限。

第一,计算偏差校正常数,即Z0(标准正态离差)。

第二,使用这种偏差校正常数来调整被用于计算期望置信区间的的百分位,如此的话,偏差校正的置信区间的下限是Bootstrap估计值在Φ[Za/2+2Z0]×100百分位位置上的值,且上限是在Φ[Z1-a/2+2Z0]×100百分位位置上的值;a是期望的置信水平,例如:0. 05;Za/2是与a/2相关的标准正态离差。

3 结论

Bootstrap的优点是不考虑增量成本和效果的分布是否独立,缺点是计算的精确度与重复抽样的次数有关,且其理论基础还受到怀疑[1]。例如,ICER可能出现2种情况下的负值,一是成本节省且效果更大的情况,另一种是成本更大但效果更差的情况。由于Bootstrap随机抽样的性质,可能致使出现大量的负值以至最后的置信限值为负值,此时界限大小是不相关的,只有正负号才是重要的。基于百分位法的Bootstrap置信区间的计算需对ICER值进行排序,显然对负值进行排序是无意义的。因此,如果是第二种情况,排序时应直接将负值放在最小的位置。Briggs等还提出,如果ICER值的分母获得0值或者接近0值的概率很显著,那么Bootstrap的理论假设也将受到质疑。因为,如果效果差值接近于0,那么ICER的值将非常大,致使抽样分布呈不对称分布。但有研究对Box法、Taylor级数展开法、Fieller法和Bootstrap法进行比较,结果表明Bootstrap法是计算可信区间的可靠方法[6]。

总而言之,Bootstrap法能够解决传统方法建立在数据呈正态分布或需大样本的局限性。但是,当数据呈明显偏态且样本较小时,对该方法的应用仍需谨慎。

[1]Briggs AH,Wonderling DE,Mooney CZ.Pulling costeffectiveness analysis up by its bootstraps:a non-parametric approach to confidence interval estimation[J].Health Econ,1997,6(4):327.

[2]Mennemeyer ST,Cyr LP.A bootstrap approach to medical decision analysis[J].J Health Econ,1997,16(6):741.

[3]Chaudhary MA,Stearns SC.Estimating confidence intervals for cost-effectiveness ratios:an example from a randomized trial[J].Stat Med,1996,15(13):1 447.

[4]Polsky D,Glick HA,Willke R,et al.Confidence intervals for cost-effectiveness ratios:a comparison of four methods[J].Health Econ,1997,6(3):243.

[5]Hesterberg T,Moore DS,Monaghan S,et al.Bootstrap Methods and Permutation Tests,2nd edition[EB/OL]. http://bcs.whfreeman.com/ips5e/content/cat_080/pdf/moore14.pdf.2009-5-22.

[6]Campbell MK,Torgerson DJ.Bootstrapping:estimating confidence intervals for cost-effectiveness ratios[J].Q J Med,1999,92:177.

Application of Non-parametric Bootstrap Method in the Evaluation of Confidence Intervals of Cost-effectiveness

XIE Ying,ZONG Xin,SUN Li-hua(College of Business Administration,Shenyang Pharmaceutical University,Shenyang 110016,China)

OBJECTIVE:To provide a simple and reliable method to estimate confidence intervals of incremental cost-effectiveness ratios for pharmacoeconomics evaluation in China.METHODS:Through retrieving relevant foreign literature,the idea and mathematical properties of non-parametric Bootstrap method were described and the method for calculating confidence intervals were explained by giving an example.RESULTS&CONCLUSION:Non-parametric Bootstrap method is simple and reliable for the calculation of confidence intervals of pharmacoeconomics.When the distribution of samples is skewed significantly or the sample size is not plenty enough,we still need to be cautious to adopt non-parametric Bootstrap method.

Non-parametric Bootstrap method;Confidence intervals;Cost-effectiveness ratio

R956

A

1001-0408(2010)22-2027-03

2009-11-19

2010-03-01)

*硕士研究生。研究方向:药物经济学。E-mail:bishuiye3@163. com

#通讯作者:教授,博士研究生导师,博士。研究方向:药物经济学、医药投资效益与管理。电话:024-23986553

猜你喜欢

置信区间估计值正态分布
关于n维正态分布线性函数服从正态分布的证明*
Maxwell分布参数的最短置信区间研究
p-范分布中参数的置信区间
多个偏正态总体共同位置参数的Bootstrap置信区间
生活常态模式
一道样本的数字特征与频率分布直方图的交汇问题
偏对称正态分布的若干性质
列车定位中置信区间的确定方法
2018年4月世界粗钢产量表(续)万吨
正态分布及其应用