多分类结局指标中两类别占比之比的统计推断方法*

2017-07-18南方医科大学生物统计学系510515

中国卫生统计 2017年3期

关键词：假设检验置信区间样本量

南方医科大学生物统计学系(510515)

刘薇吴军曹颖姝陈平雁△

多分类结局指标中两类别占比之比的统计推断方法*

南方医科大学生物统计学系(510515)

刘薇吴军曹颖姝陈平雁△

目的针对多分类结局指标数据，就某两类占比之比构建相应的假设检验及置信区间估计方法。方法先根据Delta法构建对数变换后比值的方差，然后用正态近似法构建其假设检验方法，分别基于Koopman法、对数变换法和校正的对数变换法构建其置信区间。通过模拟验证假设检验方法的一类错误、检验效能和置信区间覆盖率。最后以实例进行说明。结果基于占比比值的假设检验方法可以较好的控制一类错误。三种置信区间方法的覆盖率均在95%左右，其中基于Koopman法更优。当样本量太小(如不足20例)时，所有方法均不够稳健。结论本研究构建的多分类结局指标某两类占比之比的统计推断方法表现能满足应用需求，并推荐基于Koopman法的置信区间估计。

多项分布占比比值假设检验置信区间 Koopman法

单样本率、两独立样本率及相关样本率的统计推断及置信区间方法[1-3]目前已经十分成熟且应用相当广泛。我们前期的研究已经提出了多分类结局指标中比较其中某两类占比差值的检验方法及置信区间构建方法[4]，本研究则欲建立两类占比比值的统计推断方法。

理论推导

假设多分类结局指标有k个不同类别，每类发生的概率为π1,π2,…,πk，且π1+π2+…+πk=1。用xi表示第i类的频数，则X=(x1,x2,…,xk)服从参数为n,π的多项分布，其中π=(π1,π2,…,πk)为相应的概率向量。根据多项分析理论可知：

第i个类别发生率的方差为：

(1)

第i及j类别发生率的协方差为：

(2)

第i及j类别发生的相关系数为：

(3)

两个占比可以用差值或比值进行比较，本研究只针对比值构建其相应统计推断方法。两占比之比本文用符号PR(percentratio)表示。不失一般性，假设第1、2类为研究所关心的类别，相应的占比参数为π1和π2，观测频数为a和b。假设检验和置信区间构建具体推导如下：

1.假设检验

针对PR，可以构建如下原假设及备择假设：

进一步将原假设及备择假设改写为：

H0:log(π1)-log(π2)=0;H1:log(π1)-log(π2)≠0;

记log(PR)=log(π1)-log(π2)，将log(PR)在(p1,p2)处进行Taylor展开得

根据大样本理论在原假设下可构建检验统计量

(4)

式中，zPR近似服从标准正态分布。应用中，PR值及其方差可用样本进行估计，即

(5)

2.置信区间

对于PR的置信区间，本研究基于对数变换法、校正的对数变换法及Koopman法进行推导。

(1)对数变换法[2]

(6)

(2)校正的对数变换法[5]

同方法(1)但是取p1=(a+0.5)/(n+0.5),p2=(b+0.5)/(n+0.5)

(3)基于Koopman法思想推导[6]

根据Koopman方法思想，令θ=π1/π2，首先构建假设H0:θ=θ0，H1:θ≠θ0，此时可以构建统计量如下：

ln(L) =aln(p1)+bln(p2)+cln(p3)

(7)

模拟研究

基于三项分布F(π1,π2,π3)的数据资料，对本研究提出的假设检验方法和置信区间方法采用Monte Carlo模拟进行验证。模拟参数设置样本量n从小到大设置10、20、30、40、50、100六种情况，π1,π2,π3参数组合见表1。假设检验均为双侧检验，检验水准为0.05，置信水平为常用的双侧。模拟采用SAS9.4编程实现，每种情况模拟10000次。

表1 参数设置

*π3=1-π1-π2

结果

1.假设检验模拟结果

假设检验方法的一类错误和检验效能模拟结果见表2和表3。从模拟结果中可以看出除了发生率为0.05的参数设置，其他参数情况下随着样本量增大本研究提出的检验方法其一类错误能较好的控制在0.05左右。样本量越小发生率越低，一类错误越保守。检验效能模拟结果显示，相同样本量下随着两组占比之比的增大检验效能逐渐增大。

2.置信区间模拟结果

对于占比之比指标的三种置信区间覆盖率模拟结果见图1。从整体来看其波动较小，且各种样本量设置下其规律较为一致。当发生率较低时对数变换法及校正的对数变换法偏向保守，随着发生率的增加又逐渐偏向激进。基于Koopman思想的方法则在各种参数设置下都要优于其他两种方法，除样本量较小时其波动较大外，其他情况下均很好的控制在95% 左右。

表2 一类错误的模拟结果(%)

表3 检验效能的模拟结果(%)

实例

在某冠状动脉疾病的危险因素研究中，105名已形成冠状动脉斑块患者的斑块类型的分布见表4，试比较钙化斑块与非钙化之间的差异是否有统计学意义。

根据上述资料背景，求得钙化斑块占比与非钙化占比的比值为PR=3.5(0.467/0.133)；由公式(4)和公式(5)求得Z=3.642，P<0.001，即钙化斑块占比显著高于非钙化占比。由公式(6)和公式(7)还可分别求得三种方法估计的95%置信区间，即对数变换法、连续性校正对数变换法和Koopman法分别为[1.995,6.142]、[1.961,5.944]和[1.949,6.286]。

图1 PR值置信区间覆盖率模拟结果

表4 不同类型冠状动脉斑块的分布

讨论

对于多分类结局指标，本研究基于理论推导，构建了其两类别占比之比的假设检验方法及置信区间估计方法，并通过模拟进行验证。

就假设检验方法而言，基于占比之比的检验方法其理论基础除了基于大样本理论之外[7]，其方差推导中还用到了delta法近似[8]，两步近似使得其方法的误差变大，然而模拟结果显示虽然当样本量较小及发生率较低时偏保守，但是随着样本量的增大它能较好的控制一类错误。

就置信区间估计方法而言，应用正态近似的对数变换法是较为常用的方法。本研究借鉴Koopman思想构建适合多分类结局指标两类别间占比之比的置信区间源于Fagerland[9]研究的启发，该研究针对两独立样本PR值的置信区间方法进行模拟比较，结果显示Koopman法都要优于其他方法。而且本研究模拟结果显示基于Koopman思想的方法在各种参数设置下都要优于对数变换的方法，在应用中推荐使用该方法。

我们的前期研究提出了针对多分类结局指标占比之差的统计推断及置信区间构建方法[4]，并经模拟验证得出其表现优越，可以满足应用需求。对于特定数据，占比之差和占比之比指标在应用中并无孰优孰劣，只是当事件发生率较低时，尤其是比值分母接近0或为0时，差值在估计稳定性上要优于比值。我们考虑后续对提出的差值及比值的统计推断及置信区间构建方法进行综合模拟比较，以指导实践应用。

综上所述，本文提出的针对多分类结局指标中两类别占比比值的假设检验及其置信区间方法均能较好的满足应用需求。

[1]Newcombe RG.Improved confidence intervals for the difference between binomial proportions based on paired data.Stat Med,1998,17(22):2635-2650.

[2]Newcombe RG.Interval estimation for the difference between independent proportions:comparison of eleven methods.Stat Med,1998,17(8):873-890.

[3]Agresti A,Coull BA.Approximate is Better than “Exact”for Interval Estimation of BinomialProportions.The American Statistician,1998,52(2):119-126.

[4]吴军,段重阳,陈平雁.多分类结局指标中两类别占比之差的统计推断方法.中国卫生统计,2016，33(3):404-407.

[5]Gart JJ,Nam J.Approximate interval estimation of the ratio of binomial parameters:a review and corrections for skewness.Biometrics,1988,44(2):323-338.

[6]Koopman PAR.Confidence Intervals for the Ratio of Two Binomial Proportions.Biometrics,1984,40(2):513.

[7]Fleiss JL,Levin B,Paik MC.Statistical Methods for Rates and Proportions,Third Edition.John Wiley & Sons,2003,354-376.

[8]周勇主编.广义估计方程估计方法.北京:科学出版社,2013,208-340.

[9]Fagerland MW,Lydersen S,Laake P.Recommended confidence intervals for two independent binomial proportions.Stat Methods Med Res,2015,24(2):224-254.

(责任编辑：郭海强)

Statistical Inference Methods for the Percent Ratio Between Two Categories of the Multinomial Outcome

Liu Wei,Wu Jun,Cao Yingshu,et al

(DepartmentofBiostatistics,SouthernMedicalUniversity(510515),Guangzhou)

Objective Statistical inference methods for comparisons between two categories of the multinomial outcome are not available now.This study aims to develop hypothesis testing and interval estimation methods based on the percent ratio(PR).Methods Firstly,the variance of log transformed PR was constructed based on the delta method and the hypothesis testing method was established using normal approximation method.The confidence interval was estimated based on Koopman method,logarithm transformation method and adjusted logarithm transformation method.Type I error,statistical power and the coverage rate of confidence interval were assessed by Monte Carlo simulation methods.Results Type I error of the developed hypothesis testing method was well controlled.All coverage rates of constructed 95%confidence interval methods were around.Koopman method was superior to logarithm transformation method and adjusted logarithm transformation method,but all methods were unstablewhen the sample size was too small(for instance,less than 20).Conclusion The hypothesis testing method and confidence interval methods brought up in the paper can meet application requirements and the CI estimation method base on Koopman's method is recommended for confidence interval estimation.

Multinomial outcome;Percent ratio;Hypothesis testing;Confidence interval;Koopman′s method

国家自然基金资助(81673270)

△通信作者：陈平雁