Meta分析系列之十一：随机化的评价

2013-04-24曾宪涛黄伟沈可

中国循证心血管医学杂志 2013年2期

曾宪涛，黄伟，沈可

Meta分析是对原始研究的再次定量研究，故原始研究的质量是影响Meta分析整体质量的一个重要部分。若Meta分析纳入的原始研究质量低，且未对原始研究方法学质量进行正确评价，其结果和结论可能是不正确的，甚至是有害的，从而对临床实践造成误导[1]。因此，需要Meta分析制作者对纳入的原始研究进行正确、有效的质量评价，包括Cochrane Handbook在内的各种报告规范中也将纳入研究的质量评价作为一个必须的环节[2]。本文将对从随机化的概述、评判标准、疑问及实例描述4个方面对如何评价随机化进行介绍。

1 概述

1.1 相关定义随机（random）：A Dictionary of Epidemiology（第5版）将随机定义为“Governed by chance; not completely determined by measurable factors”[3]，因此，不难理解成“随机，是机遇而非选择”[4]，即是自然产生的，没有人为的干预因素。

随机化（randomization）：随机化又称为随机分配（random allocation），是临床科研的重要方法和基本原则之一，是指将研究对象随机地分配到对照试验的各个组（arms）。随机化包括随机序列的产生和实施两大要素，理想的结果是纳入研究的受试对象不知道该序列[5]。

半/类随机化（quasi-random allocation）：半随机化也称为假随机化（pseudo randomization），是指纳入研究对象的分配方法并不是真正意义上随机（random），但在分配研究对象时意在使用一种能够产生可比性好的组别的方法。半随机的方法包括：根据研究对象的生日、星期几或某个月、研究对象的门诊号或住院号或研究对象的入组顺序等。在实践中，这些非随机化的方法相对容易操作，但会导致选择性偏倚[5]。

1.2 随机化的方法在研究设计中，随机化的方法有两种形式[3]：①随机抽样（random sample），指的是被研究的对象从被研究的目标人群中，借助于随机抽样的方法，使目标人群中的每一个个体，都有均等的机会被选择作为研究对象。②随机分组（random allocation），指将随机抽样得到的样本（或非连续性的非随机抽样的样本），应用非随机化分组的方法，使其都有均等的机会进入“试验组（intervention）”或“对照组（control）”接受相应的试验处理。

能够生产随机化序列的方法有很多种，常见的主要有[4]：①简单/非限制性的随机法（simple/unrestricted randomisation），如掷硬币等。②有限制的随机化法（restricted randomisation），如区组法、瓮随机法等。③分层随机化法（stratified randomisation）。

1.3 随机化的益处正确地使用随机化，可以带来以下三个方面的益处[4]：①最大限度的减少或消除分配治疗方案时的选择或混杂偏倚，产生无偏倚的对照组。②有利于对研究实施盲法，也使使用安慰剂成为可能。③允许使用概率论来表示研究的各组间的结局差异是由机遇造成的可能性。

1.4 报告规范中的要求在2008年发表的针对期刊论文摘要和会议摘要的“CONSORT for abstracts”[6]声明中，建议应该在“Instructions to Authors”中要求作者在摘要里应明确陈述研究对象被随机分配到各试验组，以及分配的方法。

在针对各种类型随机试验的CONSORT声明及其扩展版中，均明确在条目“随机序列产生方法”中规定了应该报告的内容（表1）。

2 评判标准

2.1 随机化的正误方法至今已经有多种进行随机化的方法，然而，这些方法不一定都是正确的。目前认为非正确随机的方法有：依据出生日期（date of birth）、病例记录号（case record）、就诊日期（date of visting doctor）、星期几（day of the week）、身份证号尾数，研究对象出现的时间或入组的顺序（presenting or enrollment order）等等这样的人为指定的方法。这些看似随机化的方法其实却是非随机的，研究者们有时候可能是无意识的，有时候可能是未吃透定义所致。当然，与完全非随机化相比，这些非正确的随机化的方法也在一定程度上限制了选择偏倚和混杂偏倚，故也称之为“半/类/假随机化”。

正确的随机方法可分为手工的方法和计算机/计算器随机的方法。手工的方法有掷硬币法（coin-tossing）、掷骰子（dice-throwing）、抽签/抓阄法（lot-drawing）以及分发事先洗好的牌，这些方法是合理的生成简单完全随机序列的方法。但是，因这些手工的简单随机化方法的不可预测性，可能对随机性造成损害，执行困难，且缺乏验证试验，故现在已不再推荐使用[14]。简单随机数字表法（random numbers table）也是一种手工的方法，在样本量不大，仅在单中心进行研究时，是可行的，且因其克服了上述简单随机化方法的缺点，故现在仍在广泛应用。

计算机/计算器产生随机序列的方法是伴随着计算机技术和信息科学技术高速发展而出现的。相对简单随机数字表法，计算机/计算器产生随机序列也可以用于单中心的研究，但更多的是应用于多中心的随机对照试验。常见的描述有：采用SPSS软件、采用SAS软件、电脑随机数字生成器等，这些均是正确的随机方法。

2.2 与临床对照试验的区别较多Meta分析制作者的一个疑惑就是随机对照试验（randomised controlled trial，RCT）与临床对照试验（controlled clinical trial，CCT）如何区别？其实这个在各版本Cochrane Handbook[1]均进行了较为详细的说明，主要有以下3点：①若作者明确指出该试验采用随机分配设立对照组，则将之归为RCT；②若作者未明确提到“随机分配”字眼，而读者亦不能排除其随机分配的可能，则将之归为CCT；若未明确提到“随机分配”字眼，但可判定是真正的双盲试验，则应归入RCT；③对于报告了随机分配方法，但未严格采用随机分配的半随机试验亦归入CCT，半随机化方法包括交替分配、根据出生日期分配等。手册同时强调，因为这种对RCT及CCT的划分方式完全由作者决定，而非由读者自己判断，因此并不能反映出试验真实的分类或试验分配过程的质量。

2.3 质量评估工具中的要求在各种针对随机试验的评价工具[15]中，均将随机化作为必须的评价条目之一，现在经常使用的几种质量评价工具中的要求如表2。

3 实践中的疑问

3.1 进行Meta分析时低质量的研究需要剔除吗？纳入研究的质量也可能是产生异质性的一个来源，且质量越高产生偏倚的可能性就越小。因此，当纳入的随机试验质量有高有低、特别是纳入研究的数目也较多时，Meta分析制作者常会考虑是否要剔除低质量的研究？笔者认为，只要是符合合格标准[18]的研究均不应该剔除。此类情况，笔者建议无论是否有异质性存在，均根据研究质量的高低进行亚组分析；当纳入研究数目较少时，建议分别剔除合并结果中的低质量或高质量研究行敏感性分析。行亚组分析或敏感性分析的目的有二：一是探讨质量差异是否会导致异质性；二是比较质量不同的研究合并结果的异同，以便提供更有价值的结果。

3.2 双臂之外的随机试验如何判断？因为当前最常见的为基于随机平行双臂对照试验的Meta分析，即只有两个比较组。因此，不少Meta分析制作者对多臂随机试验随机化的判断感到疑惑。在实际中，除了两组比较，还有三臂、甚至四臂等多重比较[19]；除了平行设计，还有区组随机、分层随机等[4]。对于这些随机试验，笔者认为仍然按照双臂的随机试验的判定方法进行判定，因为无论是何种设计方案，只要是随机设计，其随机序列的产生方法必然是一样的，自然其评定也是一样的。

3.3 随机对照试验各臂样本量必须相等吗？普遍认为，随机试验各臂的样本量应该是大小相等的。真正意义的随机化因为其具有不可预测性，是很难产生样本量大小相等的各臂的。在随机对照试验中，尤其是使用排列区组随机法的非双盲试验中，绝对相等的样本量不仅对提高统计学把握度没有什么帮助，而且潜在的威胁了不可预测性[20]。因此，随机对照试验的各臂的样本量应该是具有差异的，但差异一定是在适当的范围内。实践中常见到的均等样本量的各臂是随机化结果经过人为修饰过的。无论如何，一定要保证各臂的受试对象保证来自同一样本人群。

4 实例描述

4.1 真随机若文中出现了如下类似的语句信息，则为“真随机”：分配受试者时，依据采用计算机生成的随机数字。根据计算机生成的随机序列由一名不参与试验的人员负责分装安慰剂和药物。采用Stata 9.0软件生成随机序列，然后采用1:1的比例分配区组样本量。采用简单随机数字表按照1:1的比例分组。采用随机数字表按照2:1的比例将受试者随机分到实验组和对照组。将患者随机分为试验组和对照组，试验组64人，对照组69人。按照患者的入院顺序，采用掷硬币法，正面分入试验组，反面分入对照组。将患者按照1:2的比例随机分为两组，试验组50例，对照组98例。将患者分为两组，试验组50例，对照组55例；试验组使用A药，对照组使用安慰剂，安慰剂的色泽、气味、大小及包装与A药相同，患者及医生均不知晓何者为安慰剂。

表1 CONSORT报告规范及其扩展版规范中对随机序列的报告要求

表2 当前常用的质量评价工具中对随机化的评定要求

4.2 假随机若文中出现了如下类似语句信息，则为“假随机”：将2005年3月～2007年2月间的患者随机分为两组，选择2005年3月～2006年2月为对照组，2006年3月～2007年2月为试验组。将患者随机分为两组，试验组50例，对照组81例。将80例患者随机分为两组，A组40例，B组40例；另外随机选取同一时期住院患者40例作为对照组。按照患者的入院顺序随机，依次分进入到试验组和对照组。按照患者的身份证尾数的奇偶数随机分组，奇数分入到试验组，偶数分入到对照组。根据手术方法随机分组，将使用髓内针内固定的患者作为试验组，使用钢板螺钉内固定的患者作为对照组。根据患者意愿随机分组，将选择使用髓内针内固定的患者作为试验组，选择使用钢板螺钉内固定的患者作为对照组。根据患者入院的单双日进行随机分组，单数日入院的为试验组、双数日入院的为对照组。

4.3 无法判断此外，尚有很多研究仅提及“随机分组”，但没有报告随机方法（特别是在中文期刊上发表的更为多见），这时候需要评价者结合文中的信息进行判定。若有明显的信息提示为非随机或随机（见上述），则可果断进行判定；若文中信息不足以判定时，可以考虑联系作者，直到实在无法判定时才可以判定为“不清楚”。如：“将100例患者随机分为A组和B组，A组52例，B组48例”，除此以外，文中无法获取任何与随机化判定的信息，联系文章通讯作者也未获回复，此时应判定为“不清楚”。

5 结语

正确的随机化是保证随机试验价值的一个重要前提，也是研究最大限度的避免选择偏倚和混杂偏倚的保证。因此，只有能够正确的对随机化进行判定，才能即避免因为看到“随机”字样就纳入了连“半随机试验”都算不上的研究、又避免了因为没有看到“随机”字样就舍弃了真正的随机试验的失误，从而保证纳入Meta分析的研究为真正的随机试验。很明显，无论哪一种失误，均可能导致产生发表偏倚、夸大或降低干预效果、或导致异质性的可能。因此，Meta分析制作者只有真正理解了“随机化”的内涵并能行之有效的鉴定，才能保证制作的Meta分析的内部真实性。

[1] Higgins JPT,Green S. Cochrane Handbook for Systematic Reviews of Interventions Version 5.1.0[EB/OL]. The Cochrane Collaboration,2011 [2013-02-15]. http://www.cochrane-handbook.org.

[2] 曾宪涛,李胜,马钻,等. Meta分析系列之八:Meta分析的报告规范[J]. 中国循证心血管医学杂志,2012,4(6):500-3.

[3] Porta M. A Dictionary of Epidemiology. 5 edition [M]. Oxford: Oxford University Press,2008.

[4] Schulz KF,Grimes DA. Generation of allocation sequences in randomised trials: chance,not choice[J]. Lancet,2002,359(9305):515-9.

[5] Glossary of Cochrane terms [EB/OL]. The Cochrane Collaboration[2013-02-15]. http://www.cochrane.org/glossary.

[6] Hopewell S,Clarke M,Moher D,et al. CONSORT for reporting randomized controlled trials in journal and conference abstracts:explanation and elaboration[J]. PLoS Med,2008,5(1):e20.

[7] Schulz KF,Altman DG,Moher D,et al. CONSORT 2010 Statement:updated guidelines for reporting parallel group randomised trials[J].PLoS Med,2010,7(3):e1000251.

[8] Campbell MK,Piaggio G,Elbourne DR,et al. Consort 2010 statement:extension to cluster randomised trials[J]. BMJ,2012,345:e5661.

[9] Piaggio G,Elbourne DR,Pocock SJ,et al. Reporting of noninferiority and equivalence randomized trials. Extension of the CONSORT 2010 statement[J]. JAMA,2012,308(24):2594-604.

[10] Gagnier JJ,Boon H,Rochon P,et al. Recommendations for reporting randomized controlled trials of herbal interventions: explanation and elaboration[J]. J Clin Epidemiol,2006,59(11):1134-49.

[11] Boutron I,Moher D,Altman DG,et al. Extending the CONSORT Statement to randomized trials of nonpharmacologic treatment: explanation and elaboration[J]. Ann Intern Med,2008,148(4):295-309.

[12] MacPherson H,Altman DG,Hammerschlag R,et al. Revised STandards for Reporting Interventions in Clinical Trials of Acupuncture (STRICTA): extending the CONSORT statement[J].PLoS Med,2010,7(6):e1000261.

[13] Kilkenny C,Browne WJ,Cuthill IC, et al. Improving bioscience research reporting: the ARRIVE guidelines for reporting animal research[J]. PLoS Biol,2010,8(6):e1000412.

[14] Schulz KF. Randomized controlled trials[J]. Clin Obstet Gynecol,1998,41(2):245-256.

[15] 曾宪涛,包翠萍,曹世义,等. Meta分析系列之三:随机对照试验的质量评价工具[J]. 中国循证心血管医学杂志, 2012,4(3): 183-185.

[16] Maher CG,Sherrington C,Herbert RD,et al. Reliability of the PEDro scale for rating quality of randomized controlled trials[J]. Phys Ther,2003,83(8):713-21.

[17] Jadad AR,Moore RA,Carroll D,et al. Assessing the quality of reports of randomized clinical trials: is blinding necessary[J]? Control Clin Trials,1996,17(1):1-12.

[18] 曾宪涛,孙竹,汤红明. Meta分析系列之十:合格标准的制定[J]. 中国循证心血管医学杂志,2013,5(1):6-9.

[19] Schulz KF, Grimes DA. Multiplicity in randomised trials I: endpoints and treatments[J]. Lancet,2005,365(9470):1591-5.

[20] Schulz KF,Grimes DA. Unequal group sizes in randomised trials:guarding against guessing[J]. Lancet,2002,359(9310):966-70.