APP下载

医学研究中样本量的选择

2021-12-06司效东

内蒙古统计 2021年4期
关键词:样本量正态分布总体

○ 文/司效东

在医学研究中常常会遇到选择样本量的问题。医学研究者一般都缺乏概率论和数理统计方面的背景知识,所以在研究中对这个问题重视不够,选择研究的样本量具有很大的随机性,因此代表性和准确性较差。特别是动物实验。其实这个问题在科学研究中非常重要,它影响到研究过程的严谨性及研究结论的可靠性。科研课题的建立其实就是一个医学科研设计的过程,在这个过程中涉及很多问题,其中很重要的问题就是样本量大小的确定,正确选择样本量,直接影响最终科研结论的可靠性。本文就样本量选择的意义及一些简单的方法进行阐述。

一、样本量选择

样本量是指总体中抽取的样本元素的总个数,应用于统计学、数学、物理学等学科。样本量大小是选择检验统计量的一个要素。由抽样分布理论可知,在大样本条件下,如果总体为正态分布,样本统计量服从正态分布;如果总体为非正态分布,样本统计量渐近服从正态分布。

合理确定样本量的意义:

第一,样本量过大,会增加调查工作量,造成人力、物力、财力、时间的浪费;

第二,样本量过小,则样本对总体缺乏足够的代表性,从而难以保证推算结果的精确度和可靠性;

第三,样本量确定的科学合理。一方面,可以在既定的调查费用下,使抽样误差尽可能小,以保证推算的精确度和可靠性;另一方面,可以在既定的精确度和可靠性下,使调查费用尽可能少,保证抽样推断的效果最好。

二、医学研究样本量的选择

样本量的估计是临床研究科学设计的重要内容。任何科学研究都要具有可重复性原则,其目的是要排除偶然因素的影响,得出科学的、真实的、规律性的结论。在临床研究中,样本量越小,抽样误差越大;若样本量不足,可重复性差,检验效能低,不能排除偶然因素的影响,其结论就缺乏科学性及真实性;若样本量过大,实验条件难以控制,容易造成人力、物力和时间上的浪费。估计样本量的目的就是在保证某个临床试验或临床研究的结论具有科学性、真实性、可靠性的前提下,同时考虑到医学研究所限定的条件,确定某研究所需要的最小观察例数。

样本量越大,越能反应总体特征。当给定置信水平时,样本量越大,误差区间越小,然而这个关系并不是线性的,样本量增大两倍,并不一定能将误差区间减少一半。同时,样本量也不能低于某一个数量下限。

可以根据设计方案、资料类型及可能涉及的统计学方法来选择样本量的计算方法,也可以利用统计软件来完成样本量的计算。由于估算的样本量是最少需要量,考虑受试者可能有不合作者、中途失访、意外死亡等情况,而减少有效观察的例数,因此应该在估算的样本量基础上增加若干样本例数。

目前,医学研究样本量的选择主要遵循对照、随机与重复三个原则,在结合统计学的基础上,通过公式计算或查表获得。国内有关书籍提供的样本量计算公式,主要适用于临床试验,并不适用动物实验。动物实验的样本量可以参考临床试验的样本量,并在此基础上适当减少其样本例数。理论上,研究者可以保证除干预以外的其他因素在不同组间完全均衡,也就是完全可以保证所有的实验动物如实验鼠的基因型、体重等完全一致,即在实验干预之前所有的实验动物之间不存在变异,所以对样本量不做特别要求。研究者只需考虑在研究过程中动物死亡的损耗率,适当增加样本例数即可。

确定样本量方法有以下两种:第一,根据允许的抽样误差范围确定样本量。如在excel里设置α、p和△的值;计算累积机率值;选择“NORMINV”函数;计算Z值,计算样本量。第二,根据特定目的确定样本量。 1.若将一个样本分成不同的组,要保证每组的样本量都不能低于100;2.当每组样本还需按不同的特性或配额划分成更小的组时,要保证每个小组的样本量至少在20-50之间;确定样本量要考虑样本结构、精度要求、调研经费以及总体特征易变性等因素。如果总体易变性强,或者个体之间的差异性大的时候,则需要适当增加样本量。

三、医学研究中样本量选择需要注意的事项

在医学研究中样本量的准确确定是一个难点。

必须考虑到,医学研究的成组设计。应尽可能采用样本量相等的设计,尤其是多组设计时,一般要求各组的样本量相等,只有在某些特殊情况下才考虑各组的样本含量不相等。

必须考虑到,在足够样本的前提下,满足样本选择的随机性所需要的最小样本量,以提高样本的均衡性,不能把随便、随意当作随机,使研究结果不可信。

必须考虑到,不同医学条件下的样本量选择。由于医学研究样本的特殊性,按照不同条件增加最低样本量;样本量过少要适当的增加样本量,使结果具有可靠性。

猜你喜欢

样本量正态分布总体
一种基于进化算法的概化理论最佳样本量估计新方法:兼与三种传统方法比较*
网络Meta分析研究进展系列(二十):网络Meta分析的样本量计算及精确性评估
样本量对云南松苗木生物量特征的影响
关于n维正态分布线性函数服从正态分布的证明*
家系抽样大小对云南松遗传力估算的影响
2020年秋粮收购总体进度快于上年
生活常态模式
外汇市场运行有望延续总体平稳发展趋势
直击高考中的用样本估计总体
正态分布及其应用