APP下载

基于L8(27)改进高级医学统计一例

2022-12-13俞钟行

上海质量 2022年9期
关键词:极差回归方程避孕药

◆俞钟行/文

2×2×2列联表在医学、社会学领域应用颇广,正交表L8(27)在质量管理领域应用普遍。说起来,2×2×2列联表和正交表L8(27)都是处理3个因素2个水平8个数,但它们之间似乎从未有过交集。在跨界研究趋势的引导下,本文试用L8(27)来处理2×2×2列联表的一个较为高端的医学问题,发现其便利、直观、高效、精准,是一条值得尝试的路径。

1 .原例

《医学统计学(第四版)》[1]中采用病例对照研究,研究避孕药与等位基因在静脉血栓发生中的作用。该研究共调查324人,其中病例155人、对照169人,数据记录在表1的2×2×2列联表中,欲对避孕药与基因的交互作用进行分析。2×2×2列联表有3个维度,称为行、列、层,在表1中以X、Y、Z表示。每个维度有2个水平,不失一般性,这里以1和-1表示。应用列联表,往往是为了挖掘和展示数据中隐藏的关联,但有时还想对2×2×2列联表中的数据建模,这就要应用高级统计方法——对数线性模型及SAS软件了。

表1 基因与口服避孕药对照研究频数表

本例获得的最优模型为:μijk=exp(μ+λiX+λjY+λkZ+λikXZ+λjkYZ),比全模型少了二阶交互项XYZ和一阶交互项XY。

得到的理论频数如表2中相应括弧内的数字所示。

表2 基因与口服避孕药对照研究频数表

2 .基于L8(27)的改进

现在把基因与口服避孕药对照研究看作L8(27)正交试验,具体分析步骤如下。

①把表1中的8个数据填到表3最右列W的8个空格中,把它们看作是8次试验的结果;

②作极差分析,如X列、K(+1)行对应的174,是X列取1时对应的W列4个数的和,依次类推。可以用Excel的内置函数sumif来作K(+1)和K(-1)的计算,非常方便。X的极差(R)=174-150=24,依次类推。于是得到所有因素及交互作用的极差从大到小的排序,极差越大、排序越靠前,表明此因素或交互作用越强。可以看到此项研究的关注点——是否服避孕药(X)与不同基因类型(Y)的交互作用大小(以极差的排序表示)是最小的。

③在Excel装上“数据分析”模块,用其中的“回归”对表3的上9行、右8列作分析。因为作为“Y值输入区域”的W列只有8个数据,若把含因素的7列都放到“X值输入区域”内,回归会出错。但是把极差最弱的那列XY删去,再作回归,就可以得到很好的结果。见图1。

表3 基因与口服避孕药对照研究L8(27)分析

此图自上而下有3 个表。第一个表第1 行是复相关系数Multiple R=0.999975,标准误差=0.707107,都很好。第二个表Significance F其实就是方程的p值=0.013295,残差平方和/总计平方和=0.0005,都很小,说明回归方程拟合得好。第三个表的Coefficients列给出了回归方程的常数项、各因素及交互作用的系数,并且从P-value一列看到,没有超过0.10的,2/3的项在0.05以下。而且各因素、交互作用的极差排序与它的P-value排序是一致的,即极差越大则P-value越小。这给了我们启示,在数据建模时若需要删除项,就先删极差排序在最后的,因为它在回归方程里也是统计最不显著的。这相当于用“后退法”作逐步回归。建立数据模型-回归方程如下。

W=40.5+3X-30.25Y-1.75Z+12.75XZ+9YZ-8.5XYZ。

④把表3中8次试验X、Y和Z取的值代入上述回归方程,可以得到拟合值。它们和实测值相比,都是增大或减小了0.25。然而在表2中,理论值(即拟合值)和实测值的差距都超过0.25,所以,该“简单”方法比“高级”方法的结果要更好一点。

3 .关于“效应排序原则”的讨论

原例所选的最优模型中没有二阶交互项XYZ,好像很符合分析交互效应的“效应排序原则”[2]。它指出:(1)低阶效应应比高阶效应更重要;(2)同阶效应的重要性应是相同的。但是,它同时指出:这个原则在因子效应的数目较大而不能全部进行估计时特别有效,这是一个经验原则。本文讨论的例子只有3个因子,用L8(27)进行分析时,对所有低阶效应和高阶效应都作了完备的分析。而且,在作L8(27)极差分析时,明显地看到高阶效应XYZ比低阶效应XY、X和Z都强。同时,看到由于用基于L8(27)的方法时保留了XYZ项,所得的数学模型拟合得更好。《世界级质量管理方法》一书中有个“摩托罗拉波焊24全析因设计”的例子[3],由于16次试验可以估计所有的主效应和各阶交互作用,因此看到有个三因子交互作用就比有的二因子交互作用强,可见这种情况并非罕见。

猜你喜欢

极差回归方程避孕药
厘清概念 领悟意义
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
紧急避孕药怎么吃
四十岁以上的女性需少碰避孕药
线性回归方程知识点剖析
停服避孕药后,多久可以要宝宝
作弊
方差中亟待澄清的两个错误观点