APP下载

利用流行病学计算器EpiCalc 软件审核科技论文中的流行病学数据

2015-03-22

中华医学图书情报杂志 2015年7期
关键词:该软件均数流行病学

在科技期刊论文中,数据的重要性不言而喻。但作者计算方法不当或笔误而导致的错误数据时有发生。如果不能及时发现这些错误,不但会影响论文的正确表达,还会影响杂志的声誉。因此科技期刊编辑,一定要重视数据审核[1]。

编辑面对论文中的数据时,除了依靠科学常识、逻辑方法[2]、审稿专家的意见,以及高度的责任心外[3],还要有专业的复核工具。最常用的是计算器、Excel加载项中的数据分析工具以及SAS、SPSS、STATA等专业统计软件,然而这些工具不如流行病学计算器EpiCalc(Epidemiology Calculator)软件实用和方便。EpiCalc软件是英国的 Joe Gilman和Mark myatt 于1997年共同开发的用于流行病学二次数据处理的免费软件,供流行病学、统计学专业和临床专业等人员使用。自从该软件投入使用以来,很多文献从不同方面对该软件的使用进行了介绍[4-6],但未采用更权威的工具进行验证。笔者结合实例介绍EpiCalc的同时,利用SAS 8.2软件对其进行了验证。

1 EpiCalc 软件介绍

该软件安装程序可免费下载(下载地址http:∥www.brixtonhealth.con/ec2v102.exe),主界面如图1所示。

图1 EpiCalc软件的主要界面

其主要功能有:计算可信区间,根据两组的均数、标准差和样本例数比较两总体均数的差别(图2),进行四格表的χ2检验或计算Fisher确切概率,进行R×C表的χ2检验(图3)。此外还可进行拟合优度检验、样本含量的估计和分层、分级资料的统计分析,以及据统计量值和样本例数计算概率。

图2 EpiCalc软件进行两总体均数比较的界面

图3 EpiCalc软件进行R×C表χ2检验的数据输入界面

2 用EpiCalc软件审核科技论文中流行病学数据的优势

2.1 实用

2.2 易学

相对于功能强大的专业统计学软件,如SAS,SPSS,STATA等,EpiCalc软件更容易掌握。SAS和STATA软件需要编程[7],对于编辑而言,能使用的功能并不多,专门安装和学习这些软件未免有些“大动干戈”;SPSS软件不需编程,但通常需要提供原始数据,而且掌握基本的SPSS知识也需要花一番功夫;利用计算器和Excel,也能进行一些简单的统计学分析,但过程比较繁杂,且容易出错。而掌握EpiCalc软件则相对容易,具有基本统计学知识的编辑,只需自学2个小时即可熟练应用。

2.3 方便

该软件可免费下载,且安装程序小、操作简单、启动快速。编辑在审阅或加工稿件时,可随时启用,就像用计算器一样方便。同时,该软件界面简单,数据录入方便,结果简洁易懂,非常方便编辑使用。

3 利用EpiCalc 软件审核数据的案例分析

3.1 审核《脓毒症患者并发急性肺损伤危险因素分析》中的数据

在《脓毒症患者并发急性肺损伤危险因素分析》一文中,死亡组(n=19)与存活组(n=17)的呼吸分别是(33.0±5.3)次/min、(30.2±3.0)次/min,两组比较有统计学意义(P<0.05)。对此类表面上看差别不大的数据,有必要进行复核。打开EpiCalc软件,选择compare,再依次选择means和two means(图1)。出现界面如图2,confidence level(可信度)选择默认的95%,将两组的样本例数、均数、标准差填入对应的空栏中即可。结果显示:t=1.92,对应的P=0.0634(图4),说明两组总体均数的差别没有统计学意义,与原文结论正好相反。

图4 EpiCalc软件t检验结果界面

笔者对上述数据同时利用SAS 8.2软件进行验证,程序为:

data aa;

n1=19;

n2=17;

m1=33.0;

m2=30.2;

s1=5.3;

s2=3.0;

sc2=(s1**2*(n1-1)+s2**2*(n2-1))/(n1+n2-2);

st=sqrt(sc2*(1/n1+1/n2));

t=tinv(0.975,n1+n2-2);

in=t*st;

lclm=abs(m1-m2)-in;

uclm=abs(m1-m2)+in;

proc print;

var lclm uclm;

run;

结果:lclm=-0.1656,uclm=5.7656。lclm和uclm分别表示两均数相差95%可信区间的下限和上限。如果该区间包含0,则表示两组均数无统计学差别,该结论与EpiCalc软件结论一致。

3.2 审核《对全髋与全膝关节置换术后LMWH应用时机的初步研究》中的数据

在《对全髋与全膝关节置换术后LMWH应用时机的初步研究》一文中,THA组内与TKA组内DVT发生率差异均具有极显著统计学意义(P=0.000)(表1)。

该文的主要问题是不能采用χ2检验,应该采用Fisher确切概率法,因为2×2列表中期望频数太小,有2个格子的频数小于5。打开EpiCalc软件,选择tables,再选择2-by-2 unstratified(2×2表,未分层),展开界面见图5,将2、30、2、47输入对应的空栏中,同时选择左下角的Perform Fishers exact test(确切概率法),结果发现THA组术后DVT发生率比较没有统计学差异(P=0.6456)(图6),TKA组内DVT发生率也无统计学差异(P=1.0000)。

表1 人工关节置换术后使用LMWH组与延期72 h使用LMWH组术后DVT发生率

图5 EpiCalc软件四格表展开界面

图6 EpiCalc软件四格表统计检验结果

同样,利用SAS 8.2软件对THA组术后DVT发生率比较进行验证,程序为:

data aa;

do r=1 to 2;

do c=1 to 2;

input f @@;

output;

end;

end;

cards;

2 30 2 47

proc freq;

weight f;

tables r*c/chisq expected nopercent;

run;

结果见图7,确切概率(双侧)=0.6456,同EpiCalc得出的结果一样;同样,TKA组内DVT发生率也无统计学差异(P=1.0000)。

图7 SAS8.2软件验证部分结果界面

4 结束语

科技论文中的结果部分,大多数都需要用数据表达,其形式有的简单,有的复杂,涉及的统计学方法也多种多样[8]。科技期刊的编辑不可能对文章中的所有结果进行复核,因为有些结果是需要提供原始数据的。因此,编辑只能根据论文中的现有数据进行复核,涉及的统计学方法相对简单,一般包括两组之间的t检验、四格表及R×C表的χ2检验、Fisher确切概率法等。

通过复核,可以达到两个目的:一是可以确认部分结果是否准确;二是可以判断作者的科研态度及统计分析能力,从而为编辑取舍或退修稿件提供参考[9]。有些稿件表面上看没有问题,且行文流畅、结构严谨,但审核结果中的数据却错误百出,对于这样的稿件也只能做退稿处理了。因此,对论文中的数据进行审核非常必要,选择一个好的审核工具则可以达到事半功倍的效果。

猜你喜欢

该软件均数流行病学
昆明市院前急救患者流行病学的调查
简单灵活 控制Windows 10更新更方便
新型冠状病毒及其流行病学特征认识
猪繁殖与呼吸综合征区域流行病学调查
猪繁殖与呼吸综合征病原流行病学调查
关于均数与偏差
关于均数与偏差
Allen & Heath推出GLD Editor控制软件
捉拿李鬼
DVD影碟无损复制的利器