APP下载

Excel统计分析功能在医学检验(高职)教学中的应用

2018-12-27张雁磊

信息记录材料 2018年1期
关键词:压积数组频数

张雁磊

(菏泽家政职业学院 山东 菏泽 274300)

Excel统计分析功能在医学检验(高职)教学中的应用

张雁磊

(菏泽家政职业学院 山东 菏泽 274300)

Excel具有强大的统计分析功能,这些功能完全可以满足医学检验教学(高职)过程中的和学生在以后在工作中分析数据的要求。

Excel;统计分析;应用

1 引言

统计学是一门处理数据的科学,处理数据一般来说就是对数据进行计算,而统计学的数据大部分是通过统计调查得到的,这些数据大部分都十分庞大,并且计算比较繁杂,人工计算一般来说实现不了。现在在统计分析中常用的软件主要有SAS、SPSS、R、STATA,而这些统计软件没有汉化并且要求使用者有一定的编程基础,所以对于大部分高职学生来说要想熟练运用上述统计软件是非常困难的。Excel作为Office组件之一已经汉化,并且现在它的使用已经相当普及,而其身附带的统计函数相当完善,完全可以满足在高职统计教学和学生日后在工作中分析数据的需要。本文首先对常用的统计函数分类介绍,然后通过实例说明其在统计分析中的应用。

2 统计函数的分类介绍

2.1 描述性统计分析函数[1]

以上函数中参数可以是数字、数组和引用,但参数的个数不能为0,也不能超过30个。

2.2 频数统计函数

(1)单项式分组的频数统计函数:=COUNTIF(range,criteria)

range为所要统计频数的数据所在的区域;criteria为函数计数的条件。

(2)组距分组的频数统计函数:=FREQUENCY(data_array,bins_array)

data_array为一个数组或对一组数值的引用,统计的就是它出现的频率。如果data_array中不包含任何数值,函数FREQUENCY将返回一个零数组;bins_array是一个区间数组或对区间的引用,该区间用于对data_array中的数值进行分组。

2.3 常用的概率分布函数[2]

(1)二项分布函数:=BINOMDIST(number_s,trials,probability_s,cumulative)

number_s为成功试验的次数;trials为试验的总次数;probability_s为每次试验中成功的概率;cumulative为一逻辑值,如果cumulative=1,返回累积分布函数,即至多number_s次成功的概率;如果cumulative=0,返回概率密度函数,即number_s次成功的概率。

(2)Poisson分布函数:=POISSON(x,mean,cumulative)

x为事件数;mean为Poisson分布的期望值;cumulative同二项分布函数中cumulative的作用。

(3)正态分布函数:=NORMDIST(x,mean,Standard_dev,cumulative)

x为需要计算其正态分布的变量;mean正态分布的数学期望;Standard_devStandard_dev为正态分布的标准差;cumulative同二项分布函数中cumulative的作用。

(4)t-分布函数:=TDIST(x,degrees_freedom,tails)

x为需要计算其t-分布的变量;degrees_freedom为 t-分布的自由度;tails指明t-分布函数的尾数,tails=1,函数TDIST返回单尾分布,如果tails=2,函数TDIST返回双尾分布。

(5)F-分布函数:=FDIST(x,degrees_freedom 1,degrees_freedom 2)

x为需要计算其F-分布的变量;degrees_freedom 1为F-分布函数分子的自由度;degrees_freedom 2为F-分布函数分母的自由度。

(6)χ2分布函数:=CHIDIST(x,degrees_freedom)

x为需要计算其χ2分布的变量;degrees_freedom为χ2分布函数的自由度。

2.4 参数估计函数

(1)t-分布临界值函数:=TINV(probability,degrees_freedom)

probability为双尾t-分布的概率;degrees_freedom为t-分布函数的自由度。

(2)正态分布临界值函数:=NORMINV(probability,m ean,Standard_dev)

probability为双尾正态分布的概率;mean为正态分布的数学期望值;Standard_dev为正态分布的标准差。

(3)χ2分布临界值函数:=CHIINV(probability,degrees_freedom)

probability为χ2分布的单尾概率;degrees_freedom为χ2分布函数的自由度。

(4)F-分布临界值函数:=FINV(probability,degrees_freedom 1,degrees_freedom 2)

probability为F-分布函数累积分布相关的概率;degrees_freedom 1为probability分布函数分子的自由度;degrees_freedom 2为probability分布函数分母的自由度。

2.5 假设检验函数

(1)z-检验函数:=ZTEST(array,μ0,б)

array为用来检验μ0的数组或数据区域;μ0为被检验的值;б为样本总体的标准差,此参数如果省略,则使用样本标准差。

(2)t-检验函数:=TTEST(array1,array2,tails,type)

array1为第一个数组或数据区域;array2为第二个数组或数据区域;type指明t-分布曲线是单尾还是双尾。

(3)χ2检 验 函 数:=CHITEST(actual_range,expected_range)

actual_range为实际观测频数所在的区域;expected_range为理论频数所在的区域。

(4)F-检验函数:=FTEST(array1,array2)

array1第一个数组或数据区域;array2第二个数组或数据区域。

2.6 相关分析函数

Pearson相关系数:=CORREL(array1,array2)

array1、array2为进行相关分析两组数据所在的单元格区域。

2.7 回归分析函数

(1)斜率函数:=SLOPE(knowen_y's,knowen_x's)

knowen_y's为反应变量的观测值或数据集合所在的区域;knowen_x's为解释变量的观测值或数据集合所在的区域。

(2)截距函数:=INTERCEPT(knowen_y's,knowen_x's)

knowen_y's、knowen_x's同斜率函数中的解释。

(3)回归直线函数:=LINEST(knowen_y's,knowen_x's,const,stats)

knowen_y's是关系表达式y=mx+b中已知的y值集合;knowen_x's是关系表达式y=mx+b中已知的可选x值集合;const为一逻辑值,用于指定是否将常量b强制设为0;stats用于指定是否返回附加的回归统计值。

(4)判定系数:=RSQ(knowen_y's,knowen_x's)

knowen_y's为反应变量的观测值或数据集合所在的区域;knowen_x's为解释变量的观测值或数据集合所在的区域。

3 Excel在医学检验中的应用举例

3.1 问题描述与案例说明[3]

在医疗领域中对于症状的发展早期诊断一直是一项重要的任务,大量的案例积累为早期诊断的研究提供了重要的基础依据。而Excel为分析研究这些基础性资料并得到相关的结论提供了有力的工具。为此选取北京儿童医院的“围手术期输血与先天性巨结肠症术后感染”为例,讲解Excel在医学检验中的应用。数据见表1。

表1 围手术期输血与先天性巨结肠症术后感染数据

3.2 分析与分析思路

本案例的分析思路如下,首先利用方差分析方法分析不同手术持续时间的结果是否存在显著差异;然后利用回归分析方法建立回归函数,从而得到影响术后感染的主要因素。

3.3 案例中使用Excel计算结果如表所示。

(1)方差分析,见表2。

表2 Excel单因素方差分析数据

(2)回归分析,见表3。

表3 Excel回归分析数据

3.4 结果分析

(1)手术时间对术后感染情况的结果分析

从表2中可以得到手术时间对术后感染无显著影响检验的P值为0.0000,小于显著水平0.05,因此可以认为手术时间对术后感染有显著影响。

(2)术后感染情况影响因素的分析

表3中的“回归统计”输出的结果了用性别、月龄、红细胞压积、手术时间、失血量、输血次数、输血量来解释术后感染与否的能力,具体给出了R、R2调整后R2以及标准误和观测值。在本例中回归模型调整的R2为0.52,说明回归的拟合度一般。

表3中的“方差分析”,得到回归部分的F值为4.51,相应的P值为0.006,小于显著水平0.05,因此可以判断由性别、月龄、红细胞压积、手术时间、失血量、输血次数、输血量等指标对术后感染与否的解释能力比较显著。

表3中最后一部分给出了线性回归模型的回归系数及相应的统计量,从该部分可得到线性回归模型中的性别、月龄、红细胞压积、手术时间、失血量、输血次数、输血量的系数。另外,线性回归模型中的红细胞压积、手术时间、输血次数、输血量四个指标的T值分别为2.07、2.02、2.98、3.99,相应的P值为0.05、0.06、0.009、0.001,说明系数显著,即样本术后感染与否高度受红细胞压积、手术时间、输血次数、输血量四个指标的影响;而性别、月龄和失血量的T值很小,对应的P值均大于0.1,说明系数不显著,即性别、月龄和失血量三个指标在该回归模型中对样本术后感染与否没有显著影响。

[1]方积乾卫生统计学[M].人民卫生出版社,2015.

[2]魏宗舒概率论与数理统计教程[M].高等教育出版社,2008.

[3]张联锋Excel统计分析与应用[M].电子工业出版社,2013.

R197.39 【文献标识码】A 【文章编号】1009-5624(2018)01-0093-03

猜你喜欢

压积数组频数
JAVA稀疏矩阵算法
红细胞压积与白蛋白差值在继发性腹腔感染患者病程中的变化
JAVA玩转数学之二维数组排序
血小板压积和血小板分布宽度对评估急性脑梗死静脉溶栓治疗的意义分析
不同年龄比格犬红细胞压积、生理脆性的测定
更高效用好 Excel的数组公式
中考频数分布直方图题型展示
学习制作频数分布直方图三部曲
频数和频率
寻找勾股数组的历程