APP下载

均值与位置平均数及分位数的关系

2013-09-20谢家发

市场研究 2013年9期
关键词:单科算术平均数

◇谢家发

在描述一组数据时我们常常用一些特征量来表示这组数据的集中趋势或典型水平。这些特征量代表这组数据的频数分布中大量数据向某一点集中的情况,从而反映数据资料的典型水平。例如:要对某学院2012届会计与统计核算专业所有毕业生各科成绩的集中趋势进行分析比较时,显然不能是各个毕业生之间的比较,而必须先计算出一个(或几个)代表本届该专业毕业生各科成绩水平的统计量,然后再对各科成绩的集中趋势进行比较分析。因为这些统计量既是表明本届该专业毕业生各科成绩中心点的统计量,又是表明本届该专业毕业生各科成绩最中间一点的统计量,还是表明本届该专业毕业生各科成绩出现最多的统计量,更是表明本届该专业毕业生成绩分布范围的统计量。

这些统计量之所以能代表本届该专业毕业生各科成绩进行相互比较,是因为它们从不同角度度量了本届该专业毕业生各科成绩集中于哪一点或哪些范围,因而通常称为集中趋势的度量。常用度量集中趋势的特征值有均值、中位数、众数和分位数等。均值又叫算术平均数,算术平均数是总体标志总量与总体单位总数之比值,是一种表示集中趋势最常用的统计量。位置平均数有众数和中位数,四分位数有下四分位数和上四分位数。现对某学院2012届会计与统计核算专业所有毕业生各科成绩分别计算了算术平均数、众数、中位数、下四分位数和上四分位数等,其结果如下表所示。

特征值科目 大学英语最小值下四分位数平均数中位数众数上四分位数最大值34.0 71.0 77.4 79.0 85.0 85.0 96.0大学语文1.5 85.0 88.4 88.0 90.0 92.0 98.0高等数学33.0 76.0 83.2 88.0 94.0 95.0 100.0基础会计26.0 76.0 82.8 86.0 91.0 92.0 100.0体育(一)70.0 82.0 84.8 84.0 80.0 87.0 99.0计算机应用基础65.0 82.0 86.7 89.0 91.0 92.0 100.0体育(二)1.0 83.0 86.4 86.0 80.0 90.0 100.0统计学原理33.0 73.0 80.7 84.0 88.0 90.0 100.0财务会计60.0 82.0 87.6 91.0 96.0 96.0 100.0企业经济统计46.0 77.0 84.5 87.0 92.0 93.0 100.0

续表

如果我们将以上这十九门课程的下四分位数、最大值、最小值、中位数和上四分位数五个特征值绘制成箱线图,结果如下图所示。

从图中不难看出各科成绩分布的均匀程度、集中趋势、分散程度等特点。总的来看,各科成绩的上四分位数与其对应的极大值之间距离都比较近,差异不大,说明有25%毕业生成绩分布在这个小范围内;而各科成绩的下四分位数与其对应的极小值之间的距离却远近不一,差别很明显,说明还有25%毕业生成绩分布在这个大小不等的范围内。但经仔细观察和分析,不难发现各科成绩分布存在以下三个特点:第一,体育(一)、收银与出纳技术、税法等课程的箱子最短,说明这些课程成绩的四分位差小,在上下四分位数之间云集了50%毕业生的成绩,同时上四分位数与极大值之间的距离以及下四分位数与极小值之间的距离也都很短,这也说明另外50%毕业生的成绩离中位数距离也不远,对整体均匀程度、集中趋势影响不大,所以单科成绩分布集中、均匀程度高,集中趋势特别明显;第二,相比较之下高等数学、会计电算化和基础会计等课程的箱子最长,说明这些课程成绩的四分位差大,在上下四分位数之间包括了50%毕业生的成绩,同时下四分位数与极小值之间的距离很大,这也说明另外25%毕业生的成绩离中位数距离很远,对整体均匀程度、集中趋势影响较大,所以单科成绩分布分散,均匀程度低,离中趋势十分明显;第三,还有大学语文、体育(二)和会计实务等课程的箱子虽然也很小,并且上四分位数与极大值之间的距离也很近,但是下四分位数与极小值之间的距离却很远,说明还有25%毕业生成绩分散在这个大范围之内,这就影响了单科成绩整体的均匀程度和集中趋势,自然这些课程均值的代表性也就远不如其它各科成绩了。

当单科成绩完全处于对称分布时,那么根据该科成绩计算的算术平均数、中位数和众数三者相等,即=Me=M0。这样上四分位数与中位数、均值或众数之差也就等于中位数与下四分位数、均值或众数之差,即 Q3-Me(或、M0)=Me-Q1(或、M0)。但是,当单科成绩非完全处于对称分布,而是处于右偏或左偏分布时,那么据此计算的算术平均数、众数、中位数、下四分位数和上四分位数之间却存在着各种不同的数量关系。比如,从表中对19门课程所分别计算的算术平均数、众数、中位数、下四分位数和上四分位数看,其中依据各科成绩计算的中位数、算术平均数均界于对应课程成绩上下四分位数之间,即大于下四分位数,小于上四分位数,用公式表示为:Q1<<Q3,Q1<Me<Q3。而众数与四分位数的关系却比较复杂。第一种现象,有的课程成绩计算的众数是介于对应课程成绩上下四分位数之间。比如表中“高等数学”这门课程成绩的下四分位数、众数和上四分位数分别是76分、94分和95分;再比如表中“基础会计”这门课程的情况也是如此。第二种情况,也有的课程成绩计算的众数是介于对应课程成绩上四分位数或下四分位数之外。比如表中“体育(二)”这门课程,该课程成绩的众数是80分、下四分位数是83分,所以该门课程成绩的众数小于下四分位数;而表中“会计电算化”这门课程情况却相反,该课程成绩的众数是95分、上四分位数是92分,因此该门课程成绩的众数又大于上四分位数。第三种情况,还有的课程成绩计算的众数是与对应课程成绩上四分位数或下四分位数相等。比如表中“大学英语”这门课程,该课程成绩的众数是85分、上四分位数也是85分,所以该门课程成绩的众数等于上四分位数;又比如表中“收银与出纳技术”这门课程,该课程成绩的众数是83分、下四分位数也是83分,所以该门课程成绩的众数等于下四分位数。由此我们不难得出如下结论:在不同的情况下,众数既可以在上下四分位数之间,即Q1<M0<Q3;也可以在上下四分位数之外,即M0>Q3或M0<Q1;还可以与上四分位数或下四分位数相等,即 Q1=M0,Q3=M0。

同时,在单科成绩分布呈现右偏或左偏时,所计算的算术平均数、中位数和众数三者之间还分别存在三种情况。当单科成绩分布右偏时,众数始终是最大,算术平均数最小,中位数居中,即<Me<M0。比如表中“基础会计”这门课程成绩的算术平均数、中位数和众数分别是82.8分、86分和91分。但也有算术平均数等于中位数而中位数又小于众数的情况,即=Me<M0。或者是算术平均数小于中位数而中位数又等于众数的情况,即<Me=M0,比如表中“税法”这门课程成绩的算术平均数、中位数和众数分别是82.77分、84分和84分。当单科成绩分布左偏时,众数始终是最小,算术平均数最大,中位数居中,即>Me>M0。比如表中“收银与出纳技术”这门课程成绩的算术平均数、中位数和众数分别是87.5分、86分和83分。但也有算术平均数等于中位数而中位数又大于众数的情况,即;=Me>M0,比如表中“财务会计”这门课程成绩的算术平均数、中位数和众数分别是84分、84分和83分。或者是算术平均数大于中位数而中位数又等于众数的情况,即>Me=M0。

综上所述,算术平均数、众数、中位数、下四分位数和上四分位数在总体分布不是完全对称的情况下,它们之间的数量关系各有不同,在进行数据分析时尤其需要重视,否则会得出完全相反的结论。

猜你喜欢

单科算术平均数
基于一体化、项目教学的技工院校单科精进教学改革探讨
2018上海“三校生”高考最低录取控制分数线确定
不一样的平均数
算算术
学算术
关注加权平均数中的“权”
平均数应用举隅
说说加权平均数
小狗算算术
做算术(外一则)