APP下载

基于“案例导入式”的统计学教学实践探讨

2017-10-17蔡宏宇

科学与财富 2017年27期
关键词:教学实践统计学

蔡宏宇

摘要:统计学作为收集、整理和分析数据的方法科学,其统计理论和方法较为枯燥难懂,“案例导入式”教学方法应运而生,本文主要从统计理论、统计方法、统计模型和统计分析四个大的方面阐述“案例导入式”教学方法的运用。

关键词:案例导入式;统计学;教学实践

统计学则是一门收集、整理和分析数据的方法科学。收集、整理和分析数据需要设计一些项目、确定收集资料的方式和方法、整理和分析数据的原理及技巧。因此,“案例导入式”教学方法实践主要从统计理论、统计方法、统计模型和统计分析四个大的方面进行阐述,重点介绍统计学中比较难以理解的部分内容,以抛砖引玉。

一、统计理论案例导入式教学实践

统计学以其严密的统计思维、科学的搜集、整理、分析数据信息的理论和方法,成为智慧学、大数据背景下数据科学家的摇篮。没有统计理论做基础,统计方法就无章可循。以“统计总体”和“标志”理论为例阐述统计理论案例导入式教学实践。

1.“统计总体”概念案例导入式教学实践

日常生活中,我们经常讲到“整体”,其实统计学管它叫做“总体”,那么,怎么界定?它具备哪些特征?

案例导入:我们这个班有包括贸易、金融、税收、财管、会展五个专业、同学们自不同地方、各自兴趣爱好不同、政治面貌不同、民族不同、有男女性别之分……,但大家有一点是相同的,那就是大家都选在同一时间和同一个老师一起学习《统计学》,因此组成了一个整体(临班0437),统计学称这个整体叫做“统计总体”。

“统计总体”概念和特征導出:“客观存在的、同一性质基础上结合起来的许多个别事物的整体”。具备大量性、同质性和差异性的特点。

2.“标志”概念案例导入式教学实践

统计总体中包括许多个体(总体单位),每一个个体具有不同的属性特征,即标志。标志其实就是标准、水准、测量依据等等,统计学中的标志定义怎么界定?

案例导入:临班0437同学按照“性别”标准可以划分为男同学和女同学;按照“民族”标准可以分为汉族、苗族、维吾尔族和土家族四个民族;按照“年龄”标准可以分为20周岁以下、20至21周岁、21周岁以上三个年龄段。

以上“性别”和“民族”分别说明了临班0437同学的性别和民族的品质属性,“年龄”说明了临班0437同学年龄的数量特征。

“标志”概念导出:“标志是指对客观现象总体内个体单位的属性和数量特征进行测量所依据的标准,或用来说明总体单位特征或属性的名称。分为品质标志和数量标志,前者不能用数量表现而只能用文字、符号或代码来说明;后者能用数量表现。

二、统计方法案例导入式教学实践

统计学中统计方法很多,如集中和离散趋势测度、时间序列分析测度、统计指数测度、抽样估计、假设检验以及相关和回归分析测度等。列举其中几个学生不容易理解和容易出错的统计方法实践案例导入式教学方法。

1.调和平均数案例导入式教学实践

案例导入:菜场上有1元钱起售的蔬菜,若早上购买每斤0.33元,中午购买每斤0.25元,下班后购买每斤0.2元,试问:早中晚各用1元钱购买的蔬菜平均每斤多少钱?

分析求解:根据算术平均数的定义,计算算术平均数,需要已知变量数列中某数量标志值之和与全部单位总数,题中虽然已知数量标志值之和,但总体单位数未知,然已知每次购买金额和单价,就可以每次购买金额除以每次购买单价得出早中晚三次的购买数量分别为3斤、4斤和5斤,这样就可以求出平均单价:

总结概括:这种算法是以支出额为权数,以每次购买单价为变量值,以变量值的倒数形式求出平均价格,称为简单调和平均数;如果每次购买金额不同,则用每次购买金额为权数进行加权求出平均数: ,这就是加权调和平均数。

上述案例:如果早、中、晚购买的金额分别是1元、2元和3元,则平均价格:

可见,调和平均数是在总体单位数未知的情况下求平均数的一种统计方法,也可以说是算术平均数的一种特例(详见“统计方法之间推导案例导入式教学实践”);简单调和平均数是加权调和平均数的特例。

调和平均数计算公式导出:调和平均数是各个变量值倒数的算术平均数的倒数。又称为倒数平均数。用H表示,分为: 简单调和平均数、加权调和平均数。

(1)简单调和平均数: (据未分组资料计算)

(2)加权调和平均数: (据分组资料计算)

2.序时平均数案例导入式教学实践

序时平均数是根据时间序列中各个时期或时点的发展水平即指标值加以平均所得到的平均数。因时间序列可分为绝对指标、相对指标和平均指标时间序列,所以序时平均数可分别不同序列求解。

因时点数列都是瞬间数据,两个时点之间一般都有一定间隔,因此,时点数列一般都是间断的。但如果时点数列的资料是逐日记录,且逐日排列的,这样的时点数列就可看作是连续的,无论是连续时点数列还是间断时点数列,都存在间隔相等和间隔不等两种情况,据此根据时点数列计算序时平均数,有以下四种方法。这里仅以间隔相等间断时点数列为例阐述案例导入式教学方法实践。

图1:时点数列计算序时平均数的四种情形

案例导入:已知某省2016年人口资料如表1,求该省2016年年平均人口数。

表1 某省2016年各季首人口资料

分析求解:已知5个时点数据,每两个数据之间距离相等,都是三个月,且均为各季首数据,即可先求出各季平均数,然后据各季平均数用简单平均法求全年平均数:

计算公式导出:时间数列是按间隔相等的时点数编制的,如月末、季末等职工人数、资产额、库存额等时间数列大都是间隔相等的时点数列;可假定现象在相邻两个时点之间的变动是均匀的;则可对相邻两个时点求简单算术平均数;然后将这些平均数相加除以平均数的个数,即为整个数列的序时平均数 ,称为“简单序时平均法”或“首末(尾)折半法”。endprint

3.统计方法之间推导案例导入式教学实践

统计方法之间由于已知条件的不同,方法之间可以互相转化,这里以算术平均数和调和平均数之间互相转化为例,阐述案例导入式教学方法的应用。

案例导入:菜场上有1元钱起售的蔬菜,若某人早上用1元钱购买了一种蔬菜共3斤,每斤0.33元;中午降价时又买了4斤,每斤0.25元;晚上削价处理时又用1元钱买了5斤,每斤0.2元,试问:某人早中晚各用1元钱购买的蔬菜平均每斤多少钱?

分析求解:上述问题根据不同的资料可用三种方法计算蔬菜的平均价格:

方法1,如已知早中晚各买1元钱,共3元,共计买了12斤菜,可用简单算术平均法计算平均价格:

方法2,如已知早上买3斤、中午买4斤、傍晚买5斤,又知价格分别为0.33元/斤、0.25元/斤、0.2元/斤,则可用加权算术平均数方法计算平均价格:

方法3,如已知早上买1元钱、中午买1元钱、傍晚也买1元钱,知道每次购买单价分别为0.33元/斤、0.25元/斤、0.2元/斤,但每次购买数量未知,根据加权算术平均数计算公式无法求出蔬菜的平均价格,需先根据每次购买金额和单价求出其数量,即求出平均单价公式的分母,再用总金额除以三次购买的数量之和,求出平均价格:

这种算法是以支出额为权数,每次购买单价为变量值,以变量值的倒数形式求出平均价格,称为简单调和平均数;如果每次购买金额不同,则用每次购买金额为权数进行加权求出平均数:

,這种计算平均数的方法称为加权调和平均数。

上述案例:如果早中晚购买的金额分别是1元、2元和3元,则平均价格:

总结导出:

(1)当权数m1都等于1时, ,可见简单调和平均数是加权调和平均数的特例;

(2)社会经济生活中,加权调和平均数,一般作为加权算术平均数的变形之式使用,当m=xf 时,

(3)由相对数或平均数分组资料计算平均数时,若已知分子、分母两个总量指标时,可直接对比求 ;若已知分母、缺分子资料时,可用加权算术平均法求 : ;若已知分子、缺分母资料时,可用加权调和平均法求 : 。可见由相对数或平均数计算的平均数,其实质就是数列的总相对数或总平均数。

三、统计模型案例导入式教学实践

这里以相关和回归最小二乘法模型为例,阐述统计模型案例导入法教学方法实践。

1.最小二乘法模型案例导入

从某高校2012级经济学专业45名同学中随机抽取了10位同学,收集到该样本的高等数学与统计学考试成绩资料如表2所示。要求:(1)拟合统计学成绩y倚高等数学成绩x之间的直线回归方程,并指出高等数学成绩每增加1分时统计学成绩如何变化?

表2 高等数学与统计学成绩分布表

俗话说“统计是半个数学”,数学基础的扎实与否直接影响到统计学成绩的高低。从统计学的角度分析,高等数学成绩与统计学成绩之间存在某种关系,这个关系的方向和程度直接影响到两者之间的模型拟合。运用高等数学成绩与统计学成绩原始数据绘制散点图(见图2),分析发现高等数学成绩好的学生,统计学成绩也比较好,它们之间存在一种正向变动关系,如果我们选择更多样本,就会发现同样的高等数学成绩可能有不同的统计学成绩相对应,可见它们之间不是严格的函数关系,而是一种相关关系。高等数学成绩决定统计学成绩,是自变量(外生变量),统计学成绩是因变量(内生变量),发现它们之间呈正线性关系,希望找到一条直线反映它们之间的这种关系,

实际中基本无法找到一条直线能通过所有高等数学成绩和统计学成绩形成的坐标点,因为就样本回归线 而言,每输入一个观察值 ,计算得到的回归值 往往不一定与实

图2 高等数学成绩与统计学成绩散点图

际观察值y1相等,很可能会存在一定的偏差,即: ;但可以找到这样一条直线,让高等数学成绩与统计学成绩形成的所有点到这条直线的距离最近,如离差分解图3所示,实际的点(x,y)到理论的点(x, )之间的距离越短直线所描述的高等数学成绩与统计学成绩关系越紧密,即实际统计学成绩与理论统计学成绩之间的离差 的绝对值越小越好,这个差值称为残差(受偶然因素影响),残差 的平方和刻划了全部观察值(相关点)与回归值的偏离程度。

图3 离差分解图

为反映总偏差,须把ei变成非负形式( , ,这就是最小二乘法模型原理。

2.最小二乘法模型参数估计

最小二乘法的依据是数学偏导数求极值的原理。其拟合的最优趋势线必须满足以下两个条件:(1)实际观察值yi与回归方程推算的理论值 的离差之和为零,即 ;(2)实际观察值 与回归方程推算的

理论值得离差平方和为最小 达到最小值。

参数估计过程:

/对上式求关于的一阶偏导数:

/该联立方程组经整理,得到以下规范方程组:

据此可得到截距 的计算公式:/

由此可求得样本回归模型: =a+bx

3.最小二乘法模型构建及诠释

根据案例数据可求得a、b两个参数:

把相关数据代入模型代入相关数据可得高等数学成绩与统计学成绩回归模型: ,可见高等数学成绩每增加一个分,统计学成绩平均增加0.97分。

四、统计分析案例导入式教学实践

统计分析方法较多,以统计指数因素分析为例,阐述“案例导入式”教学方法在统计分析中的实践。

1.因素分析案例导入

如果某公司只销售三种商品,它们报告期和基期的单价和销售量如表3。公司经理问:“作为统计员请告诉我报告期我们公司销售额增加多少?是什么因素引起的?这些因素分别影响多少?”公司数据如表3:endprint

表3 某公司销售资料

分析表3发现,因各种商品单位不同,无法直接汇总计算;但知道销售额等于商品单价乘以销售量,也就是公司销售额变动受单价和销售量两个因素影响,这两个因素中任何一个变动都会引起销售额相应变动;显然,报告期总销售额除以基期总销售额,就可计算出报告期发展速度;报告期总销售额减去基期总销售额,就可得到报告期销售额增减额;但这个发展速度和增减额中,有多少是因为销售量的变动引起的?又有多少是因商品单价变动带来的?

这是个因计量单位不同引起的无法综合计算的问题,需要运用综合指数。从而导出综合指数的概念和编制。

2.综合指数编制

(1)综合指数的概念。综合指数就是研究不能直接加总的复杂现象的综合变动程度的相对数,如消费品价格指数、股票价格指数等等。综合指数的编制需要引进两个概念:指数化指标和同度量因素。

指数化指标是指数所要测定其变化程度的那个因素。如销售量指数中的销售量就是指数化指标;同度量因素是指在编制综合指数时,将不能直接相加的指数化指标乘上另一个因素,使之可以相加,那个乘上的因素就是同度量因素。如销售量指数中的价格因素就是同度量因素。

(2)综合指数的编制原理

①物价综合指数:综合说明商品或产品价格综合变动程度的相对数,是质量指标指数。

为两个时期的价格,是物价指数要研究的对象,称为指数化指标; 为报告期物量,作权数,称为同度量因素。具有以下三个特点:其一,先综合后对比;其二,计算资料要求较全面;最后,综合指数分子和分母的差额称为“影响效果”, 即为价格变动对物值变动的影响额。

②物量综合指数:说明商品销量或产品产量综合变动程度相对数,它是数量指标指数。

:指数化因素; :同度量因素。

③物值综合指数:表明物值变动程度的总指数。

相对数:

绝对数:

可见,销售量和销售价格两个因素影响销售额,分析两者对销售额的影响时,在有现实经济意义的前提下,实现指数体系的成立,可以先假定销售价格(销售量)不变,分析销售量(销售价格)变动;因社会经济现象复杂不能直接综合,需要引进同度量因素,将同度量因素固定以消除同度量因素变动的影响;可见指数编制原则:编制数量指标指数时,其同度量因素固定在基期;编制质量指标指数时,其同度量因素固定在报告期。

(3)综合指数编制实践

根据导入案例数据资料,计算得出报告期、基期及假定销售额数据,如表4:

表4 某公司报告期与基期销售额数据

根据表4数据,代入综合指数公式,可求得该公司销售量、价格指数和销售额总指数:

解:

分析:该公司销售额报告期比基期增长89.1%,增加298.4万元;其中:因销售量增长19.1%,增加64万元;因销售价格上涨58.7%,增加234.4万元。

参考文献:

[1]Joan Garfield.Teaching Statistics Using Small-Group Cooperative Learning.Journal of Statistics Education , 1993,(1).

[2]J Martin Bland.Teaching statistics to medical students using problem-based learning: the Australian experience. BMC Medical Education BMC series ,2004, (4)

[3]伍亞舟,易东,张彦琦,刘岭,赵增炜,陈军..案例教学法在医学统计学教学中的应用[J].基础医学教育,2011,13(7):635~638.

[4]宋继华,宋华艳.基于项目驱动的统计学课程教学改革与实践研究[J].商业经济,2013,(4):118~119.endprint

猜你喜欢

教学实践统计学
关于投稿的统计学要求
统计学符号使用的说明
统计学符号使用的说明
统计学符号使用的说明
本刊对来稿中统计学处理的有关要求
本刊对来稿中统计学处理的有关要求
基于三维软件和云班课APP的机械设计课程教学实践
中职职业生涯规划课程的教学反思
中职计算机应用课程教学改革与反思
浅论高中化学生活化教学的实践与思考