APP下载

高一学生化学学科能力性别差异研究

2016-04-20马宏佳南京师范大学教师教育学院江苏南京210097

化学教与学 2016年1期
关键词:性别差异

张 敏 马宏佳(南京师范大学教师教育学院 江苏南京 210097)



高一学生化学学科能力性别差异研究

张敏马宏佳*
(南京师范大学教师教育学院江苏南京210097)

摘要:性别差异是教育中一个不可忽视的重要因素。为发现学生的化学学科能力是否存在和存在怎样的性别差异,本研究基于项目反应理论和Rasch模型,通过对134名高一学生进行问卷调查,并用Winsteps3.72.0、SPSS17.0和Excel对问卷结果进行量化处理,发现男生和女生在化学学科能力上存在性别差异,尤其在设计和评价与化学有关的科学探究能力上男生明显高于女生。

关键词:Rasch模型;化学学科能力;性别差异

一、问题的提出

现阶段各国中学大多数实行的是班级授课制,它能大规模地面向全体学生进行教学,教学效率高,但是在这样的班级模式下,教师很容易忽视性别差异。尤其是在我国,长期提倡“时代不同了男女都一样”,关注教学中性别差异问题更为稀少。而现代教育的基本理念是以人为本,关注学生个性发展。显然,教学中考虑男女生的性别差异是必要的。因此,高一学生的化学学科能力是否存在和存在怎样的性别差异,就成为一个值得研究的问题。

二、研究设计

为了测查高一学生化学学习能力的性别差异,我们选择南京市一所普通高中的134名高一学生为研究对象,以陈功设计的高一学生化学学科能力测试卷作为化学学科能力测试工具[1]。陈功的测试卷基于Rasch模型原理设计,并经由大样本测试证明了其符合Rasch模型理论预期,具有良好的信度、效度。我们在研究中仅对该测试卷中的少量题目表述做了微调。

学生在规定的时间和有教师在场的情况下独立完成测试卷,再利用Winsteps3.72.0、SPSS17.0和Excel对试卷进行处理分析,进而得出研究结论。

三、Rasch模型简介

为了克服传统测试存在的“工具依赖”(被试成绩高低与试题难度有关)和“样本依赖”(题目难度与被试水平有关)缺陷,上世纪60年代,丹麦数学家乔治·拉希(Georg Rasch)创立了Rasch模型[2]。其数学表达式为其中θn是被试n的能力值,δi是试题i的难度值,Pni是被试n答对试题i的概率,当θn=δi时,可以得出Pni=0.5,即当题目的难度与被试的能力水平相等时,被试答对该题的可能性是50%,被试能力值越大,试题难度值越小,被试通过的概率越接近于1。通过这个数学表达式我们可以看出它同时考虑了被试的能力和项目的难度,所以克服了“样本依赖”和“工具依赖”的局限性。

在Rasch模型中,被试的能力值和项目的难度值是依据被试答题结果运用最大概率估计法估算出的,估算可通过一定的计算机程序如Winsteps等实现[4]。Rasch模型中的能力值和难度值都是对数型的(分值差1即是差10倍,差2既是差100倍,与分数段无关),从而实现了二者采用同一个等距的量规。

运用Rasch模型时,测试工具和测试对象的反应要满足模型各理论参数要求,即与理论模型相拟合,如果不拟合,则需要修改测试题目直至拟合。

四、研究过程

(一)测试工具

本研究采用了陈功编制的化学学科能力测试工具,其将化学学科能力分成三个维度:科学的解释化学现象、设计和评价与化学有关的科学探究、科学的理解实验资料和事实。题目编制时主要参照了PISA2006中的情境式试题,在情境中考察学生的以上三种能力。笔者对测试工具的修订主要包括导语的修订、情境的修订、题项的修订和评分标准的修订等。整套测试卷设计了四个情境:一、玉米燃料和温室效应;二、自来水安全吗?三、雾霾和酸雨;四、从燃素说到氧化说。每个情境下设计5-6个小题,共有23个小题。如:

从燃素说到氧化说

1703年,德国医生兼化学家贝歇尔和他的学生施塔尔共同提出著名的燃素学说来解释燃烧现象。燃素说学者认为:燃素存在于一切可燃物中,在燃烧过程中释放出来,同时发光发热。燃烧是分解过程:

可燃物=灰烬+燃素

金属=锻灰+燃素

如果将金属锻灰和木炭混合加热,锻灰就吸收木炭中的燃素,重新变为金属,同时木炭失去燃素变为灰烬。木炭、油脂、蜡都是富含燃素的物质,所以燃烧起来非常猛烈,而且燃烧后只剩下很少的灰烬;石头、草木灰、黄金不能燃烧,是因为它们不含燃素。

后来,拉瓦锡通过精确实验发现燃素说有其自相矛盾的地方。他认为可燃物质的燃烧或金属变为锻灰不是分解过程,而是与氧化合的反应。他的《燃烧概论》系统地阐述了燃烧的氧化学说,其中引用的一个重要实验是一定量的白磷在空气中充分燃烧。

请回答以下问题:

1.拉瓦锡想要利用白磷燃烧的实验证明燃烧是化合而不是分解过程,他需要提供什么证据?并做如何说明?

2.拉瓦锡还需要做如何的实验设计,才能说明白磷燃烧是与空气中的氧化合?如何说明?

3.磷的燃烧实验还可以用来测量空气中氧气的含量。但由于燃烧产物P2O5有一定腐蚀性,有人认为该反应不太环保。小明想尝试使用镁替代磷,测定空气中的氧气含量,装置图如下。

(1)请填写以下实验步骤:

①按图装配仪器,盛装所需物品。

②_______,关闭止水夹。

③引燃打磨后的镁条,迅速插入集气瓶中,等待镁条燃烧完毕后,________,打开止水夹。

④测量进入集气瓶中的水的体积和集气瓶的总体积。

(2)实验按上述步骤正确操作,但实验结束时发现,进入集气瓶中的水的体积大约为集气瓶总体积的70%,可能的原因是:____________________。

(3)镁条燃烧产生的固体在水进入集气瓶后部分溶解,生成白色絮状沉淀和刺激性气味的气体,且在反应后溶液中滴加酚酞出现红色。试推测溶解过程发生的反应:(用反应方程式表示)

其中第1题旨在考查学生设计和评价与化学有关的科学探究的能力,此题的Rasch赋分方式为:

2分:证据:白磷初始的质量和生成的五氧化二磷(或白烟)的质量(或反应前后磷的质量差);说明:白磷燃烧产物质量比白磷质量要大,表明燃烧并不是白磷中燃素的分解,而是白磷和氧气的化合反应;

1分:只说明将白磷燃烧,称量其产物质量,没有说明质量差;

0分:其他答案或未作答。

(二)资料的收集

本研究调查了南京某高中高一四个班级的学生,共发放问卷134份,回收问卷133份,有效问卷115份。2015年5月上旬测试,测试时间为50min。笔者负责问卷的发放和回收并得到该校化学教研组长的协助。

(三)数据的分析处理

1.整体信效度分析

下表是基于Rasch模型的被试和项目的整体信效度分析。

表1 测试工具整体质量分析

Rasch测量模型将项目的平均难度设置为0,被试能力平均水平随不同测试对象而有所不同,本测试中被试平均能力水平为-0.82,说明测试卷相对于被测样本而言偏难。Infit和Outfit的MNSQ值和ZSTD值均接近理想值(MNSQ接近1,ZSTD接近0[5]),说明测试数据与理想模型有很好的拟合。项目分离度4.95(大于2为好[6])和分离可靠性0.96(接近1为好[7])均非常高,体现了项目良好的区分度。对于被试而言分离度和分离可靠性相对较低(但也是可接受的,分离可靠性>0.65[8]),说明被试能力水平层次差异较小,考虑到所测试的样本量不大,且来源于同一所学校,以上结果还是比较真实的。

2.单维性检验

单维性是Rasch模型的基本要求之一,即要求所要测量的是一种(而非多种)心理结构。图1是标准残差图,主要鉴别是否有其它可能的因素影响被试的反应。

图1 标准残差图

图中大小写字母代表着各个项目,横坐标是项目难度,左边纵坐标是当主要变量或结构被控制后,项目分数与另一潜在变量之间的相关系数,右边纵坐标是某一相关系数上对应的项目数。若某测试项目的相关系数在-0.4~0.4之间,则认为该测试项目测量的是被试某一种特定的心理结构或能力[9]。由图可知,大部分项目的相关系数都在可接受范围之内,可以认为每一道题目测量的是一种能力。

3.试题难度与学生能力匹配度检验

Rasch模型通过将原始分转换为logit分,将被试能力、项目难度放在同一把量尺上进行比较[10],图2是本测试结果的项目-被试对应图。

图2 化学学科能力测试工具怀特图

图中间竖线是logit刻度尺(M、S、T分别代表平均水平、1个logit、2个logit),表示所测量变量。刻度尺右侧是测验卷中23个项目的分布情况,从下到上题目难度逐渐增大。刻度尺左侧是学生能力水平分布,每一个“#”代表一定数量的学生,从下到上学生能力逐渐增强。由图可见,23个项目的难度范围较广;被试的能力分布也较为理想,基本呈正态分布。因为测试样本来自于非重点中学,故学生能力大多分布于项目的下部分,整个测试卷偏难。虽然其中部分题目未捕捉到能力相当的被试,但男女同学用的是同样的测试卷,该不足因抵消而可被忽略。

4.项目拟合度检验

表2 测验项目拟合、误差统计

T0305 -0.16 0.12 0.87 -1.20 0.74 -1.60 0.49 T0204 -0.17 0.12 0.37 -7.50 0.44 -4.20 0.44 T0403a2 -0.23 0.12 0.90 -0.90 0.78 -1.40 0.59 T0302 -0.34 0.12 1.23 2.3 1.14 1.00 0..34 T0105 -0.37 0.12 0.66 -4.0 0.62 -3.10 0.57 T0104 -0.47 0.11 0.57 -5.70 0.56 -4.00 0.45 T0403a1 -0.49 0.11 1.16 1.80 1.15 1.20 0.38 T0301a -0.57 0.11 1.25 2.80 1.17 1.40 0.33 T0201 -0.64 0.11 1.36 4.10 1.47 3.80 0.20 T0202 -1.00 0.11 1.19 2.20 1.18 1.60 0.37 T0101 -1.15 0.11 1.46 4.60 1.68 4.60 0.11 T0102b -1.60 0.13 1.08 0.70 0.94 -0.20 0.45 T0103 -1.74 0.13 1.35 2.30 1.57 2.30 0.17

由表可以看出,项目难度在-1.74~2.15之间,除了项目T0403c,其他项目的标准误差都在0.11~0.30之间。检验测试结果与模型预期一致性程度的两个基本指标是MNSQ(0.7~1.3)[11]和ZSTD(-2~2)[12],其中除了项目T0204、T0105和T0104,其他基本都在理想值范围之内,同时发现这三个项目的MNSQ均小于0.7,说明被试们在此项目上的反应过于一致,但总体来说项目的拟合度是可以接受的。

五、测试结果与分析

分别算出男女生测试结果的Rasch分,再运用SPSS17.0对相关数据进行分析,得到被试化学学科能力及学生性别的描述性统计如下:

表3 化学学科能力及学生性别的描述性统计

研究结果表明:

从男女生比较看,男生能力A、能力B和能力C的平均水平都高于女生。男生和女生在能力B(设计和评价与化学有关的科学探究能力)上存在显著性差异(F=8.809;P=0.004);在能力C(科学的理解实验资料和事实能力)上也存在显著性差异(F=4.045;P=0.047);在能力A上也有差异,但没有达到显著水平。

从男女生群体看,男生是能力B>能力C>能力A,女生是能力A>能力C>能力B。即男生在设计和评价与化学有关的科学探究这个能力上水平最高,而女生此能力水平却最低。

六、讨论与思考

以上结果是有点出乎我们意料的,因为目前女生比男生优秀似乎是很普遍的现象,比如在南师大,不论化学专业本科生还是研究生,都是女生比男生多,其他许多高校也有类似现象。结合对测试答案的具体分析,我们认为产生以上结果的原因可能有以下两方面:

(1)教育模式的影响。在目前考试选拔方式长期影响下,很多中小学老师倾向于以能出好成绩的教学目标引导学生,相对于男生来说女生更倾向于“听老师的话”,记住老师教的和书本上有的教学内容,探究和质疑的能力相对薄弱。比如在面对“拉瓦锡还需要做怎样的实验设计,才能说明白磷燃烧是与空气中的氧化合?如何说明?”这个问题时,女生的回答普遍是分别将白磷与氧气和其它气体反应,比较反应产物。这样的回答只考虑到了设置对照实验这一角度;而很多男生的回答则是考虑到了氧气的体积约为空气体积的,采用气压差法,通过判断倒吸到瓶中的水的体积约为瓶子总体积的,从而判断白磷是与氧化合。女生倾向于单纯运用书本上的知识,而男生更倾向于将学过的知识联系到一起去解决这个问题。

(2)思维风格的差异。男生一般倾向于独立思考问题,对问题的宏观把握较好,能够综合的看待问题,理清问题之间的联系;女生通常注重细节的把握,但常因注重细节而缺少了对全局的掌握,处理问题缺乏宏观性。比如题目“用镁代替磷测定空气中氧气含量,但实验结束时发现,进入集气瓶中的水的体积大约是集气瓶总体积的70%,可能原因是?”对这个问题的回答,有12名男生考虑到是Mg还与空气中的其它气体反应,比如氮气、少量CO2。而女生的答案基本上都是Mg与CO2反应。Mg的确会与CO2反应,但是女生却忽略了CO2在空气中的含量极少,根本没法和O2共同占到空气中70%的体积分数。

因此,在平时的教学中,教师应意识到男女生在思维、情感方面的差异,有针对性采用一些不同的教学方法或策略,比如,多给女生鼓励和宏观策略上的指导等。真正性别平等的教育并不是无视男女生的差异,盲目地追求“男女一样”,而是尽管男女生之间存在着很多差异,但是他们接受教育的权利和机会是平等的。作为一名化学教师,当发现男女生的某些学科能力存在性别差异时,不应该“一视同仁”,而应该针对其性别差异因材施教,促进学生化学学科能力的提高。

本研究发现该校高一学生化学学科能力整体上是女生弱于男生的,但还需要更细致的分析差异产生的原因,另外,生源更好或更差学校的学生是否存在以上差异,也需要更多样本的研究才能回答。这些也是进一步研究的方向。

参考文献

[1]陈功.教师自主支持与学生化学学习相关性的研究[D].南京:南京师范大学,2015

[2]罗冠中.Rasch模型及其发展[J].教育研究与实验,1992,02:40-43

[3]王蕾.Rasch测量原理及在高考命题评价中的实证研究[J].中国考试(研究版),2008,01:32-39

[4][10]王祖浩,杨玉琴.基于Rasch模型的“化学实验认知能力”测验工具编制及测评研究[J].化学教育,2012,05,95-104

[5]晏子.心理科学领域内的客观测量——Rasch模型之特点及发展趋势[J].心理科学进展,2010,08:1298-1305

[6][7][9]Xiufeng Liu.Using and Developing Measurement Instrument in Science Education:A Rasch modeling Approach.Charlotte[M],North Charlotte:Information Age Publishing,Inc.,2010:206-208

[8]Gavin W.Fulmer;Ling L.Liang;Xiufeng Liu.Applying a Force and Motion Learning Progression over an Extended Time Span using the Force Concept Inventory[J].International Journal of Science Education.2014,Vol.36,No.17,2918-2936

[11]Mok,M.M.C.,Cheong,C.Y.,Moore,P.J.&Kennedy,K.J..The development and validation ofthe Self-directed Learning Scales (SLS)[J].Journal of Applied Measurement,2006,7(4):418-449

[12]SilinWei(1);Xiufeng Liu(2);yuaneJia(3).Using Rasch Measurement to Validate the Instrument of Student’understanding of Models in Science(SUMS)[J].International Journal of Science and Mathematics Education.2014,12:1067-1082

doi:10.3969/j.issn.1008-0546.2016.01.001

文章编号:1008-0546(2016)01-0002-05

中图分类号:G632.41

文献标识码:B

*通讯联系人:E-mail:mahongjia@njnu.edu.cn

猜你喜欢

性别差异
不同任务类型中性别差异对外语效应影响的实证研究
性别差异研究对英语教学的启示
家庭背景与教育获得的性别不平等
消费者网络购物行为决策影响因素实证分析
同伴交友特征的性别差异
浅谈社会语言学视角下性别差异的体现
AdvancedTeachingStrategiesofCollegeEnglishVocabulary
不同性别青年冠心病患者的临床特征及其性别差异
性别差异对TWA的影响
中国缺血性脑卒中急性期抑郁障碍的性别差异