APP下载

基于大数据挖掘的初中数学教学内容重点发现研究

2022-07-19乐惠骁贾积有

数字教育 2022年3期
关键词:教育大数据教学重点知识结构

乐惠骁 贾积有

摘 要:了解初中数学的教学重点对于促进教师教学具有重要意义。但是一般教师对于教学重点的把握主要靠教学经验,已有的研究主要采用问卷调查等方法对教师观念中的教学重点进行探讨,得到的结论主观性较强。本文梳理了教学重点的概念,从发生认识论的视角入手,基于在线学习者的380万条行为日志数据以及87万余套试题文本,将人教版初中数学教材的每章知识点及其关系用三个量化指标进行客观描述:概念网络、成绩网络以及对后续成绩的影响。本文在分别计算了三个指标并进行三位一体的可视化呈现后,得到三个结论:初中数学的学习过程中早期学习的知识往往更重要;代数与几何的知识是初中数学中的教学重点,但是学习者代数知识的掌握情况对于后续学习有更大的影响;代数和几何的衔接类知识在初中数学学习中有着独特的重要性。本文提出并实现的基于大数据挖掘的教学内容重点发现技术及其结论对数学和其他各个学科的教和学都具有重要的参考价值。

关键词:初中数学;教学重点;知识结构;教育大数据

中图分类号:G4 文献标志码:A 文章编号:2096-0069(2022)03-0049-09

收稿日期:2021-12-12

基金项目:2017年度中央电化教育馆全国教育技术研究规划重点课题“基于智能技术和大数据分析的个性化教学研究”(176220009);2020年度北京大学教育大数据研究项目“基于大规模学生学习活动数据挖掘的自适应性智能教学系统研究”(2020YBC07)

作者简介:乐惠骁(1995—   ),男,浙江嘉善人,北京大学教育学院教育技术系博士研究生,研究方向为人工智能教育应用;贾积有

(1969—   ),男,河南获嘉人,北京大学教育学院教育技术系主任、教授、博士生导师、北京大学教育信息化国际研究中心主任,研究方向为教育技术学和人工智能教育应用。

引言

教学重点是在初中数学教学一线经常听到的一个词,对于教师和学生来说,了解教学重点,有针对性地开展教学和学习才能事半功倍。然而对于一般教师来说,精准地把握初中数学中的教學重点并不容易。

对于教学研究者来说,识别初中数学中的教学重点也是不小的挑战。一方面,由于跨文化的基础教育的差异性,可供参考的研究大多集中于国内,且不同地区的初中数学使用的教材不尽相同,这为识别教材重点增加了难度,也不便研究结论的推广。另一方面,研究者往往将教师作为研究对象,希望以教师的观点来支撑研究结论的合理性,相关研究方法局限于对于师生的问卷调查与访谈。但是教师自身对于教学重点的把握有时也是模糊且主观的。这造成了已有结果之间无法形成有效的对话,且对于“哪些知识点是教学重点,这些知识点有多重要”的回答较为模糊。此外,囿于研究成本的限制,已有的研究大多局限于对单个教学重点的分析,对于全局的初中数学教学内容中教学重点的研究寥寥无几。

近年,学习分析的兴起为识别教学重点提供了新的思路。在线学习平台中,学习者产生的行为日志中蕴藏着海量信息,研究者可以使用数据挖掘的方法将其中有价值的信息挖掘出来并获得有意义的发现。在这一视角下,本文对某在线数学学习平台上学习者参与初中人教版数学在线练习累计的380万条日志数据以及87万余套试题进行分析,结合学习者的在线学习活动指数[1],以期依靠大样本的数据和定量的分析方法获得对初中数学教学中的教学重点的掌握。

一、文献综述

(一)教学重点识别的相关研究

朱珍通过对教师的问卷调查,整理教师的观点后得到确定初中数学教学重点的依据:其一是考虑课程标准这一大纲性的指导文件;其二是教师根据具体每一节课的教学目标设计其中的教学重点。此外,其论文中还指出了教师教学重点把握不当的问题[2]。徐百灵对教师和学生对于初中数学教学重点的认知差异进行了探究,发现从总体上来说教师和学生对于教学重点的认识不存在差异,主要是“数与代数”和“空间与图形”两大领域,且教师和学生对于教学重点认知的一致性随着教学的开展而提高[3]。张胜利探究了数学概念在数学教科书中的呈现规律,与此同时也调查了初中数学教师认知中的关于初中数学的核心概念,其中排名前10的概念中,数与代数概念有6个,空间与图形概念有4个[4]。此外,一线教师也探讨了在某一知识点对应的课堂教学中应该把握的教学重点[5][6]。

已有的研究中也存在着这样的一个问题:这些研究中确定教学重点的方法都是对教师进行定性的调研,教师作为一线工作者的经验和观念被用作论证什么是教学重点、什么不是教学重点的依据。然而,从一线教师的一些观点来看,教师整个群体中存在相当部分的教师无法有效地把握教学中的重点[7]。那么教师掌握的教学经验究竟是否能够反映真实的教学重点的情况呢?局限的个体经验能否推广到一个一般性的结论?这是已有教学重点方面的研究面临的一大挑战。

(二)教学重点的概念梳理

教师对于教学重点把握模糊的一个重要原因在于教学重点概念本身的多重意义。笔者通过梳理教学重点的不同概念,发现教学重点这一概念本身有着三种意义。

第一种是从教学目标出发的。对于教学目标来说教学重点是最核心的内容,也是课程标准的制定者希望学习者必须掌握的基础内容,例如基本的概念、原理、定义和公式等。

第二种是从学生的认知发展出发的。教学重点是课程结构的主要线索,掌握了这部分内容,对于学生学习新知识和巩固旧知识都有决定性的作用。这种认识下,教学重点则是那些在教材的所有知识结构中承上启下的关键知识点。

第三种来自教师对于教学绩效的认识,教学重点就是考试的热点。以往教师确定教学重点的依据之一就是通过教材内容掌握高频考点[8]。对于教师来说,他们希望学生学得好,考试考得好,在平时教学中比较关注高频考点和热点,而这一类考点自然也就成了教学的重点。

如果从课程标准和教材编写以及综合性考试的出题组卷这一完整的教学系统运作的逻辑来看,第一种和第三种观念下的教学重点虽然概念不同,但是最终这两种不同概念定义的教学重点的内容在很大程度上是重合的,都是描述“教什么”的问题:综合性考试的目的是对学生的知识掌握情况进行测试,而测试要具有良好的内容效度,其中重点考查的知识就必须与课程标准所明确的教学重点相一致。综合性考试中的热门、高频考点往往传达的是教育部门要求学生重点掌握的知识。学生的学业成绩是教师重要的绩效指标,教师在教学中会特别强调学业考试考查的内容,以高效地提升自己的绩效[9]。

对于教师而言,有课程标准的指导,相对于“教什么”,“怎么教”才是一个大问题。教师对于知识结构中的教学重点的把握并不充分。初中数学教学内容是一个庞大的结构化的知识体系,从教学全局出发,在按照教材开展线性教学的过程中,教师往往需要确认哪一个知识点需要花费更多的时间与精力进行讲授,才能使得学生在整体的知识掌握上有更好的表现。比如,在常用的人教版初中数学教材中,知识结构中的教学重点有哪些,这是广大教师特别关注的一个问题,也是本文的研究问题。

为了解决这个问题,本文着重就知识结构中的教学重点进行探讨,依据一个在线数学教学系统中初中数学人教版的大量学习测验记录及其题库,以定量数据识别人教版初中数学中的教学重点。

(三)知识结构中的教学重点——发生认识论的视角

池次郎.诺纳卡(Ikujoro Nonaka)等人认为,个体知识的建构,或者说个人学习的发生过程,可以用这样的三个阶段来描述:信息的获取、信息的转义以及知识的建构。在信息获取阶段,学习者通过比较环境中的外部信息与自身知识结构的差异发现环境中的有用信息;在信息转义阶段,学习者将感兴趣的信息与自己已有的知识进行组织和整合;在知识建构的阶段,学习者调整了自身的知识结构,从而获得了能在不同情境中应用的有意义的新知识[10]。深受发生认识论影响的奥苏伯尔也对知识的获取有类似的观点。他认为知识获取是新知识与学习者认知结构中已有观念建立非人为的、实质性联系的过程,学习者能否习得新知识的关键在于其認知结构中是否有适当的、能起固定作用的观念[11][12]。由此,从发生认识论的角度出发,在知识获取的过程中,学习者已有的知识结构是一个重要的变量。如果其已有的知识结构中有着能有效地对新的内容进行同化的锚点,那么新知识的习得会变得更有效。

在这一视角下,初中数学的教学过程其实是不断发展建构学习者知识结构的过程,在教师讲授每一个新知识点的时候,学习者能否有效地对这一知识点进行同化的关键在于其现有知识结构能否整合这部分教学内容中的信息。例如,学习者在理解全等三角形这一概念时,教学内容传达的信息将会与学习者已建立起来的三角形、角、边等数学概念发生联系,而学习者能否有效习得全等三角形相关概念的关键在于其知识结构中是否已有完整的三角形、角、边等概念。所以,初中数学教学的过程就是搭建学习者知识结构的过程,如果学习者知识结构中先前的“地基”没有打好,那么对之后新内容的有效同化也很难发生。

综上,在发生认识论的视角下,知识结构中的教学重点的概念就是在学习者的知识结构中与大量其他知识点发生联系,能作为许多知识同化过程中的固定锚点的知识点。基于此,本文进行了进一步的研究设计,以发现学习者知识结构中的教学重点。

二、研究设计

(一)研究对象

本文的研究对象为某在线教学系统中初中数学人教版的学习测验记录及题库[13][14]。在该系统上,测验以闯关的形式呈现,每关对应一套测验题,题型为选择题或者填空题。学生必须依次做对每道题才算闯关成功。若单道题未能答对,则可以重复做题直到答对或超时为止。系统记录的主要信息包括学生做该套题所用的时间、提交错误答案的次数、测验得分等。该系统中的题库来自一线教研人员和教师的命题,测验中命题的内容、形式和难度与实际综合性考试中的试题相仿,有较好的内容效度和效标效度。数据集中共有试卷87万余套。有关初中数学人教版的做题记录有380万条,涉及4万余学习者。当然,并非学习平台上的学习者都完成了人教版初中数学所有单元的学习,本文筛选出83名完成了平台上初中数学人教版全部章节内容学习,且在每章上至少进行了5次学习活动的学习者。

人教版初中数学共29章,其中的知识点可以概括为4类:几何类、代数类、数理统计类、衔接类。

(二)研究方法

基于教学重点的概念,本文提出3个指标来描述某一知识点在知识结构中的重要性:概念网络、成绩网络以及知识点掌握程度对后续学习的影响。

1.指标一:概念网络

在学习者学习新的概念时,新的概念会与学习者已经习得的概念发生联系,这种联系的强弱影响了学习者对新知识同化的程度。在知识图谱的研究中,图和网络是一种常用的表征知识结构的数学工具。可以用图中的顶点表示知识内容,而用顶点间的边表示知识间的某种关系。类似地,本文用图对初中数学中的知识点及知识点概念间的联系进行演示,图的顶点代表知识内容,而顶点间的边则代表两个知识在概念上的联系,边的权重代表概念联系的强弱。

在知识点的颗粒度大小的选择上,过小的颗粒度会增加图的复杂度,同时降低进行统计推断时的样本量,影响结论的信效度;而过大颗粒度的知识点则会降低研究的意义和价值。本文用每个单元的内容作为图的顶点。

图的边表示两个知识点在概念上的联系,本文假设概念网络是一个无向全联通图,即其中的所有知识点之间都有联系,只是在概念上联系的强弱不同。本文使用知识点对应的试题文本在语义上的相似度来度量两个知识点概念间的联系强弱,相似度越高,则说明联系越强。对于某两个知识点i和j,保留名词、动词等实词,使用文档-逆文档频率(TF-IDF),为词向量中的不同词赋予特征权重,相似度就是两个词向量的欧式距离。

当一个知识点与许多知识点之间有很强的概念上的联系,那么这个顶点所代表的知识点在初中数学的概念网络中就更重要。本文使用Pagerank算法(网页排序算法)对图中顶点的重要性进行度量。对于知识点构成的网络来说,Pagerank值更大的知识节点在概念网络中就占有更重要的位置,也是教学中应该关注的教学重点。

2.指标二:成绩网络

如果在学习者的考试题数据中发现这样一种情况,如果知识点B的学习需要知识点A作为其锚点,或者是在知识点A的基础上展开的,那么知识点A与B的掌握程度之间就会存在这样一种因果关系:学习者对知识点B的掌握程度在一定程度上取决于其对知识点A的掌握程度,而在一个学习者群体的观察数据构成的样本中,这种因果关系就会在一定程度上表现为学习者在知识点A与B的成绩间的相关性。本文用图结构来描述初中数学中的知识点及知识点间掌握程度的关系,并构造一个初中数学知识的成绩网络。其中,图的顶点代表知识内容,而顶点间的边则代表两个知识点在掌握程度上的相关性,边的权重代表掌握程度的相关性强弱。

测验是测量学习者对某一知识的掌握程度的常用手段,本文采用贾积有等人提出的在线学习行为指数来衡量在线学习的测验成绩,包括质量、速度和数量三个维度[15]。

成绩网络的顶点表征数学教材中的某一单元。成绩网络的边表示两个知识点在掌握程度上的联系,用学习者群体在两个单元的测验成绩之间的皮尔森相关系数表征其权重;为了保证研究的效度,若该边表示的相关系数不能通过对其相关性的假设检验(p>0.1),则不考虑这两个知识点在掌握程度上的联系性。成绩网络也使用顶点的Pagerank值作为重要性的度量。

3.指标三:知识点掌握程度对后续学习的影响

概念网络和成绩网络虽然可以通过知识点内容和学习者学业表现的相关性来描述知识点间的关系,但是初中数学的知识点教学是以顺序结构展开的,学习者对先前学习知识的掌握程度会影响到其对后续知识的学习。本文用如下多元线性回归模型来描述学习者在知识点i上的平均得分Avg、知识点i前所有单元平均成绩Avgbefore、知识点i后所有单元的平均成绩Avgafter之间的关系。

Avgafter=a*Avgbefore+b*Avg + c(a为Avgbefore系数,b为Avg系数,c为常数)

三、研究结果

(一)概念网络

对系统87万余套试题,计算各单元文本词向量的TF-IDF值及其相似度,得到人教版初中数学的概念网络,如图1(见下页)所示,其中去除了权重小于所有边平均权重的边。从概念网络来看,几何知识与代数知识的重要性均远大于数理统计知识。

(二)成绩网络

根据83名学习者在各单元上学习的质量和速度数值,计算各单元间知识的相关性,可以得到测验网络的边的权值,再去除权重小于所有边平均权重的边,进而画出成绩网络,如图2(见下页)所示。从成绩网络来看,几何知识与代数知识的重要性远大于数理统计知识。与此同时,衔接类的知识在成绩网络中的重要性很大。

(三) 知識点掌握程度对后续学习的影响

表1呈现了以各章知识点掌握程度(Avg)和知识点i前所有单元平均成绩(Avgbefore)为自变量、知识点i后所有单元的平均成绩(Avgafter)为因变量的多元回归结果。因为第一章“有理数”和最后一章“投影与视图”分别位于学习序列的首尾,分别缺少Avgbefore和Avgafter,所以不计算这两章的回归公式。

可见第二章和第三章知识点的Avgbefore项的系数偏小,说明在初中学习的开始阶段学习者的可塑性很强,以往的学习成绩并不能很好地预测之后的学业表现。代数类知识的掌握情况对后续学习的影响大于几何类知识。衔接类的知识对后续学习有很大的影响。

(四) 三个指标的三位一体可视化呈现

为了全面考察三种指标之间的关系,本文采用三位一体的可视化方法,如图3(见下页)所示。其中横轴为知识点在概念网络中的pagerank值,表示知识点在概念网络中的重要程度;纵轴为知识点在成绩网络中的pagerank值,表示知识点在学习网络中的重要程度。纵轴为知识点在成绩网络中的重要程度,知识点对应的气泡大小表示知识点对后续学习的影响程度,点越大,则对后续学习的影响越大。两条垂直于坐标轴的虚线与坐标轴的交点分别是各章知识点在该轴上的投影点的均值。

可以看出,七年级的知识内容(包括第二章、第三章、第四章和第六章)都处于整个知识体系的右上方,说明这些知识点不但在测验网络中占据有影响力的位置,而且对后续学习的影响也较大。二次根式与勾股定理在初中数学的知识结构中起到承上启下的作用,一方面衔接了关于二次函数的代数知识,一方面又与角、三角形等几何知识发生联系。这一结果暗示着在教学中关注综合衔接这一类知识对于学习者全局掌握初中数学知识有很大的帮助。

四、研究结论和讨论

不同于与以往研究中经常采用的对教师展开问卷调查和访谈等方法,本文梳理了教学重点的概念,并从发生认识论的理论视角入手,重点探究初中数学知识结构中的教学重点,并基于更为客观的学习者的行为日志数据和平台题库,将其操作化为三个可量化的指标。大体而言,本文从知识点在概念上的重要性和在学习者学习表现中的重要性入手,用不同角度刻画了初中数学中一个知识点的重要程度。概念网络有助于教师把握初中数学教学中的概念上的重点,对一些基础的、重要的概念在教学中加以强调,有利于学习者之后的学习。当然,数学知识中很大一部分并非单纯的陈述性知识,过程与方法性的知识也是初中数学知识的重要组成部分。相对而言,成绩网络和前后知识掌握的回归方程弥补了概念网络的缺陷,有助于教师以学习者测验成绩为绩效目标,把握教学重点,合理分配教学精力。

在对知识点进行三个维度的描述和三维一体的可视化呈现基础上,本文得出了三个结论:初中数学的学习过程中早期学习的知识往往更重要;代数与几何的知识是初中数学中的教学重点,但是学习者代数知识的掌握情况对于后续学习有更大的影响;代数和几何的衔接类知识在初中数学学习中有着独特的重要性。这些结论对于初中数学教学具有较大的参考价值。

与徐百灵的研究结论相符,初中数学中的代数和几何这两部分的内容显得同等重要[16]。这与代数类知识大多在初中数学学习的前期开始教授有关,也可以用皮亚杰的儿童认知发展阶段理论解释:具体思维运算阶段的运算离不开具体事物的支持, 还不能组成一个结构的整体和一个完整的系统,而形式运算阶段学习者的思维能从理论出发,不受具体事物的限制。相比于直观的几何知识,抽象的代数符号更难于被这一阶段的学习者所理解。加之代数类知识讲授较早,所以能够很好地构建起数与代数的体系,在初中数学学习者的知识获取过程中显得更为重要。早期知识内容的重要性也不难理解:从学习者的学业表现间的比较来看,小升初后先行知识的差异对其最终整个初中的学业表现的影响是有限的,在学习的开始取得的微小优势会逐渐累加。另外,从知识获取的过程来看,这部分知识是所有初中数学知识的基础,之后新知识的学习过程中都需要这部分知识作为固着点。

就研究结论的信度而言,平台本身的练习题由一线教研人员制定,其中不乏一些地区的大型考试真题,保证了题库内容较好的效度,也保证了概念网络能较好地反映真实数学知识点间的概念联系。此外,本文采用了牺牲外部效度保全内部效度的设计方法,只保留了学习投入最高的83位学习者,不存在某些章节内容上缺失数据的问题,行为日志也能更真实地反映其学习过程和能力水平。就研究的外部效度而言,研究的样本来自全国不同地区、学校的线上学习者,在人口统计学上有较好的代表性,但是值得注意的是由于在线学习的特殊性,作为研究对象的83位学习者是完成了平台上所有初中数学学习内容的人,相较于其余数万学习者而言有着极高的学习投入,这一点对结论的外部效度提出了一些挑战,虽然并不能明确其影响,但是最终结论有可能只适用于“好学生”群体。此外,本文采用的数据集是人教版初中数学的相关试题和学习者活动日志,未来可以对更多版本教材中的教学重点进行分析,以印证研究结论并扩充研究的外部效度。

从方法上而言,本文采用的方法具有较好的可移植性,可以分析所有课程科目的包含题库文本和学习者测验成绩的数据集,发现教学内容中的重点,为教师的教和学生的学服务,实现减负增效效果。同时,本文提出的方法避免了以往对教学重点研究中过度依赖专家与教师的个体主观经验的问题,能从数据中得到客观的知识点的重要程度度量。当然,本方法还有许多的不足,例如,其中的成绩网络中知识点间的关系使用了相关性进行度量,无法剥离出各知识点间复杂的因果路径以及存在的中介效应。未来研究可以着眼于知识点间的影响并进行更严谨的因果推断,发现各知识点间影响的因果效应,以获得更加精确的对知识点重要程度的估计。

[1][15]贾积有,于悦洋.学习活动指数LAI及在线学习活动指数OLAI的具体分析[J].中国远程教育,2017(4):15-22,56,79.

[2][8] 朱珍.初中數学教学重点及难点的教学策略研究[D].徐州:江苏师范大学,2018.

[3][16]徐百灵. 师生对初中数学教学重点及难点的认知研究[D].临汾:山西师范大学,2017.

[4]张胜利.数学概念的教科书呈现研究:以初中数学教学为例[D].长春:东北师范大学,2011.

[5]王海青.“平面向量基本定理”的教学重点及其建议[J].数学通报,2013,52(7):30-32.

[6]王丽颖,毕力格图. 中学统计与概率教学重点问题探究[J].数学通报,2012,51(2):16-19.

[7]陈林. 语文教学重点到底是什么?—— 一种“过程论”的尝试[J].教育学术月刊,2015(4):81-87.

[9]阎立君.考试新题型所透视出的高校英语教学重点的转移[J].辽宁广播电视大学学报,2006(3):20-21.

[10]NONAKA I ,REINMOELLER P,DAI S.The“ART”of Knowledge:

Systems to Capitalize on Market Knowledge[J].European Management Journal,1998,16(6):673-684.

[11]COOK H,AUSUBEL D P.Educational Psychology:A Cognitive View[J].The American Journal of Psychology,1970,83(2):303.

[12]何先友,莫雷.奥苏伯尔论认知结构、知识获得与课堂教学模式[J].华南师范大学学报(社会科学版),1998(3):50-56.

[13]贾积有,颜泽忠,张志永,等.人工智能赋能基础教育的路径与实践[J].数字教育,2020,6(1):1-8.

[14]贾积有,张必兰,颜泽忠,等.在线数学教学系统设计及其应用效果研究[J].中国远程教育,2017(3):37-44,80.

(责任编辑 孙志莉)

Research on the Discovery of the Math Teaching Content Focus of Junior High School Based on Big Data Mining

LE Huixiao,JIA Jiyou

(Graduate School of Education,Peking University,Beijing,China 100871)

Abstract: To understand the teaching focus of junior high school math is of great importance to the promotion of teacher teaching. But generally,teachers’ understanding of teaching focus mainly depends on teaching experiences.The informed research mainly adopted method like questionnaire survey to make a discussion of teaching focus in teachers’ beliefs, obtaining the result of strong subjectivity.This paper has combed the concept of teaching focus,starting from the theoretical perspective of genetic epistemology,based on 3.8 million behavior log data of online learners and 0.87 million set of exam texts,has done an objective description of each chapter’s knowledge points of junior high school math textbook of people’s education edition and its relation by using three quantitative indexes,namely,concept network,performance network, and the influence on follow-up performance. This paper,after calculating three indexes respectively and doing visual presentation of three dimensions in one, obtained three conclusions:in the learning process of junior high school math,the knowledge learned in the early period is often more important;the knowledge of algebra and geometry is the teaching focus of junior high school math,but learners’ mastering of algebra knowledge will have greater impact on the follow-up study;the connection knowledge of algebra and geometry is of unique importance in the learning of junior high school math.The teaching content focus discovery technology and its results based on big data mining and put forward and realized by this paper are of great referent value to the teaching and learning of math and other disciplines.

Key words:  junior high school;teaching focus;knowledge structure;education big data

猜你喜欢

教育大数据教学重点知识结构
工程管理专业大学生知识结构及其评价
“教育大数据”视角下的精准教学的研究
教育大数据在教育管理中的运用分析
初中历史课堂教学重点的思考与再认识
巧引路轻点拨,豁然开朗
“简单的运动”学习指导
怎样建造你的知识结构