APP下载

基于BOPPPS 模型的“金融数据挖掘”课程教学设计
——以“Apriori 关联分析算法及金融应用”为例

2023-03-25张在美

科教导刊 2023年5期
关键词:项集数据挖掘关联

张在美

(长沙理工大学经济与管理学院 湖南 长沙 410076)

“金融数据挖掘”的课程理念是运用数据挖掘技术解决金融领域中的现实问题,在该课程的内容设计上,应当技术、应用两手抓,既要学习数据挖掘的关键理论与技术,也要注重这些技术在金融领域的具体应用,引导学生进行创新思考的同时提高动手能力[1]。然而,对于金融学专业的本科生来说,其金融知识储备较为充足,而计算机基础相对薄弱,特别是在技术学习与工具运用上存在一定困难,因此,采用传统的课堂教学方式向其灌输数据挖掘技术知识,将难以取得满意的效果。

BOPPPS 是一种强调以学生为中心、以问题为导向的探究式教学模型,契合当前教学模式主流,也符合“金融数据挖掘”课程设计的需求。本文将以“Apriori 关联分析算法及金融应用”知识单元为例,详细介绍其教学设计。

1 BOPPPS 教学模型概述

BOPPPS 教学模型由加拿大ISW(Instructional Skill Workshop)创建,目前被国内外高校教师技能培训广泛采用[2]。该模型将教学内容分解为独立的知识单元,每个单元围绕教学目标划分为前后衔接的六个教学环节:

导入(Bridge-in):引出本单元教学内容,该环节的关键是成功引起学生的好奇心,激发学生的探究欲望与学习兴趣,可以尝试通过热议话题、挑战性问题思考、有趣的图片或视频等方式吸引学生的注意力;教学目标(Objective/Outcome):清晰展示可度量、可操作的教学目标,让学生明确学习方向,并以此为出发点和落脚点,贯穿于后续学习环节;前测(Pre-assessment):了解学生的知识基础,合理调整课程内容的难易程度,进一步明确后续讲解的重难点,可通过提问、小测验、讨论等方式进行;参与式互动教学(Participatory Learning):通过师生之间以及学生之间的交互式学习与探讨,深入理解并掌握课程内容要点;后测(Post-assessment):检测学习目标的达成度,检验教学效果;总结(Summary):梳理知识点,引导学生反思,适当延伸拓展。

以上六个环节缺一不可,环环相扣,无论是线上微课还是常规课堂,不拘泥于模型原有的时长限制,均可深入发挥对课程设计的指导作用[3-4]。学生全方位参与其中,通过教学过程中的多层次互动与反思,不但可以激发学生学习兴趣,还可以帮助教师及时获得反馈信息,充分了解学生的学习效果,及时调整后续教学内容与节奏,促进教学目标的实现,使课堂教学更加科学高效。

2 基于BOPPPS 的“Apriori 关联分析算法及金融应用”教学设计

2.1 导入(Bridge-in)

关联分析是数据挖掘的重要技术之一,在这一环节中,为吸引学生学习兴趣,引入经典案例“啤酒与尿布”:20 世纪80 年代,沃尔玛在发明了条形码、无线扫描枪、计算机跟踪存货技术后,积累了大量顾客消费记录,通过运用数据挖掘技术进行分析时意外发现,与尿布一起购买频率最高的商品,是看似毫无关联的啤酒。此关联规则的发现为沃尔玛制定销售策略提供了重要依据,通过对两种商品摆放位置及价格的调整,大大提升了二者的销售量。

在介绍上述成功案例后,进一步通过提问与讨论的方式引发学生思考,现实生活中,类似“啤酒与尿布”的关联关系广泛存在,你能想到的有哪些呢?比如穿衣搭配、气象关联、精准营销等等。进一步思考,在大家熟悉的金融领域中,又有哪些现象存在关联关系?有何方法可以挖掘这些关联规则?由此引出本知识单元的学习内容。

2.2 教学目标(Objective/Outcome)

针对本单元学习内容,向学生清晰阐述应达到的学习效果及目标,包括需掌握的知识与技能、课程思政目标等。

知识与技能目标:①理解支持度、置信度、频繁项集、关联规则等基本概念;②掌握Apriori算法的核心思想与步骤;③通过一个完整具体的金融数据关联分析案例,理解Apriori关联分析算法解决了金融领域哪些问题,是如何解决的。以上三个目标从基础认知,到技术核心,再到具体应用,层层递进,紧密贴合学生的学习思维,有助于对该知识单元的整体把握。

课程思政目标:引导学生了解近年来人工智能、数据挖掘技术的发展及对金融领域的渗透,明确金融科技、数字金融成为未来金融创新的重要方向以及服务实体经济、深化金融改革的重要力量。使学生意识到成为具有跨学科知识结构、跨学科思维能力的高素质金融科技人才的重要性,同时强化学生对中国金融业发展模式与未来前景的信心和奋斗决心。

2.3 前测(Pre-assessment)

本环节可采取现场提问或通过雨课堂向学生发布相关题目等方式进行摸底测试。由于前测是课堂内测试,不宜占用过多时间,因此测试题目应精炼易解,主要起到对本单元所需的对以往知识进行回顾点醒的作用。

围绕Apriori关联分析算法及金融应用的教学内容,前期所需期准备的知识包括两个方面:一是关于关联分析算法的技术基础知识,如条件概率、集合、布尔型数据、剪枝等相关概念及原理;二是在应用方面,对现实生活以及金融市场中与关联分析有关问题的了解程度。可以设置相关问题进行测试并引发学生思考,如:一个包含k 个元素的集合可以产生多少个子集?在股票市场上,个股之间以及不同的股票市场之间是否存在关联性,有何具体的关联表现?

2.4 参与式互动教学(Participatory Learning)

参与式互动教学作为BOPPPS 教学模型的主体,是教学的关键环节,旨在改变传统的被动式教学,引导学生主动加入教学环节中,体现“以学生为中心”的教学理念。本部分将选取一个完整的金融案例贯穿始终。

首先,基本概念与数据准备。通过PPT 向学生展示一组简化的顾客超市购物记录,称为事务数据集,请学生观察各条购物记录的异同。此时,学生会发现,某些商品组合会在不同的购物记录中多次出现,而不同的商品组合出现的概率以及条件概率存在差异。由此现象引出“支持度”“置信度”“频繁项集”“关联规则”等概念,并结合购物记录进行理解消化。另外,通过引导,学生还会发现,数据集中的每一条购物记录包含的商品数量各异,这并非一个典型的关系型数据集,请学生思考能否以及如何进行转换?结合布尔型数据知识,探讨给出转换方案,建立布尔型数据集,做好数据挖掘准备。

其次,Apriori 算法原理。Apriori 关联分析包含频繁项集产生和规则产生两个步骤[5]。其中,频繁项集的产生较为关键,基于之前准备好的数据集,通过如图1(p114)所示的项集格结构结合支持度测试来完成,请学生思考,如果对格结构中的每个项集进行支持度测试,开销将非常大,有什么方法可以节省开销呢?此时引入先验原理,即“如果一个项集是频繁的,则它的所有子集一定也是频繁的;反之,如果一个项集是非频繁的,则它的所有超集也一定是非频繁的”。利用此原理进行剪枝,如图1 所示,可大大节省测试成本。关联规则是在频繁项集基础上确定规则前件与后件,并结合置信度测试产生,此处引导学生对比频繁项集减小开销的做法,运用先验原理进行规则剪枝。

图1 项集的格结构及剪枝

最后,Apriori 算法的金融应用。在掌握了Apriori 算法基本原理基础上,以前述思考题中的股票市场为例,对国际上主要股票价格指数之间的下跌关联情况进行分析[6]。在此环节中,注意引发学生进行相关思考与探讨,如国际上主要的股票价格指数有哪些?如何定义具体的指数下跌幅度?如何处理各国交易日期不一致问题?等。另外,还应注重对学生动手实践能力的培养,通过课堂示范,对运用Python 实现本案例的主要代码进行解析,展示运行结果,并对结果进行解析。例如,得到的一条形如“rule:DJI--FTSE--GDAXI→FCH(support:0.09751434,confidence:0.96835443)”的规则,可解释为:如果道琼斯工业指数、英国富时100 指数、德国DAX 指数跌幅都在0.5%以上,那么法国CAC40 指数跌幅也在0.5%以上的可能性达到96.84%,该规则的支持度即发生的概率为9.75%。另外,还可以让学生对获得的所有关联规则进行综合拓展分析,通过引导分析将会发现,一些全球化程度比较高且经济发达国家的知名指数如美国道琼斯工业指数、德国DAX 指数、英国富时100 指数、法国CAC40 指数、日本日经225 指数等出现关联性下跌的情形比较显著,即对负面事件的影响存在着较为一致的看法,而亚洲国家或地区指数参与度不高,在关联分析结果中较少见到这些指数。

2.5 后测(Post-assessment)

后测环节主要是针对课堂学习效果的检验评估。本知识单元对学生的考查主要集中在Apriori 关联分析算法的基本原理与步骤及其在金融领域的应用。可以设置相关问题由学生思考回答,如概述先验原理、总结Apriori 关联分析的基本思路,以及针对在国际主要股价指数下跌关联案例中对Python 实现过程的掌握以及对所获关联规则的解释。

2.6 总结(Summary)

本知识单元的教学重点是培养学生数据关联分析的思维,掌握经典Apriori 关联分析算法的核心思想,并针对金融领域的具体问题进行分析应用,得出有意义的结论,为金融决策提供参考。结合后测环节的结果,了解学生对本单元内容的掌握情况,从整体上再次梳理总结教学内容体系与思路,结合其中的重难点进行补充强调,并布置课后作业练习,如中国股票市场个股关联性分析。此外,引导学生进行拓展思考,比如Apriori关联分析算法的缺点是什么,还有哪些其它的关联分析方法?从而引出后续知识单元的学习内容,引导学生提前做好准备。

3 结论

“金融数据挖掘”是一门技术与应用并重的交叉学科课程,对于金融学专业的学生来说,数据挖掘技术的学习存在一定的困难,容易产生枯燥厌烦的心理。因此,在授课中教师应当从学生容易接受的角度出发,将技术学习与金融应用紧密结合在一起,并引入案例等多种教学方法,将课程内容划分为一系列相互独立又可前后串联的知识单元,然后基于BOPPPS 模型针对每一个教学单元进行精心设计,真正做到以学生为中心,在师生互动中发现问题、学习技术、解决问题,最终实现教学目标。

猜你喜欢

项集数据挖掘关联
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
探讨人工智能与数据挖掘发展趋势
“一带一路”递进,关联民生更紧
不确定数据的约束频繁闭项集挖掘算法
奇趣搭配
基于并行计算的大数据挖掘在电网中的应用
智趣
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究
一种新的改进Apriori算法*