APP下载

模式识别课程建设与教学实践探索

2021-12-15张晶

科教导刊 2021年31期
关键词:模式识别研究生教育课程建设

张晶

摘 要 针对模式识别课程特色不鲜明、方法理论陈旧、实践内容相对薄弱等情况,通过紧跟人工智能学术前沿、融合学术研究驱动的教学思想探究模式识别教学方法。从课程内容和实验设计等环节出发,注重关键技术理论和实践相结合,帮助学生掌握模式识别领域的经典及前沿方法和研究方向,通过半开放实验作业在提高学生对理论知识的深入理解的同时,培养学生的创新性思维和科研素养。

关键词 模式识别;研究生教育;课程建设;教学实践

中图分类号:G424                                   文献标识码:A    DOI:10.16400/j.cnki.kjdk.2021.31.041

The Exploration of Course Construction and Teaching Practice for

Pattern Recognition Course

ZHANG Jing

(College of Software, Beihang University, Beijing 100191)

Abstract In view of the lack of distinctive characteristics of the Pattern Recognition course, the outdated method and theory, and the relatively weak practical content, the Pattern Recognition teaching method is explored by closely following the academic frontier of artificial intelligence and integrating the teaching ideas driven by academic research. This paper focuses on the course content and experimental design as well as the combination of key technical theory and practice to help students master the classic and cutting-edge methods and research directions in the field of pattern recognition, improve students' theoretical knowledge through semi-open experimental assignments, and cultivate students' innovative thinking and scientific research literacy.

Keywords pattern recognition; postgraduate education; course construction; teaching practice

2017年以來,我国先后发布了《“互联网+”人工智能三年行动实施方案》《新一代人工智能发展规划》等战略性文件,系统布局我国人工智能相关技术产业及应用的发展。随之而来,人工智能人才培养成为教育界和产业界共同关注的焦点。[1]自2012年以来,以深度学习为代表的人工智能技术在各个领域激发了层出不穷的新算法新技术。在图像识别、机器翻译等应用上,其性能已经远远超越了传统机器学习和模式识别算法。在过去近十年中,深度学习已经成为新一代人工智能的发展主线,涌现出前所未有的新方法、新问题。高校承担着主要的新一代人工智能下的人才培养任务,应该顺应时代、与时俱进,加强人工智能相关课程的建设。为了贯彻国家发展战略,助力中国人工智能行业的发展,探索和促进人工智能领域人才培养,很多高校同时开设机器学习和模式识别等人工智能相关课程。[2][3]北京航空航天大学软件学院的软件工程和电子信息方向开设了模式识别课程作为一门重要的专业理论核心课程,其主要内容是对数据进行自动模式发现、特征学习与识别等理论技术。本课程主要讲授模式识别领域的基础理论和经典方法,包括模式预处理、特征提取和表示、模式分析、模式分类等主要内容。然而,课程内容受经典课程影响,其覆盖的理论和方法在新一代人工智能浪潮下略显陈旧。此外,多门相关课程同时开设导致不同课程之间内容重叠度较大,影响学生的学习兴趣。而且,经典课程以理论讲授为主,忽略了学生实践和创新能力的培养。因此,模式识别作为人工智能方向的重要分支学科之一,现有的课程设置存在内容陈旧、特色不鲜明、实践环节薄弱、对学生的创新能力培养欠缺等问题。

本文分析模式识别课程在内容设置以及教学和考核方案面临的问题,提出课程内容设计方案,以及理论讲授结合实践作业的教学模式,结合模式识别领域的发展前沿,激发学生的创新思维和科研兴趣。

1 模式识别课程设计

1.1 课程目标

通过具有特色的课程内容设置以及创新能力导向的教学方法,帮助学生全面清晰的了解领域的发展史,对经典方法有理论层面和感知层面的理解,对当前的研究前沿和主流方法有客观的认识,能够针对某个特定的研究问题提出创新想法,拓展学生的创新视野和创新意识。并通过课程实验提高学生的理论知识理解、动手编程实践、文献阅读、算法复现、结果分析、报告撰写等综合能力。

1.2 特色突出的课程内容

现有模式识别课程主要参考Duda等编著的《模式分类》、[4]Bishop编著的《Pattern Recognition and Machine Learning》 [5]以及周志华教授编著的《机器学习》 [6]等教材。其讲授内容更多关注的是传统机器学习算法,涉及的技术主要包括:贝叶斯决策理论、概率密度估计、线性分类器、非线性分类器、近邻法、决策树、特征提取、无监督模式识别等。

然而,模式识别在机器学习相关技术的基础上,同样需要关注的是针对不同类型的数据发现、学习与抽取具有鲁棒性、可泛化性、可迁移性的特征或模式。这些内容在现有模式识别课程中尚未得到充分的体现,导致模式识别课程缺乏其独特性。因此,本课程的教学中,在经典机器学习算法的基础上,为突出模式识别领域特点,重点介绍不同数据类型(比如图像、文本、时序数据)的模式发现和特征抽取方法,以及具有鲁棒性、可泛化性、可迁移性、可解释性的特征学习前沿方法。因此,本课程的教学内容设计为三大主要的模块:

第一,机器学习及深度学习简介。主要介绍基本的机器学习算法基础概念、核心思想和主要步骤,并从线性模型到非线性模型,从神经网络到深度学习,沿着机器学习的发展脉络让学生对机器学习和深度学习的发展和核心内容有感性的认识。

第二,模式发现和特征表达学习。在学生了解了机器学习的核心思想基础上,介绍特定数据类型(比如一般数据,图像数据,文本数据,时序数据等)的模式发现和特征表达学习方法。

第三,可迁移、可泛化、可解释及鲁棒的特征表达。通过介绍模式识别中的针对模式发现和特征表达的可迁移性、可泛化性、可解释性及鲁棒性的前沿方法,帮助学生理解可迁移、可泛化、可解释及鲁棒的特征表达如何成为模式识别领域的前沿科学研究问题和实际落地的新需求与技术瓶颈,以及对相应的基本解决方法的感性认识。

1.3 創新思维导向的教学方法

课堂上的理论教学是学生掌握基本知识的主要渠道,模式识别课程内容的知识点具有跨度较大、原理抽象、不易理解等特点,限制学生的创新性思维发展。此外,在人工智能领域迅速发展的背景下,模式识别课程中涉及的经典和前沿算法和理论是培养创新性思维和拓展创新性视野的优秀案例。因此,教学过程中并提出创新思维导向的教学方法:

首先,帮助学生理解模式识别领域的发展过程、构建整个领域的整体知识体系。创新性思维的建立通常以全面完善的知识储备为前提。因此,在介绍算法过程中,从传统的经典算法出发到前沿技术的发展历程,让学生在掌握经典的前提下,了解前沿技术的发展依据和动向,从而建立领域发展的整体知识体系并理解本领域的系统思维方式。比如,从一般数据的经典主成分分析特征提取方法到前沿的深度自编码器的发展,从图像数据的传统的滤波器算子到基于卷积神经网络的深度学习模型的发展,从文本及时序数据的word2vector和RNN模型到自注意力机制、Transformer模型和BERT语言模型的发展等。建立经典方法和前沿技术之间的联系,帮助学生理解模式识别领域发展历史、规律和方向,对创新思路和角度有感性的认知。

其次,引入模式识别领域前沿问题,消除学生对本领域的理解偏见,帮助学生建立批判性思维,培养其创新思维和能力。比如,基于深度学习的数据驱动前沿模式识别算法可以实现有效的模式发现和特征表达,在多个领域的不同应用中取得极大的成功,再比如人脸识别等任务上甚至超越了人类智能。但这些算法的优越性能多数仅局限于经过人工选择的标准数据集,其在真实场景中的泛化能力仍然较低。仅介绍此类算法将造成学生对模式识别乃至整个人工智能领域的理解偏见。因此,将迁移学习、鲁棒性学习、可解释的人工智能等前沿课题引入到模式识别课程中,这些算法是体现创新性和批判性思维的良好案例,启发学生对模式识别领域进行深入的思考,锻炼其批判性思维,培养创新性思维、意识和能力。

最后,在培养学生的创新思维、创新意识和创新能力的同时,注重创新视野的拓展。课程内容中引入模式识别与机器学习等领域顶级期刊和会议的最新研究成果。在对前沿问题和方法进行介绍的过程中,从研究动机、观察发现以及创新性体现等方面出发,再到核心算法的介绍。指引学生了解正确的研究思路,培养学生的批判性思维和创新能力。同时也帮助学生了解技术发展的热点和趋势,培养学生对技术发展的洞察力,激发学生的创新意识。

2 实验案例的设计与探索

2.1 实验设置目标

模式识别是一门实践性强的学科,要求学生不仅有扎实的理论基础,还要有动手实践和解决问题的能力。现有模式识别课程实验设置存在多方面问题。首先,实验环节应该与教学内容统一规划,构成总体的建设思路和体系。现有的模式识别课程实验设计各个知识点互相割裂,学生无法建立整体概念。其次,实验案例通常比较陈旧,缺乏与实际问题的结合以及最新研究成果的展现,阻碍学生的实践热情和创新性思维锻炼。最后,与教学配套的实验平台建立不足导致实验内容简单,与前沿问题严重脱轨。因此,实验设置目标如下:第一,实验设计紧扣教学内容,融合多个知识点,构建实验内容体系。第二,以实际科研问题为导向,引入前沿技术,设计从易到难的半开放实验项目。第三,构建大数据环境下的实验平台,避免由于软硬件环境限制导致的实验内容限制。

2.2 实验案例的规划与设计

围绕教学内容设置共设计了4个课程实验项目作业,每个作业均以经典及前沿实际研究问题为导向,最大程度上涵盖了课上讲授过的不同算法和内容。每个实验项目都包含简单版本和进阶版本的由易到难的不同难度等级。学生可以根据自己的基础和研究背景选择实现不同难度等级。简单版本可以仅通过微调参数和修改模型架构实现,因此,即使没有足够编程及相关领域研究基础的同学也能很好地完成。通过完成基础版本可以帮助没有相关背景的同学对模式识别领域有一个感性的认识,实现入门的目标。进阶版本要求学生通过自主查找、阅读相关文献,动手实现其核心算法,对基础版本算法进行改进并提高性能。具体而言,4个课程项目的选择依据、主要任务、目标及要求如下:

基于語音信号的音素分类。本项目的主要任务是根据预处理后的语音信号,设计神经网络架构,实现语音音素分类任务。音素分类是语音识别任务的第一步,其识别效果直接影响后续的语音识别性能。本项目的目标是帮助学生了解语音信号数据处理方式和特征表示方法,并通过自主设计分类模型熟悉神经网络的设计及优化方法。基础版本可以仅通过设计基本神经网络结构实现。进阶版本需要自主设计数据预处理、优化模型架构、选择合适的损失函数、调整训练策略、加入正则等方式提高特征的表达和泛化能力,在不公开的测试集上取得更高的识别率。

基于卷积神经网络(CNN) [7]的物体识别算法。本项目的主要任务是通过设计卷积神经网络,实现基于图像的物体识别算法。物体识别/分类是计算机视觉中最基本的任务之一。深度卷积神经网络作为新一代人工智能领域的突破性成果,在以计算机视觉为代表的等众多领域得到广泛应用。卷积神经网络主要针对图像等高维矩阵或张量数据,通过卷积算子、感受野、参数共享、多层次抽象特征学习等机制,在基于图像数据的视觉任务中实现性能的飞跃式提升。本项目的目标是帮助学生了解卷积神经网络的基本结构,并手动设计卷积神经网络模型架构,通过提供的有标签食物图像数据,实现食物物体分类任务。进阶版本要求设计不同数据增广方法,并利用额外无标签数据,设计半监督学习或自监督学习损失,进一步提高食物分类识别率。

基于生成对抗网络(GAN)的人像生成。本项目的任务是熟悉一种无监督的生成式模型--生成对抗网络,实现人像的生成任务。与基于传统神经网络和深度卷积神经网络的判别模型不同,生成对抗网络属于生成模型,其目标是根据某种隐含信息,随机产生观测数据。Ian Goodfellow等人于2014年提出了生成对抗网络 [8](Generative Adversarial Nets)在深度学习领域掀起了一场革命,产生了一些重大的技术突破。其学习性质是无监督的。因此,作为生成模型和无监督学习代表性算法,本项目的目标是熟悉GAN的核心思想,实现基本的GAN模型,并应用于人像生成任务。由于基本的GAN模型具有训练不稳定,生成质量欠佳等缺点,进阶版本要求通过借鉴WGAN、SNGAN、StyleGAN、BigGAN等思想,改进现有模型,实现更高质量的生成效果。

基于增量迁移学习的跨域手写字识别。为了让学生熟悉可迁移、可泛化的特征学习方法,本项目的任务是实现多种不同增量迁移学习算法,在跨域手写字识别任务上进行验证。现有模式识别算法多数无法有效实现增量学习的目标,即在旧任务上学好的模型在迁移到新任务时通常可以帮助新任务的性能。然而,提高新任务的性能往往使得新模型对旧任务产生由于灾难性遗忘导致的性能大幅度下降。本作业的目标是通过复现最新增量学习算法,并与基于深度学习的基线方法进行对比,通过观察训练曲线,直观理解增量学习算法对跨域任务的非遗忘性的影响。基础版本要求学生实现一种经典的增量学习算法,并输出学习曲线,对比和分析增量学习与基线方法的结果差别。进阶版本要求学生通过自主阅读和实现最新增量学习方法,与经典方法进行对比分析。

为了让学生高效地设计和实现模式识别算法,要求学生使用统一的计算平台AI Studio,使用python编程语言及由百度开发的PaddlePaddle开源框架完成所有的课程项目。AI Studio提供充足的计算资源,对高质量完成作业项目提供了算力上的保障。另外,作为课程的重要考核依据之一,统一的平台能够保证课程项目实验结果的公平性,实现完善高效的评分机制。

2.3 实验考核方式

每个课程实验细节和要求在讲授相应教学知识点之后公布给学生。为了给学生足够的自主调研、学习、代码实现和调试时间,每次作业要求学生在发布之后的3周左右时间内完成。每个课程项目的具体任务和要求以详细文档的形式发布给学生,让学生对作业目标、要求及考核方式有清晰明确的认知。最终按照学生提交的作业代码、实验结果和报告内容等按照评分细则进行打分。为了让学生重视理论与实践的结合,成绩构成主要由课程实践项目组成(每个作业20%~25%)。课程实践中涉及的内容能够考核学生的包括理论知识理解、动手编程实践、文献阅读、算法复现、结果分析、报告撰写等综合能力。

3 结论

为适应新一代人工智能规划对人才培养的新要求,从课堂教学、实验设计和考核方法等环节进行探索,进行了“模式识别”课程建设方案的探究。通过突出模式识别课程特色,引入领域最前沿技术、方法和科研问题,设置半开放课程实验项目,激发学生对课程内容的兴趣,帮助学生掌握最前沿技术,提升学生的科研和工程能力。从学生的反馈中发现学生对课程设置较为满意。随着时代的发展,模式识别领域不断涌现新方法、新理论、新技术、新问题,“模式识别”课程将不断积极探索,以适应新一代人工智能对创新人才培养的新需求。

参考文献

[1] 王万森.适应社会需求,办好新一代人工智能教育[J].计算机教育,2017,10:5.

[2] 侯志强,余旺盛,沈明华,等.模式识别课程教学改革实践[J].计算机教育,2017.

[3] 张立言.面向大学生创新创业能力培养的本科生模式识别课程改革思路[J].科教导刊(中旬刊),2018(29):25-27.

[4] Duda R O,Hart P E,Stork D G.模式分类[M].机械工业出版社,2003.

[5] Bishop C M. Pattern Recognition and Machine Learning[M].Springer,2006.

[6] 周志华.机器学习[M].清华大学出版社,2015.

[7] Krizhevsky, A, Sutskever, I, Hinton, G E. Imagenet classification with deep convolutional neural networks[C].Advances in neural information processing systems, 2012:1097-105.

[8] Goodfellow I, Pouget-Abadie J, Mirza M, 等. Generative adversarial nets[C].Advances in neural information processing systems,2014.

猜你喜欢

模式识别研究生教育课程建设
轻身调脂消渴片的指纹图谱建立、化学模式识别及含量测定
汽车外观造型创新设计遗传算法的应用
研究生教育管理中的问题分析及对策研究
MOOC在研究生教育中的应用探究
专业学位研究生教育职业性的缺失与对策研究
“误差理论与数据处理”课程建设的实践与思考
自动洁地机器人的设计
基于卓越计划的金属结构材料课程实践化改革与建设
资源、生态与环境学科群体系下普通地质学课程建设思考
中高职一体化课程体系建设的探索与实践