APP下载

人工智能元素融入大学数学课程的可行性探析

2021-11-20倪丹

山西能源学院学报 2021年5期
关键词:梯度人工智能

倪丹

【摘 要】 目前,人工智能相关的大学教育越来越受到重视。人工智能需要坚实的数学基础。大学数学课程体系中的《微积分》《线性代数》《概率论与数理统计》三门课程,在理论和实践上都与人工智能有着密切的联系。本文列举并分析了一些具体的数学知识及其在人工智能方面的应用,这些探讨都展示了将人工智能元素渗透到大学数学课程中的可行性。

【关键词】 人工智能;梯度;泰勒级数;线性变换;贝叶斯公式

【中图分类号】 O1-4 【文献标识码】 A 【文章编号】 2096-4102(2021)05-0030-03

随着人工智能的迅速发展,我国制定了相应的国家发展战略,将人工智能的普及、推广和基础教育置于非常重要的位置。

大学本科阶段的数学作为广义高等数学教育的起点,其知识体系主要由《微积分》《线性代数》《概率论与数理统计》这三门课程构成。人工智能所需要的最基本的数学知识主要来自于这些课程。笔者认为,在这些数学课程中渗透人工智能思想,将对点燃学生对于人工智能学习兴趣的火花大有裨益。以下就这三门课中一些与人工智能有密切关联的知识进行举例分析,希望对相关数学课程的教学改革起到抛砖引玉的作用。

一、人工智能与《微积分》

(一)梯度

人工智能的主要思想是寻找一种用于数据分类和预測的优化拟合函数。因此,优化理论在人工智能实践中起着非常重要的作用。在一定约束条件下,找到目标函数的最优值就是我们所说的最优化。大学微积分课程中便有不少优化方面的内容。比如,在多元函数微分方法及其应用一章中,课本在介绍完方向导数之后引入了梯度。我们知道,梯度的方向是获得方向导数的最大值的方向,梯度的值则是方向导数的最大值。为了获得对梯度的清晰认识,我们可以追溯到介绍导数的含义和几何背景的章节。

梯度可以看作是导数的多变量推广。与标量值的导数不同,梯度是一个向量值函数,它表示函数图切线的斜率。更精确地说,梯度的负方向是函数达到其局部最小值的最快方向。梯度下降法是人工智能实践中常用的优化算法。它的核心思想是在当前位置找到梯度的最快下降方向,以便逐步逼近最优目标函数。

梯度则指明了从当前位置下降的最陡方向。以二元函数为例,目标函数J(w)将表示为J(w1,w2)。相应的三维图形类似于一座山,谷底对应于J(w1,w2)的最小值,而坡度(梯度的反方向)则指出了下山最快的方向(见图1)。

(二)泰勒级数

人工智能的强大之处是其算法的效率和准确性。当运用人工智能技术解决一个实际问题时,常常需要一个具体的数学模型。而许多问题的数学模型通常很复杂。这些复杂的问题往往难以解决甚至不可能精确地解决。这时,找到一个不那么精确但有效的解决方案可能是最好的选择。而微积分中的泰勒公式的最大优点是它将一个复杂的函数近似为一系列幂函数的简单线性叠加,从而便于比较、求导、求积分和求解微分方程等。这一优点使得泰勒级数成为研究神经网络的有力工具。

“无穷级数”章节里,我们可以看到使用泰勒级数来逼近函数的神奇效果:以y=ex在x=0处的3阶、7阶泰勒展开为例,见图2。

《微积分》是人类数学史上和人类思维领域最伟大的成果之一,而人工智能在某种意义上是对人类思维的模拟和进一步发展。从上面梯度和级数例子的展示,我们可以看到,学生在微积分课堂的学习中,已经可以直接追溯探讨到人工智能主要思想的起点。

二、人工智能与《线性代数》

人工智能技术最终都是建立在与《线性代数》密不可分的数学模型之上的。特别是在处理多维数据时,需要用《线性代数》简洁明了地描述问题,为分析和解决问题打下基础。事实上,随着机器视觉成为人工智能的重要组成部分,投影技术和映射技术越来越受到人们的重视。而投影和映射的基本原理便来自于线性代数。

大学线性代数课程中的一个重点内容是线性变换。当我们将一个线性变换作用于一个向量时,通常指将一个矩阵与一个向量相乘,几何意义上通常意味着该向量被旋转和缩放。如果将线性变换看作是一种运动,那么矩阵A的特征值和特征向量正好对应了运动的速度与方向。

在本科阶段的线性代数课程中,我们便可以接触到以上所述的相关内容,比如,线性变换如何通过矩阵乘法来实现:设[A=a11   a12a21   a22]为二阶矩阵,[X=x1x2]为列向量,于是我们可得以下乘法:[AX=a11   a12a21   a22x1x2=a11x1+a12x2a21x1+a22x2=y1y2=Y]。这意味着向量X在线性变换下被向后旋转和缩放成Y,该线性变换的几何显示如图3所示。

而如果下式成立:[AX=a11   a12a21   a22x1x2=a11x1+a12x2a21x1+a22x2=λx1λx2=λX=Y],其中λ是A的特征值,而非零向量,X称为A对应于特征值λ的特征向量,则线性变换的几何显示如图4所示。

在现实世界中,诸多人工智能应用中我们都可以看到线性代数的影子,比如人脸识别技术。Paul Viola和Michael J.Jones在2001年和2004年发表了经典的《Rapid Object Detection using a Boosted Cascade of Simple Features》和《Robust Real-Time Face Detection》,提出了基于Haar-like特征和Adaboost分类器的开创性人脸识别算法。其中轮廓定位部分,说的是模型从训练的样本(如图片集)中学习到了眼耳鼻喉等关键点的坐标,即轮廓点定位。这样的训练过程能够得到人脸的均值轮廓。而一个人的脸部轮廓是可以通过这个均值轮廓进行线性变换得到的。

具体以人脸识别投影过程中需要用到的仿射变换为例。仿射变换一般包括平移变换、旋转变换、缩放变换、错切变换、翻转变换等。简单举例如下:

①旋转变换的向量表示为[xy=cosθ-sinθsinθ-cosθxy],譬如分别取θ为[π6]、[π4]、[π3]、[π2],向量[11]即可顺时针旋转相应的角度。

②翻转变换(以关于y轴的翻转为例)的向量表示为[xy=-1    0   0    1xy],。

三、人工智能与《概率论与数理统计》

《概率论与数理统计》也是人工智能研究中极其重要的数学基础。概率论为人工智能提供了随机性,为预测提供了基础,而数理统计有助于解释机器学习算法和数据挖掘的结果。就机器学习而言,它是人工智能的核心,是实现计算机智能化的根本途径。更具体地说,机器学习是用实例数据或过去的经验对计算机(智能系统)进行编程,以优化性能标准。在概率论中,过去的经验是指先验概率,从中可以根据新的信息获得后验概率,而机器学习的最终目标是学习后验概率。

回到大学数学课程《概率论与数理统计》中的“条件概率”章节部分,我们可以看到连接先验概率和后验概率的Bayes公式:

首先假设B1,B2,…,Bn为一个概率空间中的完备事件组,这意味着它们的并集是整个空间,于是有

[PBjA=P(ABj)P(A)=P(ABj)P(Bj)j=1nP(ABj)P(Bj)]

其中[P(A)≠0]

上述重要的Bayes公式通常用于计算后验概率,公式中的条件概率[P(BjA)]即为后验概率,而[P(Bj)]是先验概率。从某种意义上说,[P(ABj)]是新的信息。假设新的信息被加入后,后验概率[P(BjA)]将成为另一轮利用贝叶斯公式得到新后验概率的先验概率。这就是机器学习的工作原理:不断的学习和不断的修改。

目前人工智能领域最有效的推理工具之一是贝叶斯网(Bayes Network),它是一种描述变量间不确定因果关系的图形网络模型,贝叶斯网就是起源于条件概率和贝叶斯模型。

四、结语

以上三方面的讨论展示了大学数学课程与人工智能相关知识有着千丝万缕的联系。通过精心的教学设计,将人工智能元素渗透到大学數学课堂是可以实现的。随着人工智能普及教育在大学教育中的地位越来越突出,人工智能与数学等相关学科、相关课程的交叉融合也将成为未来教育发展的趋势。数学作为人工智能相关专业的核心基础课程,对后续的学习研究起着至关重要的作用。在数学课程中渗透人工智能元素,不仅可在人工智能相关的专业素养训练方面事半功倍,而且还可以激发学生探索研究人工智能知识的兴趣。故此,这将是人工智能教育与数学教育的双赢尝试。

【参考文献】

[1]国务院.新一代人工智能发展规划[EB/OL].[2017-07-20].http://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm

[2]教育部.高等学校人工智能创新行动计划[EB/OL].[2018-04-03].http://www.moe.gov.cn/srcsite/A16/s7062/201804/t20180410_332722.html

[3]同济大学数学系.高等数学:第7版(下册)[M]. 北京:高等教育出版社,2014:106-108.

[4]李武军,王崇骏,张炜,等.人脸识别研究综述[J].模式识别与人工智能,2006,19(1):58-66.

[5]曾文锋,李树山,王江安.基于仿射变换模型的图像配准中的平移、旋转和缩放[J].红外与激光工程,2001(1):18-20,17.

[6]李敏.人工智能数学理论基础综述[J]. 物联网技术,2017,7(7): 99-102.

猜你喜欢

梯度人工智能
人工智能之父
一个具梯度项的p-Laplace 方程弱解的存在性
内容、形式与表达——有梯度的语言教学策略研究
2019:人工智能
航磁梯度数据实测与计算对比研究
人工智能与就业
数读人工智能
初高中物理教与学的衔接策略
如何让化学作业更高效
下一幕,人工智能!