APP下载

关于心理学加强智能课程教学的实践思考

2017-11-06费定舟

计算机教育 2017年10期
关键词:语音识别神经网络深度学习

费定舟

摘 要:针对目前国内心理学界关于心理学教学中要不要开设深度学习课程的争论,分析深度学习课程开设的必要性,从脑电EEG信号处理到语音系统分析等教学和研究领域的发展现状入手,论证深度学习已介入心理学很深,而且心理学研究和深度学习有着共同的目标:理解人类大脑的认知规律。针对心理学界开设深度学习课程所遇到的困难和教学实践,提出边做边学的教学策略。

关键词:人工智能;深度学习;神经网络;语音识别;脑电EEG

0 引 言

在心理学中,开设人工智能等课程已经成为心理学界的共识。在美国心理学界,开设人工智能课程,像知识表达与推理、启发式搜索、概率推理模型的院校比比皆是。在国内,即使不冠上智能科学的名称,心理学有很多课程也与人工智能有关,如认知心理学中智能理论(IQ测量)、知识表征理论、人机交互的认知模型等。国内心理学课程涉及的上述内容大多只是这些理论在心理学中的应用,点到为止,但在实践中,心理学有了解这些有一定难度的知识的需求。因此,在心理学中开设与智能科学相关课程要开到什么程度是一个亟须澄清的问题。另外,在很多心理学界之外的人看来,国内开设深度学习课程的高校并不多,一般多在计算机或信息类专业的本科高年级开设,心理学系开设这门课程让人疑惑。但是从人工智能发展的历史和源头来看,从心理学研究的对象和方法的演变来看,正是心理学提供了人工智能研究的概念源头和原型,人工智能的深度学习来自于心理学家的研究工作。另外,心理学也同人工智能一样使用统计模型和算法,只不过是以心理学特有的表述方式使用,而且,人工智能的算法和模型已经渗透到心理学研究和教学中。

1 开设深度学习课程的必要性

1)深度学习来源于心理学。

像人工智能一样,深度学习的源头来自心理学。深度学习是人类大脑工作机制的一种模型,来源于神经网络,而神经网络的灵感来自于心理学中的大脑的神经元模型,人工智能和深度学习两者有着共同的源头。Yoshua Bengio 解释了为什么复杂神经网络是人们长久以来一直追求的真正人工智能的关键[1],要让计算机像人类一样聪明,就应该依照人脑的工作方式给计算机编程。

2)脑科学深化的必然选择。

从目前的发展趋势来看,深度学习的介入对脑科学的深化是必不可少的。脑电信号(EEG)是在人的头部的一定部位放置8~16个电极,经脑电仪将人的脑皮层的生物电活动(在外在刺激下)放大并连续表示的图形。人的大脑在正常情况下,脑电图有一定的规律可循,当脑部尤其是皮层有病变时,规律会发生不同程度的变化,即波形异于平常,而对其波形进行分析,可辅助临床对脑部疾病、人类认知活动进行诊断。但是这些信号很容易受大脑皮层的干扰以及其他噪声的作用,所以极易变形。以有关计算机科学家在恢复信号方面用基于卷积神经网络的深度学习检测P300的信号(见图1)为例,这些P300信号的可靠性备受心理学界的关心,但是很多心理学研究人员的主观判断导致这些实验结果的客观性受到质疑。检测单次刺激P300信号(即不经过叠加平均)、在叠加了背景脑电和噪声的信号中正确识别出P300波形等问题依然有待研究,但是卷积神经网络对分析P300信号有不错的效果[2],在语音识别和图像处理方面也有其他模型无可替代的精度优势。

2 开设深度学习课程的可行性

1)语音识别系统的成功实践。

在语音识别系统方面,深度学习取得了极大的成功。理论上,神经网络可以拟合任何函数,在一定程度上甚至可以模拟人脑的思维过程,但是这一切都建立在神经网络必须足够深足够大的基础上。但是,当网络层数太多了之后,训练就难以收敛或者只能收敛到一个次优的局部最优解,性能反而还不如一两层的浅模型。作为心理学家的Hinton在Science发表的“Reducing the dimensionality of data with neural networks”[3]一文中提出了利用RBM预训练的方法,即用特定结构将网络先初始化到一个差不多“好”的程度,再回到传统的训练方法(反向传播BP),这样得到的深度网络似乎就能达到一个不错的结果,从一定程度上解决了之前网络“深不了”的问题。

在这个框架下,深度学习重新得到了人们的重视,让神经网络有了前所未有的“更深”的可能。心理学要想跟上时代,研究人脑的功能,必须重视深度学习,借助语音分析系统和EEG、ERP这类心理学实验仪器设备实现心理学的终极目标。

2)图像识别的成功应用。

深度学习应用于图像识别的任务取得了成功[4]。众所周知,深度学习的目标是模仿人类神经网络感知外部世界的方法。如果把人想象成计算机,那么语音和图像就是最主要的input形式(文本或者自然语言处理也是input)[5],既然人能够很好地识别图像和语音,那么这个试图模仿人类大脑的深度学习算法也自然能像人一样听清语音、看清图片。以心理学家借助Deepmind进行的心理学实验为例,采用经典形状偏好的实验方式,首先,给深度神经网络提供3种物体图像,即探测物体、形状匹配物体(与探测目标形状相同,颜色不同)和颜色匹配物体(与探测物体形状不同,颜色相同);然后,定义偏好,即将探测图像的标签分配为形状匹配图像的标签而不是颜色匹配图像标签所出现的比率;接着,使用深度神经网络,即匹配网络和 Inception 基准模型完成这次实验。通过研究样本分类辨别分类的结果(标签分类)与儿童的物体识别偏好是否一致,或者说深度学习是否有发现机制的能力。实验结果表明,神经网络像人类一样更倾向于物体形体而不是颜色或纹理来形成物体概念,所以它们有着“形状偏好”。认知心理学和儿童发展心理学通过大量实验发现儿童对物体的识别(概念形成)有一些偏好,例如偏好识别整个物体而不是部分、通过形状识别物体而不是通过颜色和纹理。实验结果的对比表明,深度学习已经可以在图像识别方面有效运用,为深度課程的开展提供了有利条件。endprint

3 困难及解决措施

3.1 困 难

在心理学系开设人工智能课程的实践表明,同学们对这门课的兴趣是很浓厚的,但是也存在畏难情绪,主要原因是对于课程里包含的很多基础知识,如线性代数、概率论与数理统计等了解不多,尽管心理学用到很多统计学的知识,但是通常只要求会操作统计程序软件即可,算法方面的知识也是缺乏的。

3.2 解决措施

1)运用边做边学的教学策略。

边做边学的教学策略是基于学生的实际情况提出的,具体的做法是:让学生先学会操作流程,培养感性知识,缓解畏难情绪。这一点与学习统计学课程的方法相似,在对统计学知之不多的情景下,先学会软件的操作流程,培养感性认识,再结合具体例子,了解统计学的知识。在实践的同时利用相关课程,如认知心理学课程来讲解人机交互技术,把语音处理的深度学习原理也包括进来[6]。

2)利用MOOC等网络平台的课程自学。

MOOC等网络平台为学生自学某些课程提供了极大的便利,学生可以根据自己的实际情况有针对性地学习相关课程。如果学过线性代数、微积分、概率论和编程,可以考虑从斯坦福大学的相关课程开始。这门课内容广泛,每次课的幻灯片都可以下载,虽然官方网站删除了配套的视频,但是很容易就能在网上搜索到。如果没有学过那些数学课,网上也有很多免费的学习材料可以用来学习必要的数学知识,Gilbert Stange的线性代数课程很适合入门。对于其他科目,edX上有MIT的微积分和概率论课程。如果想学习更多关于机器学习的东西,Andrew Ng在Coursera上的机器学习课程是大多数人的入门选择。除此之外,Yaser Abu-Mostafa的机器学习课程更关注理论,也很适合初学者。

4 结 语

心理学开设与智能科学相关的课程成为心理学界的共识,但是讲授什么样深度的课程是对教学方法的考验。心理学与人工智能共同的研究目标决定了在心理学系开设深度学习课程的必要,实践教学的探索有成功也有不足之处,在教学上虽然有难度但也是可行的。智能课程在心理学教学中的发展还需要在实践中不断改进和完善。

参考文献:

[1] Bengio Y. Learning Deep Architectures for AI[J]. Foundations and Trends in Machine Learning, 2009, 2 (1): 1–127.

[2] Cecotti H ,Graser A.Convolutional Neural Networks for P300 Detection with Application to Brain-Computer Interfaces[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2011, l33(3): 433-448.

[3] Hinton G, Srivastava N, Krizhevsky A, et al. Improving neural networks by preventing co-adaptation of feature detectors[J]. Computer Science, 2012, 3(4): 212-223.

[4] Collobert R, Weston J, Bottou L. Natural Language Processing (Almost) from Scratch[J].Journal of Machine Learning Research, 2011: 2493-2537.

[5] He K, Zhang X, Ren S.Deep Residual Learning for Image Recognition[J]. Clinical Orthopaedics and Related Research, 2014: 770-778.

[6] 张毅. 语音处理及人机交互技术[C]. 北京: 科学出版社, 2016.

(實习编辑:景贵英)endprint

猜你喜欢

语音识别神经网络深度学习
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
基于自适应神经网络的电网稳定性预测
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
通话中的语音识别技术
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
深度学习算法应用于岩石图像处理的可行性研究
基于深度卷积网络的人脸年龄分析算法与实现
面向移动终端的语音签到系统