APP下载

深度学习:人工智能发展的驱动引擎

2018-03-26周文芃

数字通信世界 2018年12期
关键词:特征提取机器卷积

周文芃

(北京市第四十四中学,北京 100045)

1 引言

人工智能是计算机工程与科学的重要研究领域,随着2016年AlphaGo对战国际著名围棋手李世石一役其逐渐进入大众视野,更获得进一步蓬勃发展。推动人工智能快速发展的三大基石分别是大数据、大规模并行计算与深度学习,其中相对来说深度学习更是其核心所在。

深度学习由机器学习和多层神经网络演化发展而来,其本质是通过模拟人脑结构和机理建立分层结构模型,对海量数据从底层到高层自动获得层次性多层次表达,进行逐级特征提取,从而很好地建立从底层信号到高层语义的映射关系[1-2]。在大数据和人工智能背景下探析深度学习的发展动机和理论基础,进一步理解深度学习常用算法模型,进而探索深度学习发展的挑战及前景具有重大现实意义。

2 深度学习的发展背景及动机

机器学习是现代信息技术发展的新兴产业,它是在计算机技术、控制决策论、信息论、神经生物科学、语言学等多学科交叉基础上,以大数据为基础发展形成的一门模拟人类智能的科学技术[3]。人工智能下的机器学习开启了科学研究的第四范式,其核心是在计算机技术的载体下,借助计算机来模拟人的思维方式,进而应用到实际生活中,帮助人类处理实际问题。根据学习模型的层次结构可将机器学习分为浅层学习和深层学习两种类型。

20世纪80年代以来,机器学习在理论、算法、模型和实际应用中取得了巨大成就,尤其是浅层学习模型在计算机领域获得广泛应用。但随着信息化时代的来临,由于浅层学习模型通过运用专家经验进行数据特征提取,主要用于分类和回归预测的特点使得机器学习在模拟人类智能时样本特征提取主要依靠专家经验,而人类大脑学习则是全自动状态,因此传统机器学习具有一定局限性[4],极大程度上制约着人工智能技术的发展。信化时代的到来使得大数据已充斥在人类生产和生活当中,大数据不仅改变着经济产业现状,更改变着基于概率与统计意义下的数据分析原理,促进着新一轮数据科学的创新。大数据时代数据的规模性、多样性、时效性和价值性上的复杂特性,大数据含有复杂的信息维度,传统的浅层学习处理、分析大数据时处于欠拟合状态,基于人工规则构造特征的“大数据+浅层学习模型”不能从本质上挖掘海量数据结构特征,因此利用大数据来学习特征,进行深度学习模型研究更能够揭露数据内涵本质信息。此外,人类大脑神经中枢在进行信息处理时信息特征具有逐层传递的特征,当信息由人类器官经过连续多层神经网络系统传递到大脑时,每个层次的神经元都会进行激发以识别信息特征,比如在人类视觉原理中,视觉信息先从原始信号摄入开始,逐渐经过各类层次神经网络提取一些物体的特征,最后不同的高级特征就组合成相应的图像,从而能够让人准确的区分不同的物体。这种分层处理机制启示了人工智能专家开发构造新一轮机器学习模型进行分层表达和无监督学习的构想。因此,2006年 Hinton等人提出的深度学习便在此背景和动机下应运而生。

3 深度学习的基本原理与模型简介

在2017年机器学习领域著名神经信息处理系统进展大会上Google工程师Ali Rahimi在发言中提到,“深度学习成就了今天的炼金术”,这个比喻极大说明了当今深度学习理论的缺乏,因此探究深度学习的基本原理具有重大意义。深度学习充分借鉴了人脑神经系统的神经网络分层结构,其实质是通过多层结构对每层数据中信息进行特征提取的非线性组合,从原始数据开始将每层特征逐层转换为更高层的抽象表示,从而发现高维数据复杂的结构特征。深度学习算法目前大多基于的深度神经网络,可以通俗理解为多层神经网络,通过每个神经网络训练出一系列数据特征,当实际输出结果与目标函数有一定差距时,就会进行反馈再训练,直到结果已经收敛。此外,大数据赋予了深度学习极大机遇,目前深度学习的基本方式也是大数据驱动的深度学习方式,是机器的自主学习,即让机器自己的去学习的一种技术,其中比较、优选、积累、提炼、再比较、再优选、再积累、再提炼,采用由上而下的监督训练方法,由下而上的非监督学习就是人工智能的机器学习深度学习的路径。

下面介绍两个目前了解的常用深度学习模型,Adam算法模型和卷积神经网络模型。Adam算法是一种可以替代传统随机梯度下降过程的一阶优化算法,它与传统随机梯度下降算法不同,学习率在自适应训练学习中通过一阶矩和二阶矩估计不断变化,通过训练数据迭代来不断更新神经网络权重。Adam的名字来源于适应性矩估计(Adaptive Moment Estimation),Adam优化算法应用具有直截了当地实现、高效的计算和所需存储内存较少等优势。卷积神经网络模型是目前深度学习最常用的算法之一,他与传统神经网络算法不同,包含了一个由卷积层和子采样层构成的特征抽取器,充分利用了数据本身包含的局部性等特征优化网络结构,并且保证某种程度上的不变性[5],深度学习最真正的成功就是卷积神经网络,卷积神经网络主要包括卷积部分和全连接部分,卷积部分包括卷积层、激活层和下采样层,其中下采样层通过叠加提取特征信息,全连接部分则连接特征提取和输出计算损失,和完成识别分类等功能。

4 深度学习发展的挑战及展望

在大数据和人工智能信息化时代,深度学习具有广阔发展前景并面临巨大挑战。深度学习横跨了计算机科学、工程技术和统计学等多门学科,并应用于政治、天文、地理及社会生活等广泛的领域,能够处理高维稀疏的数据,但是深度学习依旧面临着严酷的挑战,比如数学理论的缺乏:算法的稳定性、深度算法需要多少隐层,在大规模网络中,需要多少有效参数是目前需要解决的问题,并且在运用经典的深度模型时,实验结果可能不理想,这就要求根据特定的问题和数据来优化深度学习的网络结构。再进而如何将深度学习更进一步应用于大数据信息化时代,挖掘数据背后潜藏的价值也是深度学习领域重点关注的问题。Google的AlphaGo使得更多人了解深度学习,人工智能目前已逐渐大众化,基于大数据分析尤其是深度学习的智能理论与产业结合是目前我国乃至全世界密切关注、探索的问题,深度学习领域的计算机视觉、自然语言处理、图像识别等在未来将会大有作为,深度学习和复杂推理的有效结合必将推动人类实现人工智能的终极目标,更好服务于全社会。

猜你喜欢

特征提取机器卷积
机器狗
机器狗
基于3D-Winograd的快速卷积算法设计及FPGA实现
基于Gazebo仿真环境的ORB特征提取与比对的研究
从滤波器理解卷积
基于Daubechies(dbN)的飞行器音频特征提取
未来机器城
基于傅里叶域卷积表示的目标跟踪算法
Bagging RCSP脑电特征提取算法
基于MED和循环域解调的多故障特征提取