APP下载

深度学习应用于目标识别

2020-02-25

福建质量管理 2020年3期
关键词:图像识别高层机器

(北京物资学院 北京 101149)

一、前言

近些年,我国物流发展迅速,同时出现现代化、智能化的趋势。现在的物流环节中主要存在着两个问题,其一是订单增长过快,传统人工模式,响应不够及时,完成效果有明显不足,其二是场地,人工等成本的增长,让物流企业承担着较大的压力。因此机器人已经广泛的应用于工业与物流的各个环节之中,不仅降低了物流企业的成本,同时提高了物流企业各个环节的效率。随着各种智能配件与传感器等应用于物流机器人中,解除了机器人自身的各种限制,使得机器人拥有了感知能力,让机器人可以识别、处理、收集各种信息,例如RFID技术,通过电磁波实现电子标签的读写与通信。

识别技术也广泛的应用于我们的生活之中,语音识别,图像识别等,例如解锁用到的指纹解锁,人脸解锁等,用于翻译的文字识别等。这些技术的广泛应用都依靠机器视觉。机器视觉是用机器人与摄像头的配合实现对人眼功能的模拟,特点是应用方便、速度快、精度高、控制简单。机器视觉使用摄像机采集场景图像,并通过图像处理与分析[1]。机器视觉在工业生产过程中,应用于识别、检测、分拣等过程,机器视觉的应用既降低了成本,又提高了效率。

人工智能一直是各种研究的热点,而机器学习是人工智能的核心,是让机器拥有智能的重要途径。而深度学习是近些年研究的新方向与热点。通过对于人工神经的模拟,实现对数据的利用,取得知识。深度学习的发展加强了目标识别与定位技术的发展。随着卷积神经网络的深入研究,被广泛的应用于图像识别。在2013年的Image Net大规模视觉识别挑战比赛大部分参赛队伍都用上了深度卷积网络。

深度学习在信息技术发展的现代,在大数据背景的下,可以自主的进行学习,无需人工参与的学习方法,无疑会成为研究热点,并深刻的影响人们的生活。

二、机器学习的发展

机器学习主要分为两类研究方向:第一类是传统机器学习的研究,该类研究主要是研究学习机制,注重探索模拟人的学习机制;第二类是大数据环境下机器学习的研究,该类研究主要是研究如何有效利用信息,注重从巨量数据中获取隐藏的、有效的、可理解的知识。

图像识别的主要目的是对图像、图片、景物、文字等信息经过处理和识别,来解决计算机与外部环境的直接通信过程[2]。图像识别主要分为三个阶段:获取图像、处理图像、图像分类。图像获取,是指在通过摄像头进行获取或者在输入需要识别的图像后,对其进行转化,使得机器可以识别和处理输入图像。图像处理,包括预处理与特征提取,预处理是指将输入图像进行优化改善,以便于加快后续识别与处理的速度与精度。特征提取是将输入图像的高层特征转化为底层特征,这些底层特征可以一定程度上表示图像包含的元素和数值,同时与设定特征进行比较,进而进行图像的识别。图像分类,即根据图像处理后的结果,通过其中的特征、信息等数据与设定进行对比,进而进行对输入图像的识别、定位、分类。

图像的特征提取,主要分为两部分,高层特征与底层特征。相对来说,底层特征较为简单,是通过简单处理就可以得到的,就像是一眼可以看出来的特征,例如形状特征,颜色特征。而高层特征就像是人的思考模式,人的思维所确定的特征。传统的机器学习工作时,用于描述图像的特征一般是由人为设定,这称为特征工程,所以设定的特征好坏很大程度影响到识别效果。即使采用的人为设定特征的方法,高层特征也会面临诸多问题,特征相近却错误,特征不全导致识别错误等。所以普通的发展很难提取合适的高层特征,即使提取了高层特征,也无法很好的体现输入图像的高层特征,也就造成了图像识别的发展的瓶颈。但是大数据环境下的机器学习的研究一定程度上解决了高层特征的问题。

深度学习是机器学习在大数据环境下热门的研究领域。深度学习始于神经网络。神经网络的初衷是想通过像人一样的神经网络,赋予机器人像人一样的思维模式与思考方式,进而可以像人一样识别和处理图像、文字、语音等。深度学习通过神经网络的配合用于从底层特征中提取更加深层的高层特征,可以更好的表现图像的分布式特征,更丰富的表达图像的内在信息。深度学习的发展有三个主要的原因,首先,计算机计算能力的提升,即GPU性能足够进行深度学习的计算;其次,是训练数据增加与共享,使得学习的成本降低;最后,是深度学习模型规模的改变。

深度学习算法在高层特征的提取中,有两个方面的重点,第一个是多层次的非线性信息处理,第二个是学习过程中是否有监督学习。深度学习的高层特征由底层特征综合学习得到,这种过程因为是自主学习,减少了人为因素的影响,同时可以更全面、更抽象的表达特征。而有监督的深度学习,可以让训练结果更加接近设计目标。深度学习可以使用一种更加简单的方式完成较大的函数集合的嵌套,一个复杂函数,一般的单层结构神经网络很难表达,而多层神经网络,可以看成函数的嵌套,就可以使用简单的方式表达复杂函数,在表达的同时还可以不破坏原有函数的线性表达。

三、深度学习的常用方法

深度学习的常用方法主要包括两种,分别是深度信念网络(DBN)和卷积神经网络(CNN)。

深度信念网络由多层学习模型所组成,以深度神经网络为基础,使用其训练结果作为初始权值,再使用其他算法对权值调整,以达到目标。深度信念网络由多层限制性玻尔兹曼机构成,可以通过有效的无监督贪婪训练方法进行训练。深度信念网络适用于缺少训练数据的情况。通过合适的算法进行对初始权值的确定,有益于模型的性能,提高模型速度。

卷积神经网络由多个卷积层、池化层和全连接层组成。卷积神经网络具有表征学习(representation learning)能力,能够按其阶层结构对输入信息进行平移不变分类(shift-invariant classification),因此也被称为“平移不变人工神经网络(Shift-Invariant Artificial Neural Networks,SIANN)”[3]。

四、总结

深度学习作为人工智能重要的研究方向,通过对图像数据的学习,自主的发现图像的特征。卷积神经网络的出现,极大的提高了特征提取的处理速度和识别精度。将深度学习用于目标识别,可以减少物流企业中的成本与工作效率。

猜你喜欢

图像识别高层机器
高层动态
机器狗
机器狗
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
图像识别在物联网上的应用
未来机器城
图像识别在水质检测中的应用
某超限高层结构设计
高层楼宇灭火装备