计算机信息领域的深度学习探析

2021-10-30陈小娟

科学与生活 2021年19期

关键词：图像分割计算机信息卷积神经网络

摘要：本文主要从国内外专家对深度学习定义入手，阐释什么是深度学习，说明计算机领域深度学习的特征，探析计算机信息领域深度学习的内涵与应用，对深度学习可能的发展方向进行展望。

关键词：计算机信息;深度学习;卷积神经网络;图像分割

深度学习是计算机信息领域的一个重要问题，在图像识别、图像分割、语音识别、视频监控、自主驾驶、人机交互等方面具有重要的研究意义和实用价值。

随着电子设备的应用在社会生产和人们生活中越来越普遍，数字图像、语音与视频已经成为不可缺少的信息媒介，每时每刻都在产生海量的图像、音频、视频数据。如何从大量数据中提取需要的信息成为人们关注的主要对象。

准确获得感兴趣目标具体信息，并将获得的信息应用到智能视频监控、机器人导航、人脸识别、数码相机自动定位和聚焦、飞机航拍、卫星图像中道路检测、自主驾驶等等现实任务中成为深度学习技术在计算机信息领域应用的重点研究内容。

一、深度学习简介

近年来，深度学习在图像分类和目标检测等领域取得了突破性进展，成为目前最有效的自动特征学习方法。

深度学习模型具有强大的表征和建模能力，通过监督和非监督的方式，逐层自动地学习目标的特征表示。将原始数据经过一系列非线性变换，生成高层次的抽象表示，避免了手工设计特征的繁琐低效[6]。

目前应用于计算机信息领域的图像识别和图像分割的深度学习，其模型主要包括堆叠自动编码器（Stacked auto-encoders，SAE）、深度信念网络（Deep belief network，DBN）、和卷积神经网络（Convolutional neural networks，CNN）等。

堆叠自动编码器（SAE）模型的实质是多个自动编码器（Auto-Encoder，AE）的堆叠。SAE模型将前一层自动编码器的输出作为后一层自动编码器的输入，逐层对自动编码器进行预训练，然后利用人工神经网络反向传播（Back Propagation，BP）算法对整个网络进行微调。

深度信念网络（DBN）类似于SAE，它的基本单元是受限玻尔兹曼机（Restricted Boltzmann machines，RBM），整个网络的训练分为两个阶段：预训练和全局微调。首先，以原始输入为可视层，训练一个单层的RBM，该RBM训练完成后，其隐层输出作为下一层RBM的输入，继续训练下一层RBM。以此类推，逐层训练，直至将所有RBM训练完成。通过这种贪婪式的无监督训练，使整个DBN模型得到一个比较好的初始值。然后加入数据标签，对整个网络进行有监督的微调，进一步改善网络性能。

卷积神经网络（CNN）是图像识别和图像分割中的研究热点，近年来取得了丰硕成果。图1给出了由LeCun等提出的用于数字手写体识别的卷积神经网络（CNN）结构。

CNN通常包含卷积层、池化层和全连接层。卷积层通过使用多个滤波器与整个图像进行卷积，可以得到图像的多个特征图表示;池化层实际上是一个下采样层，通过求局部区域的最大值或平均值，来达到降采样的目的，进一步减少特征空间;全连接层用于进行高层推理，实现最终分类。

CNN的权值共享和局部连接大大减少了参数的规模，降低了模型的训练复杂度，同时卷积操作保留了图像的空间信息，具有平移不变性，和一定的旋转、尺度不变性。

2012年，Krizhevsky等将CNN模型用于ImageNet大规模视觉识别挑战赛的图像分类问题，使错误率大幅降低，在国际上引起了对CNN模型的高度重视。也因此推动了计算机信息领域深度学习的研究进展。

二、深度学习在计算机信息领域的应用

目前，深度学习技术在计算机信息领域的应用已经达到了一个较深的层次，渐渐深入到人们生活的各个方面。例如医疗影像辅助诊断、刷脸支付技术、指纹识别技术、智能视频监控、机器人导航、数码相机自动定位和聚焦、飞机航拍、卫星图像中道路检测、自主驾驶等等。

2.1医疗领域应用

深度学习在医疗领域中的应用主要有以下几个方面：

医学影像识别应用：医学影像是对疾病诊断的重要方式，放射科和病理科医生，借助医学影像，可以提高诊断效率。目前，国内外医学专家在心血管、肿瘤、神内和五官等领域构建多个精准深度学习辅助模型，取得较好成效。基于计算机信息辅助的深度学习技术可帮助医生快速准确读取病人影像数据。

2.2无人驾驶领域应用

在无人驾驶领域中，使用激光、雷达等类型的传感器比较昂贵，以深度学习为基础的目标检测和识别、目标分割法，具有其明显的优势。利用基于深度学习的计算机视觉信息技术，在无人驾驶过程中，摄像机采集即时视频数据，计算机信息系统对该数据进行理解与分析。包括对目标检测和识别，目标跟踪、车道线检测分离等。为决策控制提供依据，如前车碰撞预警等[7]。目前，深度学习芯片越来越多，为无人驾驶领域提供了更好的支持。

2.3图像搜索领域应用

基于深度学习的图像识别技术，在智慧科学与教育领域有效应用受到人们极大青睐，如拍照植物进行识别类APP、试题拍照APP等。利用拍照提供的图像数据，借助智能计算，获取相关内容的分析与理解信息。深度学习在解决该类问题中的优势极其明显。

2.4安防领域应用

借助计算机信息技术，实现安防智能化。深度学习技术中的人脸识别是该领域重要的应用之一。借助深度学习，计算机加强对人脸检测，对目标特征进行刻画，为后续跟踪和异常行为提供信息依据。

三、总结

深度学习是目前最热门的机器学习方法，在计算机信息领域被广泛研和应用。本文从深度学习定义入手，探析了深度学习在计算机信息领域的应用。

在今后的工作和研究中，还要进一步完善深度学習理论，拓展深度学习技术在计算机信息领域的研究深度，激发深度学习在计算机信息领域应用中的潜力。

参考文献

[1]卢宏涛，张秦川.深度卷积神经网络在计算机视觉中的应用研究综述.数据采集与处理[J]，2016，31（1）：1-10

[2]刘泽宇.计算机人工智能的发展现状及趋势[J].数字技术与应用，2018，36（2）

[3]刘海玲.基于计算机视觉算法的图像处理技术[J].计算机与数字工程，2019，47（3）：672-676

[4]张新斌、康昌春、李文珲.基于深度学习角度探析医学影像大数据[J].现代信息科技

[5]刘建伟，刘媛，罗雄麟.深度学习研究进展.计算机应用研究[J]，2014，31（7）：1921-1928

[6]张慧，王坤峰，王飞跃.深度学习在目标视觉检测中的应用进展与展望[J].自动化学报，2017，43（8）：1289-1305

[7]Masci J，Meier U，Ciresan D，Schmidhuber J. Stacked convolutional Auto-encoders for hierarchical feature extraction[J]. In：Proceedings of the 21th International Conference on Artificial Neural Networks. Berlin Heidelberg，Germany：Springer，2011.52-59

[8]Vincent P，Larochelle H，Bengio Y，Manzagol P A. Extracting and composing robust features with denoising Auto-encoders[J]. In：Proceedings of the 25th IEEE international Conference on Machine Learning（ICML）. Helsinki，Finland：IEEE，2008.1096-1103

湖北省教育廳科学研究计划指导性项目：深度学习在乳腺MRI肿瘤分割中的应用研究（B2020340）

作者简介

陈小娟出生年：1983，性别：女，籍贯：湖北荆门，学历：大学本科，职称：实验师，研究方向：机器学习、教学质量。