APP下载

集成卷积神经网络的图像分类

2020-01-16邓波

电子技术与软件工程 2019年22期
关键词:分类器梯度标签

文/邓波

传统的机器学习方法(例如多层感知机,支持向量机等)大多使用浅层结构来处理有限数量的样本和计算单元。当目标对象具有丰富的含义时,复杂分类问题的性能和泛化能力显然不足。近年来开发的卷积神经网络(CNN)擅长处理图像分类和识别问题,并在许多机器学习任务的准确性方面带来了极大的提高,因此已广泛应用于图像处理领域。它已成为强大而通用的深度学习模型。

1 卷积神经网络图像处理

卷积是数学中的重要分析运算。它是一个数学运算符,它从两个函数f 和g 生成一个第三函数,代表函数f 和函数g 之间已被翻转或平移的重叠区域。针对传统影像分类方法提取特征复杂,特征表达能力低的问题,基于卷积神经网络基础上,来进行图像分类处理。首先,构建深度卷积神经网络来训练图像数据集,以学习两个完全连接的层的输出,这是图像的两个高级特征。然后,使用多内核学习来训练这两个高级功能的内核功能,以便可以将它们映射到高维空间,这两个功能可以自适应地融合在一起。最后,结合这些功能,在图像处理中,数字图像可以看作是二维空间的离散函数,表示为f(x,y)。假设存在二维卷积函数g(x,y),则输出图像z(x,y)可用以下公式表示:

其中f 表示输入图像G,表示卷积核m和n 的大小。假设卷积核的数量为K,则通过上述卷积运算获得的原始图像的输出为卷积内核数×卷积后的图像宽度×卷积后的图像长度。

以这种方式,卷积运算可用于提取图像特征。实验结果表明,与现有的基于深度学习的分类方法相比,卷积运算在分类精度,误差和Kappa 系数方面取得了更好的效果。在实验测试集上,上述三个指标分别达到96.43%,3.57%和96.25%,并获得满意的结果。类似地,在应用中,当输入为包含三通道RGB 的彩色图像,并且图像由每个像素组成时,输入为3×图像宽度×图像长度的高维数组,计算参数也是高维数组。

2 集成卷积神经网络图像分类意义

随着移动互联网技术的飞速发展,越来越多的图像信息被存储在互联网上。图像已成为继文字之后的另一重要网络信息载体。在这种背景下,利用计算机对这些图像进行智能分类和识别,使其更好地为人类服务是非常重要的。在图像分类和识别的初始阶段,人们主要使用这项技术来满足一些辅助需求。使用OCR 技术从图像中提取文本和信息,对于基于图的半监督学习方法构造可以捕获固有数据结构的良好图形非常重要。该方法被广泛用于带有少量标记样本的高光谱图像分类。然而,大多数基于SR 的算法都没有考虑HSI 的丰富空间信息。应用卷积神经网络(CNN)来提取对象分类的不变特征,使用共享权重相同的多通道卷积来减少同一类别中具有不同旋转度的样本对的特征方差。结果,同时遇到均匀物体的不变性和旋转不变性,以改善图像特征的不变性。

3 集成卷积神经网络在图像分类中的应用

通常,一个集成卷积神经网络由输入到输出的输入层,卷积层,激活层,池层,完整连接层以及最终输出层组成。卷积神经网络层建立了不同计算神经节点之间的关系,并逐层传输输入信息,而连续卷积池结构则将原始数据的特征信号解码,推导,收敛并映射到隐藏层特征空间。

在应用集成卷积神经网络进行图像分类的过程中,损失函数是整个网络模型的评估标准。它不仅代表网络参数的当前状态,而且还提供梯度下降法中的参数梯度,因此损失函数是深度学习训练的重要组成部分。通过梯度分析将Softmax 函数的输出用作判别函数,可以找到损失函数到Z 的梯度:

从公式可以看出,当输入值为正时,线性整流单元的梯度为1,因此上层的梯度可以反向传输到下层而不会衰减。具体而言,通过图拉普拉斯正则化将空间信息纳入SR 模型,该模型假设空间邻居应具有相似的表示系数,因此获得的系数矩阵可以更准确地反映样本之间的相似性。

4 集成卷积神经网络的图像分类与建模

卷积神经网络是一类深度学习,前馈人工神经网络,最常用于分析视觉图像。CNN 使用了多种多层感知器,这些多层感知器被设计为需要最少的预处理。与传统的机器学习方法相比,具有更多隐藏层的卷积神经网络(CNN)具有更复杂的网络结构以及更强的特征学习和特征表达能力。图像处理分为两部分,第一部分分为四个步骤:第一部分-构建CNN;第二部分-使CNN 适应图像。首先,在4 通道二进制图像上对其进行了分类,其中白色为'255',黑色为'0'。它有10 个输出,每个数字一个,取softmax 以获得每个类别的概率;其次,由于图像分类中,全白输入,100%返回的置信度为4,因此,反转图像并使用滑动窗口技术,当图像完全变黑时,会为每个类别返回较低的百分比;最后,Conv2D 需要4 个维度:sample_size,height,width,channel。

以下是基于深度卷积神经网络的图像分类模型。

输入:输入是N 张图像的集合;每个图像标签都是K 个分类标签之一。该集合称为训练集。

学习:此步骤的任务是使用训练集来确切地学习每个班级的样子。此步骤通常称为训练分类器或学习模型。

评估:分类器用于预测未看到的图像的分类标签,并评估分类器的质量。我们将分类器预测的标签与图像的真实标签进行比较。毫无疑问,分类器预测的分类标签与图像的真实分类标签一致,这是一件好事,而且这种情况越多越好。

需要注意的是,CNN 主要用于处理2D数据(在高度和宽度上至少包含2 个维度)。此外,CNN 仅应在列的顺序很重要且无法更改的情况下使用。例如,当更改图像中的列顺序或随机排列列时,将更改整个图像。但是对于典型的ML 分类问题(例如Titanic-Survival Prediction)而言,情况并非如此。因此,绝对要确保预测数据的列顺序很重要并且不能更改。

话虽如此,由于在这种情况下要逐行进行,因此尝试将其传递给一维卷积运算。将其传递给1D 转换时,它实际上会添加一个额外的维,并认为张量的高度为1,它的作用类似于[1xn]形状的滤镜,跨整个行(仅在水平方向上)。因此,如果输入只有1 个通道(例如,灰度图像而不是RGB),则需要在末尾添加另一个尺寸。

5 结论

综上所述,深度卷积神经网络用于识别缩放,平移和其他形式的不变变形图像。为了避免显式特征提取,卷积网络使用特征检测层隐式地从训练数据中学习,并且由于权重共享机制,同一特征映射面上的神经元具有相同的权重。可以大大降低网络结构的复杂性。特别是,多维输入矢量图像WDIN 可以有效地避免特征提取和图像分类过程中数据重构的复杂性。深度卷积神经网络在图像特征表示和分类方面具有无可比拟的优势。

猜你喜欢

分类器梯度标签
一个改进的WYL型三项共轭梯度法
一种自适应Dai-Liao共轭梯度法
一类扭积形式的梯度近Ricci孤立子
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
BP-GA光照分类器在车道线识别中的应用
加权空-谱与最近邻分类器相结合的高光谱图像分类
结合模糊(C+P)均值聚类和SP-V-支持向量机的TSK分类器
标签化伤害了谁
基于多进制查询树的多标签识别方法