APP下载

基于AlexNet卷积神经网络的红外图像船舶分类方法

2023-06-03任永梅邓一彬罗威冯骁陈智龙

电脑知识与技术 2023年10期
关键词:图像处理深度学习

任永梅 邓一彬 罗威 冯骁 陈智龙

关键词:图像处理;船舶分类;深度学习;红外图像

中图分类号:TP391 文献标识码:A

文章编号:1009-3044(2023)10-0013-03

0 引言

船舶分类是计算机视觉领域的研究热点,对监视水上交通、维护海洋权益和提高海防预警能力等方面有着重要的意义[1]。目前最为常见的船舶分类方法主要集中于可见光图像[2]和合成孔径雷达[3](SyntheticAperture Rardar, SAR)图像方面,可见光图像对目标的区分度好,但易受光照影响;合成孔径雷达可以全天候、全天时地监测,但价格昂贵,容易受到雨雪、海浪以及其他电磁的干扰,在复杂情况下的方位测量精度较差,主要应用在军事领域。红外图像[4]船舶分类方法可以全天候监控水路运输情况,确保海岸和海洋的安全。张迪飞等[5]提取红外舰船目标的HOG特征,并使用SVM分类器对提取的特征进行分类,在背景干扰下可以识别红外舰船目标。随着深度学习技术的快速发展,卷积神经网络[6]在图像分类领域取得了出色的成绩。陈兴伟等人[7]提取多个船舶分类特征,组成船舶分类的特征向量集,然后将特征向量集作为深度学习算法的输入,建立船舶分类模型。Chen等人[8]提出了一种由粗到细的卷积神经网络船舶类型识别方法,粗步骤的训练方式与传统卷积神经网络相似,精细步骤引入了正则化机制来提取更多的船舶固有特征,并通过微调参数设置,获得更好的识别性能。李坤等人[9]根据融合特征设计出了一种图像识别算法,实现改进卷积神经网络的船舶图像识别。综上所述,现有的研究虽然取得了较好的分类效果,但是其针对的主要是船舶形状差异大、背景单一的船舶图像库。在现实港口、航道拍摄的船舶图像,背景复杂、船体形状差异较小,给船舶分类带来了很大的挑战。本文研究了基于AlexNet卷积神经网络的红外图像船舶分类方法,并在VAIS船舶数据集上对该方法的有效性进行了实验验证,实验结果表明,本文方法具有较好的红外图像船舶分类性能。

1 基于AlexNet 卷积神经网络的红外图像船舶分类方法

1.1 传统的卷积神经网络

传统的卷积神经网络的主要由一个输入层、多个卷积层、多个池化层、多个全连接层和一个输出层组成。图像分类任务中的输出层为分类器,常用的分类器有Softmax等。卷积层中包含图像的多个特征图,每个特征图能够提取一种特征。在提取红外船舶图像的特征时,同一个特征图的神经元共享一组权值(即卷积核),不同特征图的权值是不一样的,所以才能够提取红外船舶图像的不同特征,在训练时,不断地调整权值参数,使特征提取朝着有利于分类的方向进行,卷积得到的结果要通过激活函数处理后才能进行池化操作。在池化层中,输入的特征图经过池化后其数量不变,但维数会减小。全连接层连接上层传来的所有图像特征,将这些特征图转化为全连接的一维向量,最后将其送给Softmax分类器。

1.2 AlexNet 卷积神经网络

本文使用经典的AlexNet[10]卷积神经网络提取红外船舶图像的深层特征。AlexNet网络由5层卷积层和3层全连接层组成。具体结构如图1所示。在该网络中采用的激活函数是ReLu激活函数,进而能够使网络收敛速度更快。为了防止过拟合,增强网络模型的泛化能力,还应用了局部响应归一化技术,主要应用在第1个卷积层和第2个卷积层之后。在全连接层中应用了随机失活(dropout)技术。具体参数如表1所示。卷积核: 11 × 11 × 96表示96个尺寸为11 × 11的卷积核。填充为1表示在外层补1圈0。输出节点为6 是因为输出节点数与本文的VAIS船舶数据集的船舶类型数目一致。

1.3 算法总體流程

基于AlexNet卷积神经网络的红外图像船舶分类方法的流程图如图2所示。

具体过程为:

在训练阶段,首先使用AlexNet网络通过前向传播对预处理后的红外船舶图像进行特征提取,将全连接层的特征输入Softmax函数中,利用Softmax函数得到红外船舶图像的预测类别。其次,计算预测类别标签和真实类别标签之间的误差,通过反向传播过程调整权值和偏差,使误差最小化,得到最优模型并保存。在测试阶段,通过卷积神经网络前向传播提取红外船舶图像特征后,调用训练好的最优模型对其进行测试,输出船舶图像的预测标签(分类结果)。

2 实验结果及分析

2.1 实验数据集

本文使用的船舶分类数据集是VAIS数据集,共有1 088幅红外图像。数据集的部分可视化样本如图3所示。该数据集包含6种粗粒度类别,分别为medi?ums“other”ships、merchant ships、medium passengerships、sailing ships、small boats、tugboats。本文随机选取共539幅为训练图像,剩余549幅为测试图像,训练集和测试集样本数量如表2所示。

2.2 实验仿真环境及参数设置

实验仿真环境:处理器为Inter(R)Core(TM) i7-10875H CPU@2.30GHz,内存为32G,显卡为NVIDIAGeForce RTX 2060,编程环境为Python3.8.6 + PyTorch 框架。

本文使用Adam算法优化交叉熵损失函数,迭代更新卷积神经网络权重。训练得到最优模型的参数设置如下:

在预处理时使用双三次插值方法将所有红外船舶图像大小均调整为256 × 256像素。训练集图像随机裁剪为227 × 227像素,学习率为0.0002,批处理样本数量为32,训练周期为200,丢弃率(dropout)为0.5,一阶矩估计的指数衰减率取0.9,二阶矩估计的指数衰减率取0.999,epsilon的取值为1e-08。

2.3 实验结果及分析

为了验证本文方法的有效性,在VAIS船舶数据集上进行了实验。训练过程中的迭代周期-分类准确率曲线(epoch-acc)和迭代周期-损失值曲线(epochloss)如图4所示。本文方法在VAIS船舶数据集上的船舶分类准确率和误分类样本数如表3所示。本文方法在VAIS船舶数据集上对每一类船舶的分类准确率(%)如表4所示。表5为本文方法在VAIS船舶数据集上对每一类船舶的查准率、查全率和F1分数。

从图4可以看出,本文的船舶分类模型能够很好的进行收敛,在迭代到200代时分类准确率趋于平缓。从表3可知,使用AlexNet网络能够对红外船舶图像进行较好的分类。从表4和表5可知,本文方法对medi?um-other和passenger的分类准确率和F1分数较低,是因为数据集中的船舶图像的分辨率不是很好,给分类带来了一定的难度。

3 结论

本文研究了基于AlexNet卷积神经网络的红外图像船舶分类方法,在VAIS船舶数据集上的实验结果表明,本文方法能够较好地实现船舶分类,但分类准确率还有进一步提升的空间,在未来的研究工作中,将进一步优化船舶分类模型,提高船舶分类准确率。

猜你喜欢

图像处理深度学习
基于图像处理的机器人精确抓取的设计与实现
机器学习在图像处理中的应用
Bayesian-MCMC算法在计算机图像处理中的实践
改进压缩感知算法的图像处理仿真研究
有体验的学习才是有意义的学习
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
基于图像处理的定位器坡度计算
Photo Shop通道在图像处理中的应用