APP下载

基于可见光图像的目标探测与识别算法研究

2022-04-02王涛吕鑫

科学技术创新 2022年7期
关键词:分类器旋翼卷积

王涛 吕鑫

(北京机械设备研究所,北京 100854)

1 概述

目前“低慢小”航空器的检测主要分为雷达探测,光电探测,射频探测与声波探测。由于目标图像信息较为充分可靠,因此常作为主要的判定依据。光电探测装置结合全景凝视成像、可见光探测成像、红外探测成像、激光测距等光电探测技术实现光电预警,多元传感器特征信息融合,硬件上有效解决城市复杂环境下“低慢小”航空器的探测、发现和识别难的问题[1-4]。

远距离的“低慢小”目标成像像素有限,轮廓特征不明显,传统的图像处理算法对“低慢小”目标识别效果不理想[5-8]。本文以某项目的光电探测装置为硬件载体,以某次目标特性测试试验的图像数据为样本,介绍了浅层神经网络和卷积神经网络在目标图像的预处理与图像特征提取过程中的作用,并制作了浅层神经网络支持向量机(SVM)“低慢小”目标训练集和测试集,设计了SVM 和卷积神经网络(CNN)的分类器,并对两种算法的正确识别概率进行了比对。证明了SVM 与CNN 在“低慢小”目标识别中具有重要应用价值。

2 支持向量机(SVM)识别“低慢小”目标

将多特征进行融合,得到的特征向量为一个N 维的特征向量,表示为:(H1,H2,H3,H4,H5,H6,H7,F1,F2,F3,S),其中H1至H7为七个Hu 矩不变量,F1,F2,F3为三个仿射不变矩特征,S 为圆形度。

则特征向量表示为:

选取两类“低慢小”目标作为仿真样本,分别是旋翼无人机(六翼或者四翼)、固定翼无人机两类样本,选取30 张“低慢小”图片(旋翼无人机15 张,固定翼无人机15 张)提取特征向量F。对30 张“低慢小”图像进行图像预处理,对目标图像进行形态学操作、图像分割和二值化操作,提取“低慢小”目标的圆形度、Hu 不变量(7 个)、仿射不变矩(3 个),制作成仿真样本,其中,20 个样本制作成训练集、10 个样本制作成训练集,确定对目标的识别正确率。

图1 和图2 分别为旋翼样本和固定翼样本,均为已经二值化后的图像。

图1 旋翼无人机图片样本

图2 固定翼无人机图片样本

提取11 类特征得到30 个样本,如图3 所示。

如图3 所示:分别对11 个特征进行特征提取,圆形度的取值范围为0-1,符合算法要求;H 由于Hu 不变矩的高阶特征往往数值很小,于是利用以10 为底的Log 函数,将7 个数值很小的Hu 不变矩变换到(-10,0)的范围内。同时,将旋翼无人机类别设为1.00,固定翼无人机类别设为2.00,即对支持向量机分类器的输出值y 进行设定。

图3 30 个样本特征值

利用Matlab 中libsvm 库设计二类支持向量机(svm)分类器,首先对11 类特征数据绘制项目序号与各类属性的关系图,如图4 所示(样本序号1~15 为旋翼无人机,样本序号16~30 为固定翼无人机)。

从图4(a)可以看出,旋翼无人机的圆形度特征较为明显,分布集中;固定翼无人机圆形度特征分布较为分散,但是圆形度都大于旋翼无人机数据。从图4(b)可以看出,旋翼无人机的Hu(1)特征分布集中,特征鲁棒性较好;固定翼无人机的Hu(1)特征分布较为分散,鲁棒性不是很好。随机选取三分之二的数据作为训练集,三分之一的数据作为测试集,进行svm 训练与测试,测试以及训练函数分别为svmtrain 与svmtest 函数。得到的分类结果如图5 所示。通过图5 可以看出,在测试了10 个样本以后,得到分类正确率为70%,即10个样本里有7 个样本预测正确了,正确预测率较低,但是也在情理之中,探究分类正确率低的原因有以下几个方面:a.样本数据量过低:由于时间原因仓促,而且野外实验采集的数据量较少,导致选取的有效数据过少,令在SVM 分类器分类过程中,迭代次数较少,模型的普遍适应性较差;改进措施:开展多次野外实验增加实验样本数据,选取有效数据。b.样本的预处理过程不够精细:在样本的预处理过程中,由于图像中的干扰目标较多,导致在提取目标轮廓以及边缘检测过程中,目标轮廓提取或者边缘检测有缺失,不能提供较好的预处理样本;改进措施:精细化样本预处理过程,完善提取目标轮廓特征等步骤。c.特征选取不好:虽然选取的图像特征具有某些方面的不变特征,但是几类特征的选取与组合,却不能较好的表现图像目标,使得分类效果较差;改进措施:选取更加有效的图像特征。d.分类器参数设置不完善:SVM支持向量机的分类器参数设置不完善,使得分类效果变差;改进措施:在样本量充足的情况下,改变分类器参数值。

图4(a) 样本序号与特征圆形度关系图

图4(b) 项目序号与特征Hu(1)关系图

图5 SVM 支持向量机得到预测分类与实际分类的比较

3 卷积神经网络(CNN)识别“低慢小”目标

卷积神经网络(CNN)在机器视觉方面对目标识别具有非常大的优势,一个简单的神经网络经过有效训练就可以完成大多数识别任务。

3.1 CNN 神经网络设计

选用AlexNet 神经网络。实现AlexNet 的网络较为复杂,数据处理的网络层为:第1 层为卷积层,输入值数据体的深度为3,输出数据体的深度为64,卷积核的尺寸为11×11×3,此时使用了64 种卷积核,滑动步长为4,对边缘进行0 填充;卷积层的输出值后边接一个ReLU 激活函数,进行数据处理;激活函数后边接上第二层池化层,选择的池化方法为最大池化,核为3×3×1,滑动步长为2;池化层后边接第2 个卷积层,输入的数据深度为64,输出数据深度为192,卷积核尺寸为11×11×64,此时使用了192 种卷积核,步长为4,边缘进行0 填充,后边接一个激活函数ReLU,随后接第二个池化层,选用最大池化,核尺寸3×3×1,滑动步长为2;随后接第3个卷积层,输入数据深度为192,输出深度为384,卷积核尺寸为3×3×192,此时使用了384 种卷积核,边缘进行0 填充;后边接一个激活函数ReLU,随后接第4 个卷积层,输入深度为384,输出深度为256,卷积核尺寸3×3×384,此时使用了256 种卷积核,边缘进行0 填充,后边接一个ReLU 激活函数。再接第5 层卷积层,输入深度为256,输出深度为256,卷积核尺寸3×3×256,此时使用了256 种卷积核,边缘进行0填充,后边接一个ReLU 激活函数,再接第3 个池化层进行最大池化,卷积核为3×3×1,步长为2。最后进行Dropout 后,接一个线性层,将尺寸为256*6*6 的数据变换为4096*1*1的长度为4096 的向量。随后再进行Dropout,再接一个线性层,将长度为4096 的向量线性变换为另一个长度为4096 的向量,也叫全连接层。随后进行Dropout,输出CNN 神经网络的输出数据,为大量长度为4096 的向量。具体网络见图6。

图6 AlexNet 网络结构

3.2 CNN 神经网络训练与测试的一般过程

CNN 神经网络训练与测试含有“低慢小”目标的可见光图像的一般过程为:a.获取可见光图像,将含有“低慢小”目标的可见光图像经过图像切割,感兴趣区域(ROI)选择等方式,将图像转化为N×N×3 的样本,N 由实际目标所占像素确定,3 为代表彩色图像的RGB 三通道,若为灰度图像,就改为N×N×1。b.将图像整理成样本。c.确定网络的损失函数与优化方法。d.使用样本训练神经网络,并在其过程中,调节参数,使识别正确率达到最大,并在测试集中进行验证。

3.3 全连接的三层神经网络训练与测试

一个简单的三层神经网络,需要传递进去的参数包括:输入的维度、第一层网络的神经元个数,第二层网络神经元的个数、以及第三层网络(输出层)神经元的个数。在建立的每层网络的输出部分添加激活函数。用到nn.sequential(),将网络的层组合到一起,在最后一层输出层不添加激活函数。同样在网络层中掺入批标准化,用于加快收敛速度,将批标准化放在全连接的后面,非线性层的前面。训练网络设置步骤:a.PyTorch 神经网络框架,首先导入一些要用的神经网络框架的包,包括torch 框架、torchvision 包。b.定义一些超参数,如batch-size、learning_rate 还有num_epoches等。c.对MNIST 数据集进行预处理,将数据标准化,做的处理一般是数据减掉均值、再除以方差。d.下载并读取数据集。e.导入网络,定义损失函数和优化方法。f.训练网络并且测试网络。测试结果:利用PyCharm 软件,利用PyTorch 神经网络框架,建立一个全连接的三层神经网络测试结果如图7 所示。

图7 PyCharm 软件分类MNIST 数据库及结果表示图

如图7 所示,在迭代次数逐渐减小时,损失函数在随机梯度下降函数的作用下,数值不断减小,在经过设定的迭代次数epoch 为1000 时停止,在测试集损失函数值为0.169810 时,最终识别正确率达到了95.93%,能够较好的实现分类识别任务。

4 结论

本文介绍了浅层神经网络和卷积神经网络在目标图像的预处理与图像特征提取过程中的作用,并制作了浅层神经网络(HOG+SVM)训练集和测试集,得到“低慢小”目标的Hu 矩和圆形度特征分布。设计了SVM 和卷积神经网络(CNN)的分类器,对两种算法的正确识别概率进行了比对,比对结果表明,采用卷积神经网络算法,可实现更高的目标识别率。

猜你喜欢

分类器旋翼卷积
基于全卷积神经网络的猪背膘厚快速准确测定
少样本条件下基于K-最近邻及多分类器协同的样本扩增分类
桨叶负扭转对旋翼性能影响的研究
学贯中西(6):阐述ML分类器的工作流程
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
改进型自抗扰四旋翼无人机控制系统设计与实现
一种并行不对称空洞卷积模块①
倾转旋翼机巡航状态旋翼滑流影响
基于朴素Bayes组合的简易集成分类器①