APP下载

一种改进的卷积神经网络SAR目标识别算法

2018-10-11占荣辉

西安电子科技大学学报 2018年5期
关键词:卷积噪声神经网络

许 强,李 伟,占荣辉,邹 鲲

(1. 空军工程大学 信息与导航学院,陕西 西安 710077;2. 国防科技大学 自动目标识别重点实验室,湖南 长沙 410073)

合成孔径雷达(Synthetic-Aperture Radar, SAR)具有全天时、全天候、高分辨、大幅宽的特点,在军事领域极具价值.合成孔径雷达图像目标识别是合成孔径雷达图像解译领域的研究热点.随着机器学习技术的发展,支持向量机(Support Vector Machine, SVM)[1]、AdaBoost (Adaptive Boosting)[2]等算法被应用于合成孔径雷达目标识别中,但上述方法均基于人工进行特征提取,效率低,泛化能力较差.卷积神经网络(Convolutional Neural Network, CNN)是一种特殊的前馈神经网络,具有局部连接、权值共享的特点.在卷积神经网络中,不同卷积核作为不同特征的提取器,高层特征可由低层特征组合得到,这与许多自然信号具有相似的复合结构,使得卷积神经网络较传统方法更具优势.目前,国内外学者提出了许多基于卷积神经网络的目标识别算法.多尺度卷积神经网络[3]可学习目标多尺度特征,从而更好地表征目标,较单尺度卷积神经网络具有更优的识别性能.全卷积网络[4]中所有层均采用稀疏连接,可在减小训练集数据规模的同时达到较好的识别准确率.对称卷积耦合网络[5]可同时学习目标在合成孔径雷达图像与光学图像上的特征,在变化检测任务中表现较好.卷积神经网络是一种有监督网络模型,网络训练需要大量正确标记的数据,而合成孔径雷达图像数据集规模较小,直接应用于网络训练易产生过拟合现象.针对此类问题,文献[6]提出利用数据增强技术对训练集进行数据扩增,提高了网络的泛化能力.文献[7]利用独立成分分析(Independent Component Analysis, ICA)非监督预训练算法对网络进行参数初始化,但对算法性能提升效果一般.文献[8]在此基础上,利用主成分分析(Principle Component Analysis, PCA)非监督预训练初始化神经网络,提高了识别的准确率.但主成分分析法将原图像转换为一维向量,丢失了原有图像的结构信息,并未充分利用图像信息对网络进行预训练[9].

合成孔径雷达特殊的成像机制导致图像中存在严重的相干斑噪声.在合成孔径雷达图像中,像素位置由距离向特性决定,当目标存在起伏变化时,在图像上会呈现出复杂的失真与几何畸变.目前,对噪声条件下的合成孔径雷达目标识别研究较少.针对合成孔径雷达标签数据不足与噪声标记条件下的目标识别问题,笔者提出了一种基于零相位成分分析(Zero-phase Component Analysis, ZCA)预训练与含噪数据增强的卷积神经网络模型.首先,利用含噪数据增强技术对原始训练集进行数据增强,以提高网络对噪声的鲁棒性; 然后,利用零相位成分分析提取目标特征并对网络进行预训练; 最后,通过设计线性修正单元(Rectified Linear Units, ReLU)、Dropout、单位卷积核、正则化等网络稀疏性方法,降低了网络的计算复杂度并提高了网络的识别性能与泛化能力.

1 零相位成分分析预训练

主成分分析法是一种基于原样本点与投影重构样本点之间的最近重构性与最大可分性,实现对数据样本进行降维重构的特征学习方法.零相位成分分析法在主成分分析法的基础上,采用奇异值分解实现两个维度空间上的成分特征提取与降维重构,并将重构样本集由特征空间变换回原样本空间.零相位成分分析法可去除合成孔径雷达图像中相邻像素点间的相关性,得到对原始图像低冗余的表示,从而在最大程度上表示目标的局部特征.

Mn=USVH,

(1)

其中,w×w阶酉矩阵U为Mn的左奇异向量矩阵,半正定w×h阶对角矩阵S为Mn的奇异值矩阵,h×h阶酉矩阵VH为Mn的右奇异向量矩阵.将左奇异值λk(k=1,2,…,w)按大小降序排列,对应左奇异向量ηk(k=1,2,…,w).最小化重构误差求左投影矩阵:

(2)

左投影矩阵E=(η1,η1,…,ηL),由前L个左奇异向量构成.L的取值可根据累计贡献率确定:

(3)

(4)

其中,ε为正则化因子.从而可对图像In进行特征映射:

Fn,k=EZLETXn.

(5)

同理,可对右奇异向量矩阵进行相同步骤,以实现另一维度的降维重构.主成分分析法需要将原数据投影(旋转)到主成分轴上,而零相位成分分析可在主成分分析的基础上将数据由主成分空间再变换回原空间,使数据更接近原数据.如图1所示,数据通过利用零相位成分分析进行特征提取与去相关性之后,所得到的特征图相对于原数据空间不发生变换.因此,零相位成分分析可在不改变数据结构与特征空间的前提下,提取出目标的重要特征.

图1 零相位成分分析特征图与主成分分析特征图对比

2 零相位成分分析预训练的卷积神经网络目标识别算法

基于零相位成分分析预训练的卷积神经网络目标识别算法的流程如图2所示.首先,对训练集图像进行数据增强,利用零相位成分分析法提取数据特征,并对卷积神经网络进行预训练; 然后,利用增强后的训练集图像对卷积神经网络进行训练; 最后,利用训练得到的卷积神经网络对测试集图像进行目标识别.

图2 合成孔径雷达目标识别流程示意图

在原始图像上,以大小为90像素×90像素,步长为1像素的滑动窗口对图像进行裁剪,可使每一类目标的训练集大小增强为原始训练集大小的 (128- 90+1)× (128- 90+1)= 1 521 倍.随机选择每类 1 200 张图像作为训练集,通过向训练集添加噪声,以提高网络在噪声标记条件下的识别性能.合成孔径雷达中的相干斑噪声在图像中表现为信号在空间上相关的小斑点.斑点噪声是一种散斑状乘性噪声:

G=f+n*f,

(6)

其中,G为加噪后的图像,f为原始图像,n为服从均值为零、方差为σ2的均匀分布的随机噪声.

卷积神经网络共包括5个卷积层与4个最大池化层.Conv.1、Conv.2 分别由32、64个 7×7 卷积核构成,Conv.3 由128个 3×3 卷积核构成,Conv.4 由128个 1×1 卷积核构成.1×1 单位卷积核可减少输出至下一卷积层的通道数,降低计算的复杂度.前4个卷积层后均连接 2×2 的最大池化层.Conv.5 由10个 4×4 卷积核构成.

卷积神经网络对图像进行层次特征提取是一个前向传播过程.输入图像与卷积核进行卷积后通过非线性激活函数,得到卷积后的特征图.公式为

(7)

线性修正单元非线性激活函数可减少反向传播算法的计算量,降低参数相互依存关系,从而增加网络的稀疏性.Dropout指在一次训练过程中,随机地让网络中的某些隐层节点的权重暂时失效.通过Dropout,可减轻网络节点之间的联合适应性,防止网络发生过拟合现象.池化过程降低了卷积神经网络对位移与形变的灵敏度,增加了对特征的鲁棒性,也可以在一定程度上将图像的低级纹理特征聚集为高级语义特征.池化窗口G(u,v)以步长s对特征图进行最大池化的公式为

(8)

在Softmax分类器中,样本假设函数为

(9)

每一个样本估计其所属类别的概率为

(10)

引入示性函数I(·),则Softmax的交叉熵损失函数为

(11)

在反向传播中,通常采用随机梯度下降算法,沿着目标函数的梯度相反方向不断地更新网络参数,以使目标函数收敛.但随机梯度下降算法在局部极值点附近易产生振荡,导致收敛速度较慢.采用基于动量的梯度下降算法(Stochastic Gradient Descent based on Momentum, SGDM)可以较好地解决这一问题:

(12)

其中,ρ为Momentum,η为学习率,θ为参数集合.

3 实验与分析

实验数据采用美国国防高级研究计划局与美国空军研究实验室联合资助的MSTAR项目公开的部分数据集.MSTAR数据集包含分辨率为 0.3 m× 0.3 m,大小为 128像素× 128像素的X波段聚束式合成孔径雷达图像.其中包括BMP-2(SN-9563、SN-9566、SN-C21)、BRDM-2、BTR-60、BTR-70、D7、T-62、T-72(SN-132、SN-812、SN-S7)、ZIL-131、ZSU-234、2S1等10类目标.括号中为同一类目标的变形目标,其相互之间的差异为目标的军事配置不同,如装甲车天线是否展开等.在实验中,以17°俯仰角图像为训练集,15°俯仰角图像为测试集.实验在MATLAB(2017a)环境下采用GPU (4 GB) 加速运算完成.Momentum为0.9,MiniBatchSize为64,MaxEpochs为50,初始学习率为 0.000 6.学习率更新采用步进式策略,每迭代15个Epoch,学习率更新为原来的0.5.训练过程中采用L2正则化方法对网络参数设定先验,以防止过拟合.

3.1 合成孔径雷达图像目标识别实验

在3类目标识别实验中,测试集为15°俯仰角的BMP-2-SN-9563、BMP-2-SN-9566、BMP-2-SN-C21、BTR70、T-72-SN-132、T-72-SN-812、T-72-SN-S7目标图像.表1给出了文中模型与其他方法的识别性能对比.可以看出,笔者提出的算法的识别率为98.75%,能有效地识别3类目标及其变形子类目标,识别性能优于其他合成孔径雷达目标识别算法.

表1 不同算法的性能对比

10类目标识别实验结果的混淆矩阵如表2所示.可以看出,算法对T-62的识别率最低,为94.14%;对D7、T-72(SN-132)、ZSU-234的识别率均达到100%.10类目标的整体识别率可达到约98.52%.

表2 10类目标识别结果的混淆矩阵

3.2 算法评价与噪声鲁棒性实验

图3 噪声条件下不同算法的识别率对比图

如图3所示,通过算法对比,可评价算法对网络识别性能的提升程度以及算法的噪声鲁棒性.对比的算法为:A0.网络未采用Dropout与 1×1 卷积层,由未增强的训练集训练得到.B1.采用Dropout与 1×1 卷积层,由未增强的训练集训练得到.B2.由增强后的训练集训练B1得到.B3.采用零相位成分分析预训练,由未增强的训练集训练B1得到.Ours.采用零相位成分分析预训练,并由增强后的训练集训练B1得到.AN.利用增强后的训练集对AlexNet进行fine-tune得到.通过对比A0、B1可以看出,稀疏性技术减少了网络参数,降低了训练时间与计算复杂度,但不会降低网络的识别率.事实上,当网络具有足够多的参数,足以表征所有数据的特征时,仅通过增加网络层数与结构复杂度,并不能提升识别性能,反而会浪费大量的训练成本,并产生过拟合现象.因此,网络越深,越有必要增加网络的稀疏性; 对比B1、B2可以看出,含噪数据增强可同时提升网络的识别性能与噪声鲁棒性,这是由于数据增强扩增了训练集的样本数量与样本多样性,使网络学习到噪声标记条件下的数据特征,从而具有更高的噪声鲁棒性; 对比B1、B3可以看出,通过零相位成分分析法对数据进行特征提取,并利用所提取的特征对卷积神经网络进行初始化,可提升网络的识别率; Ours利用预训练、数据增强以及网络稀疏性技术,大幅提升了卷积神经网络的识别性能与噪声鲁棒性,当噪声方差达到0.3时,识别率仍能达到92%,识别率相较A0提升了近35%.

图像在卷积层上的激活区域是卷积神经网络对目标进行特征提取的关键范围.图4给出了目标图像在卷积神经网络的第1层卷积层上的最大正负激活,图中白色为正激活区域,黑色为负激活区域.可以看出,笔者提出的算法降低了环境及噪声干扰,而加深了目标的正负激活程度,从而提升了网络的识别性能.

图4 卷积核激活示意图

4 结 束 语

笔者研究了采用卷积神经网络的合成孔径雷达目标识别算法.首先利用数据增强技术增加训练集,再利用零相位成分分析法对图像进行特征提取与降维重构,提取出数据中的重要特征;然后建立稀疏的卷积神经网络,利用所提取的重要特征对网络进行预训练,再利用预训练后的网络对训练集数据进行特征学习,以提取出目标的层次化特征,并用于目标识别.实验表明,笔者提出的算法提升了卷积神经网络的识别性能,能准确地识别各类目标及其变形子目标,对噪声也有较强的鲁棒性,是一种有效的合成孔径雷达目标识别算法.

猜你喜欢

卷积噪声神经网络
基于3D-Winograd的快速卷积算法设计及FPGA实现
卷积神经网络的分析与设计
神经网络抑制无线通信干扰探究
从滤波器理解卷积
汽车制造企业噪声综合治理实践
基于神经网络的中小学生情感分析
基于傅里叶域卷积表示的目标跟踪算法
基于神经网络的拉矫机控制模型建立
基于支持向量机回归和RBF神经网络的PID整定
一种基于白噪声响应的随机载荷谱识别方法