基于Bagging-CNN雷达信号分类方法

2021-06-02孙艺聪田润澜

兵器装备工程学报 2021年5期

孙艺聪，田润澜，刘冲，郭扬

(1.空军航空大学航空作战勤务学院，长春 130022； 2.空军参谋部电子对抗雷达局，北京 100000；3.空军航空大学教研保障中心，长春 130022)

对于电磁环境日益复杂的今天，如何快速准确地对未知雷达信号进行分类和识别，一直是信号处理领域的重点研究方向，尤其是在军事对抗中，能够快速对未知信号进行分类识别，对后续的战争行动有着深远的影响[1-2]。围绕着雷达信号识别与分类的问题上，国内外研究人员进行了大量的研究。文献[3]提出了一种基于时频图像的雷达波形识别系统，能够识别多种波形。文献[4]提出了一种基于时频图像预处理下卷积网络雷达信号识别方法，相比人工提取特征的准确率有所提高。文献[5]提出了一种基于积分旋转因子的径向积分方法，在时频图像的基础上对信号进行检测。文献[6]提出了一种基于卷积神经网络和平均采样技术的信号自动识别方法，有效降低了处理信号时所需的大量计算成本。文献[7]采用了特征融合和支持向量机的方法，具有较好的准确性和鲁棒性。文献[8]提出了一种基于短时傅里叶变换与卷积神经网络的分类方法，具有较高的识别性能。但是上述方法在低信噪比情况下识别准确率有限，且不同类型信号之间识别准确率也有一定的差距，训练得到的网络具有一定的偏向性，这就会导致特征明显的信号类型更容易被识别出来，而特征不明显的信号类型更容易被判错，不利于后续的分析处理。

为了改善上述问题，本文提出一种雷达信号分类方法，首先利用卷积神经网络(convolutional neural network，CNN)提取图像的特征，得到初步的分类结果，然后利用Bagging集成方法对CNN得到的结果进行集成决策，减少CNN网络带来的方差。本文首先介绍了特征提取方法和图像预处理方法，接着介绍了Bagging框架和CNN的基本知识以及网络结构，然后设计了Bagging-CNN分类方法的实现流程，最后设计了仿真实验。实验结果表明，本文提出的方法相比于传统的神经网络方法整体识别效果更好，在低信噪比情况下也展现了较好的分类能力，同时类别之间的差距也有所减少。

1 特征提取及图像预处理

1.1 模糊函数特征提取

不同调制方式的雷达信号在分辨力、精度、模糊度等方面有着不同的表现，体现在模糊函数上的形式也有所不同。模糊函数在雷达信号分析方面有着很重要的作用[9]，在雷达波形设计中，也常用模糊函数作为设计工具[10]。模糊函数的一般定义为：

(1)

式(1)中：τ表示时间延迟：fd表示多普勒频移：x(t)表示信号的复包络。

模糊函数具有许多重要的性质[11]：

1) 唯一性。对于任意给定的信号，它都有唯一的模糊函数，不同信号有不同的模糊函数。

2) 原点对称性。

|χ(τ，fd)|=|χ(-τ，-fd)|

(2)

3) 体积不变性。体积不变性也叫作模糊原理。它表示模糊函数图中曲面下体积只取决于信号的总能量。

(3)

根据这些不同，可以将模糊函数图像作为神经网络的输入图像特征。由于模糊函数图是三维立体图，为了使其能够作为神经网络输入数据，需要进一步处理为二维平面图[12]。本文主要选用5种信号类型，分别为BPSK、Costas、FMCW、Frank和P4，以各个类型信号的模糊函数的等高线图作为输入特征，如图1所示。

图1 5种雷达信号模糊函数等高线图

1.2 数据集的预处理

在对神经网络训练之前，首先对要训练的数据集进行预处理，以减少卷积神经网络输入的数据量，同时对数据进行增强，以保留足够多的特征用于后续分类工作的影响，提高神经网络的准确率和训练效率。本文采用图像阈值处理对图像进行预处理。

图像阈值处理是一种常用的图像处理方法。首先将图像灰度化，然通过一定的规则对灰度化后的图像设置阈值，根据阈值调整像素值，将图像二值化。根据阈值设置的不同，可以分为全局阈值和局部阈值，也可以分为单阈值和多阈值。主要的图像阈值处理方法有以下3种：简单阈值；Otsu’s二值化；自适应阈值。

3种阈值处理方法的主要区别在于阈值的设定上。简单阈值是一种全局性的阈值，通过设定一个全局阈值，然后整个图像与该阈值相比较；Otsu’s二值化适用于图像灰度直方图中具有双峰的情况，通过算法在双峰之间找到一个值作为阈值；自适应阈值相对于简单阈值可以看作是局部性的阈值，通过规定一个一定大小的区域，比较某点与区域大小里面像素点平均值的大小来确定这个像素点是属于黑或者白。图2是对原始图像分别进行简单阈值、Otsu’s二值化和自适应阈值处理的结果，其中自适应阈值设定的区域大小为5×5。

图2 原始图像和3种阈值处理方法效果

2 Bagging算法和卷积神经网络

2.1 Bagging算法

在机器学习中，主要目标是训练一个稳定的对于每一类效果都好的网络模型，然而实际情况下并不都是这样。有时候我们会得到具有偏向性的模型，对于某些类的处理效果特别好，而对其他类的处理则特别差，这样的网络模型不适合于实际应用中。集成学习[13]思想就是通过组合一些弱模型，使其能够优势互补，这样即使是某个模型预测结果是错的，其他模型也能够纠正过来。一般情况下，融合多个网络的效果要优于单个网络的效果。

集成学习在如今的许多领域都有所应用，在信用评估、价格预测、数据分析、情感分析等方面取得了不错的效果[14-15]。常见的集成学习方法有Bagging、Boosting和Stacking等3种方法。其中Bagging算法是常用的一种框架，它通过重采样的方法在原始训练集中选择自己的训练子集，从数据集中通过有放回的抽样得到n个子样本集，大小同原始训练集相同，而且每个训练子集都是相互独立的。由于每一个样本抽到的概率Pi为：

Pi=1-(1-1/N)N

(4)

式(4)中：i为第i个样本；N为样本的总数。当N的数量足够大时，根据极限定理可得：

1-1/e≈0.632

(5)

这意味着有63.2%的数据参与了网络的训练，而有36.8%的数据由于没被选中而不参与网络的训练，可以用来检验网络的泛化能力，而且对于原始样本有噪声数据时，通过重采样，就会有1/3的噪声样本不会被训练，这样就不容易受到噪声的影响，可以降低模型的方差。

Bagging算法的流程如图3所示，通过图3可以看出，Bagging框架下的个体学习器可以并行训练，具有很高的学习效率。Bagging算法通过重采样方法得到n个不同的训练子集，进而训练得到n个不同的且各自独立的个体学习器，然后通过集成策略对这n个个体学习器的结果进行集成，得到最终的预测结果。常见的集成策略有投票法和平均法，其中Bagging算法常用的方法是投票法，分为加权投票法和多数投票法。通过集成策略得到最终的识别结果。

Bagging算法的流程如下：

输入：样本集D={(x1，y1)，(x2，y2)，…，(xm，ym)}，其中x为样本，y为样本标签；

输出：分类器f(x);

1 fort=1，2，…，n

(1)有放回的选取样本得到子样本集Dt;

(2)根据子样本集Dt训练得到子学习器ht;

End for

2 根据集成策略将ht结果集成得到最终分类器f(x)

Bagging算法的基学习器一般采用的是弱学习器，但是在实际中为了减少基学习器的数量，一般会采取比较强的学习器，如卷积神经网络、支持向量机等。本文主要采用卷积神经网络作为基学习器。

图3 Bagging框架流程框图

2.2 卷积神经网络

卷积神经网络[16-17]是一种带有卷积结构的深度学习网络，主要用于计算机视觉和自然语言处理领域。一般常见的卷积神经网络主要由输入层、卷积层、池化层和全连接层组成，通过这些层的叠加，就可以构成一个卷积神经网络。通常为了能够提取深层次的特征，会采用将卷积层与池化层结合的方式，组成多个卷积-池化组，逐层提取特征信息，最终通过若干个全连接层完成分类。卷积神经网络最大的2个特征是局部连接和权值共享。局部连接的方式可以有效地减少参数的数量，提升网络训练的效率，并且在一定程度上可以减小过拟合的风险；权值共享的方法可以进一步地减少参数的数量，通过相同的卷积核对图像上的不同区域做卷积，以检测相同特征。为了降低过拟合的影响，本文采用了2种方法来降低过拟合的影响：① 使用Dropout方法。让每个神经元以一定的概率被舍弃，以减少隐藏节点的相互作用，增强模型的泛化能力；② 采用交叉验证的方法。通过设置验证集，用来验证训练集得到的模型的性能和指标。

本文设置输入神经网络输入图像的大小为32×32，设置3组卷积层与池化层，卷积核的大小为3×3，卷积方式为same，步长为1；池化方式采用2×2最大池化；所有中间层采用的激活函数为ReLU函数，全连接层后采用的激活函数为softmax函数。具体网络结构如图4所示。

3 流程设计

图5是本文提出的信号分类方法的流程框图。整个流程分为特征提取模块和网络集成模块，其中特征提取模块主要完成对原始雷达信号的特征提取与数据的预处理，并形成能够输入到分类网络模块的数据集；分类网络模块由n个结构相同的卷积神经网络通过Bagging集成方法组合而成，主要完成对输入特征的学习和分类。具体实现步骤如下：

步骤1 将原始雷达信号求模糊函数，并将模糊函数图像转换为二维图像特征。

步骤2 将步骤1得到的二维图像进行图像阈值处理和形态学处理。

步骤3 将预处理后得到的图像作为数据集，采用重采样的方法对数据集进行采样，得到n个新的子数据集，将这n个子数据集作为输入对n个卷积神经网络进行训练，得到n个不同的基学习器。通过集成决策，将n个基学习器的学习结果进行投票决策，得到最终的分类结果。

图4 卷积神经网络结构框图

图5 整体流程框图

4 仿真实验与结果分析

利用MATLAB产生仿真信号，每种信号各产生800个样本，用于对分类网络的训练，训练样本的信噪比在-2～10 dB 之间等概率取值；测试样本在信噪比为-2～10 dB的范围内间隔2 dB取值，每类信号在每个信噪比下产生100个样本。除Costas信号外，其他信号载频均为10 MHz，采样频率均为70 MHz。噪声类型为高斯白噪声，具体参数设置如表1所示。

表1 信号主要参数范围

4.1 仿真实验1

一般来说，模型过于复杂或者输入参数过多会导致模型出现过拟合的现象，图6是本文提出的集成卷积网络训练集与验证集损失与准确度曲线。从图6中可以看出，本文提出的集成卷积神经网络没有出现过拟合的现象，在训练过程中集成卷积网络在50个迭代周期后开始收敛，训练集和验证集准确率均达到了98%以上，在收敛后验证集损失和准确率曲线较为平滑，波动幅度比较小。网络训练效果比较好，网络识别精度高。

图6 集成卷积网络训练集及验证集损失和准确度曲线

4.2 仿真实验2

为了检验网络对5类信号的分类能力，利用实验1的神经网络，同时设置一个单独的卷积神经网络，网络输入相同，在信噪比为-2～10 dB之间，每隔2 dB测试2种分类网络对5类雷达信号的分类的正确率。图7是2类网络的分类情况。从图7中可以看出，相较于单个卷积神经网络，集成卷积神经网络有更高的分类正确率，尤其是对容易混淆的Frank和P4码信号来说，信号的准确率提高了10%左右，有效减少了易混淆信号识别精度不高的问题。这是由于集成网络可以将不同网络的结果进行结合，可以进行优势互补，从而得到较好的识别结果。

图7 单个网络与集成网络的识别正确率曲线

4.3 仿真实验3

基学习器的数量对于分类器的性能也有很大的影响，为了研究基学习器数量对分类效果的影响，本文设置基学习器个数分别为2个、3个、4个和5个，同时设置一个CNN作为对照(记为1个基学习器)，分别比较他们的准确度和所用时间，结果如表2所示。

表2 基学习器数量性能的准确度和所用时间

从表2可以看出，相比于单个基学习器来说，增加基学习器的数量在不同程度上提升了模型识别的准确度，其中在4个基学习器的时候准确度最高，这说明通过增加基学习器的数量可以有效地提高网络的性能。但是，当基学习器数量达到5个的时候，模型整体的识别准确率相对于上一个有所下降，这说明并不是基学习器数量越多越好，过多的基学习器不仅增加了学习训练的时间成本，同时也增加了模型的方差，使得网络抑制过拟合的能力下降，最终导致了模型精度的下降。实验结果表明，基学习器数量在3～4个的效果相对较好。

5 结论

本文提出了基于Bagging和CNN的雷达信号分类方法，使用了信号的模糊函数特征作为网络的输入特征，利用卷积神经网络作为基学习器进行训练，然后将网络的输出特征进行集合得到最终分类结果。仿真实验结果表明，相比于单个网络训练的方法，集成卷积神经网络能够更好地区分不同种类调制信号。对信号分类识别的实验中，在-2 dB的信噪比下，也能达到85%以上的识别率，具有较好的分类识别能力。