APP下载

基于注意力机制增强残差网络的雷达信号调制类型识别

2023-09-07吴礼洋呙鹏程刘超李文强

兵工学报 2023年8期
关键词:时频识别率残差

吴礼洋, 呙鹏程, 刘超, 李文强

(1.空军通信士官学校, 辽宁 大连 116600; 2.95183部队, 湖南 邵东 422000;3.95291部队, 湖南 衡阳 421000)

0 引言

雷达辐射源识别作为电子情报分析(ELINT)的重要一环,也是开展分析雷达平台类型、工作状态、工作模式以及威胁程度等信息的基础[1-2]。雷达识别主要依靠提取到的脉间参数,如脉冲频率、脉冲宽度、到达方向、脉冲重复间隔等,与数据库进行比对,从而得到相关雷达信息。而随着雷达技术的发展,信号复杂程度以及电磁环境复杂程度日益增加,尤其出现的低截获概率(LPI)[3-5]雷达信号更是使得脉间参数难以满足识别准确率的要求。因此脉内调制信息也逐渐成为一项重要的匹配参数用于雷达辐射源识别,而国内外学者对调制样式识别算法开展的探索也是一项研究热点。

对调制样式的特征提取,已有了大量人工特征选择的算法[6-7],但是这些特征在低信噪比下识别率往往捉襟见肘。近年来,人们利用深度学习算法的比例越来越重,主要是因为使用神经网络自学习的强大功能,往往能够获得深层、抽象的特征,相比于人工选择的浅层特征,一方面可以减少特征选择工作量,另一方面提取到的特征能够更有效提高识别率[8-10],在一定程度上可减少低信噪比带来的影响。卷积神经网络对图像有着独特的特征提取优势,许多文献都是将信号进行相关时频变换得到二维时频图像,进而转化为卷积网络对图像的识别问题。文献[11]利用LeNet-5卷积网络学习信号时频特征,并将特征输入到字典学习的分类器中进行识别,在0 dB、小样本条件下实现了98%的识别率;文献[12]首先使用模糊函数主脊坐标变换进行信号调制样式特征的一次提取,随后输入到卷积网络中进行分类识别,在-6 dB条件下实现94.71%识别率;文献[13]进行DS-STFT时频变换进行浅层特征提取,再将该特征输入到卷积网络中实现了在 -10 dB 条件下90.81%的识别率。然而上述文献使用的卷积网络层数都比较浅,未能进一步实现深度特征提取,导致识别率的提高受到一定限制。

随着卷积神经网络的发展,研究人员发现随着网络层数进一步增加到一定层数,模型的分类效果不会更好,反而会变差。He等[14]在研究中称该问题为网络退化,因此提出深度残差网络(ResNets),有效解决该问题并将网络深度增至一百多层,极大提高了图像识别的能力水平,是目前深度学习中最为有效的模型之一。雷达辐射源识别领域也是借鉴该模型为解决低信噪比条件下识别率的问题提出了许多识别算法。文献[15]将时域雷达信号输入到ResNet32框架中进行训练,实验表明在低信噪比下具有出色的识别率;文献[16]将雷达信号进行Choi-Williams 分布时频变换,并构建扩张残差网络用以自动提取时频图像特征实现分类识别,在-6 dB 信噪比下,对16类雷达辐射源信号整体识别率达到98.2%; 同时注意力机制是图像识别领域的重要方法,在雷达信号识别也得到应用,其具有模仿人类专注于自己感兴趣的事物而忽视无关事物的特性,在低信噪比下更为有效地关注到信号特征,从而提高识别准确率。文献[17] 提出注意力机制特征融合一维卷积长短时深度神经网络,在信噪比-12 dB 以上准确率保持100%。

受此启发,本文提出一种基于注意力机制增强的残差网络雷达信号调制识别算法。首先对雷达信号采用平滑伪Wigner-Ville分布(SPWVD)[18]得到信号的二维时频图像,利用该时频变化能量聚集度强的优势来反映调制方式的变化情况,具有一定抗干扰性;随后搭建识别模型残差网络,为强化调制样式在时频图像中的表达,利用注意力机制模型(CBAM),提高网络对调制样式相关特征的权重,剔除噪声等冗余,提升网络对噪声的抗干扰性以及特征提取的有效性,同时该模型能够通过恒等映射缓解深层网络梯度弥散和梯度爆炸的问题,提高训练的收敛速度,因此增强残差网络整体性能。实验表明在没有进行去噪的预处理前提下,利用SPWVD时频变换和CBAM自身的抗噪声能力,本文识别算法能够实现在低信噪比下较高的识别率。

1 SPWVD时频变换

假设截获到的雷达信号为x(t)=s(t)+n(t),s(t)为原始雷达信号,n(t)为高斯白噪声,且s(t)与n(t)相互独立。信号x(t)的Wigner分布定义为

(1)

式中:τ为积分变量;t为时移;f为频率。对x(t+τ/2)和x*(t-τ/2)乘积部分作傅里叶变换,即是t时刻的Wigner-Ville分布(WVD),x*(·)为共轭函数。根据Hilbert变换将信号x(t)构造成解析形式z(t)后,对z(t+τ/2)和z*(t-τ/2)乘积部分作傅里叶变换,z*(·)为共轭函数,Wigner分布变为Wigner-Ville分布:

(2)

式中:

z(t)=x(t)+jH[x(t)]

(3)

(4)

δ、u为积分变量。

由于Wigner-Ville分布的时宽带宽积达到不确定性原理给出的下界,因此相比于其他联合时频分布,Wigner-Ville分布拥有较好的时频分辨率。

SPWVD时频分布是由WVD分布中加入两个实的偶函数g(u)和h(τ)得来的,其中g(u)为时域平滑窗和h(τ)为频域平滑窗,

(5)

相对于WVD,SPWVD可以更好地削弱相干项的影响,能量和时频聚集性更强,更容易看出信号的时频关系。图1展示了在信噪比为0 dB下非线性调频信号的SPWVD和WVD时频分布图。由图1可以看出:信号WVD时频分布在噪声干扰下表达不明显,且能量聚集程度低;而SPWVD在较低信噪比条件下依然能够显著地展示信号的时频变化,并且能量更为聚集凸显,具有一定的抗干扰性。

图1 SPWVD和WVD时频分布图对比

2 CBAM结构

注意力机制经常利用心理学的内容进行解释,即人类在复杂环境下能够有效关注自己感兴趣、值得注意的点,而该特性也是注意力机制能够模仿的。CBAM由通道注意力模块(CAM)和空间注意力模块(SAM)串联而成,如图2所示,证明CAM在SAM前效果更好。

图2 CBAM结构

在CAM中,如图3所示。假设输入的特征图大小为(H×W×C,分别代表高度、宽度、通道),经过全局平均池化和全局最大池化,使得高度和宽度压缩为1,得到两个1×1×C的特征图,再同时送入多层感知器(MLP)网络中,层数为3层,中间层神经元个数为C/r(r为减少率),在本文中r=4,ReLU函数作为激活函数。经过MLP输出后进行特征相加,采用sigmoid激活函数完成映射,得到通道模块权重Wc,与输入的特征图相乘完成CAM的计算。

图3 CAM结构

在SAM(见图4),输入的特征图经过最大池化和平均池化后在通道上进行拼接,得到H×W×2的特征图,而后经过卷积核为7×7的卷积运算,采用sigmoid激活函数完成映射,得到空间模块权重Ws,与输入的特征图相乘完成SAM的计算。

图4 SAM结构

3 残差网络

残差网络核心在于引入了残差块结构,如图5所示。该结构左边使用了特殊的连接方式,可以称为跳跃连接或短路连接,右边使用两层卷积神经网络。将输入x经过3×3卷积核的卷积运算以及批归一化、ReLU激活映射得到F(x),同时与x进行跳跃连接得到H(x)=F(x)+x,此时F(x)=H(x)-x,即为网络残差。若输入x与输出F(x)的特征维度相同,则直接加和。若维度不同,则与输出F(x)维度一致。

图5 残差块结构

4 基于注意力增强的残差网络识别框架

本文提出注意力增强的残差网络识别算法,将多个CBAM穿插在多个残差块之间,增强残差网络对特征的关注度,提高特征提取能力,整体网络连接如图6所示,由2个卷积层、6个残差层、4个CBAM模块、1个全局平均池化层、1个全连接层组成。其中2个卷积层和1个CBAM模块组成第1个基础网络块,后续连续3个基础网络块都是由2个残差层和1个CBAM模块组成,全局平均池化层对每个特征图求和取平均,将输入维度压缩为1×1,能够生成与类别相对应的特征图,增强特征图与类别的一致性,最后利用全连接层,使用softmax分类器进行分类。

图6 基于注意力机制增强的残差网络识别框架

本文网络损失函数使用负对数似然(NLL)损失函数;优化方法使用自适应矩估计(Adam)梯度下降方法,其本质上是带有动量项的均方根传递(RMSprop)算法,它利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率。Adam的优点主要在于经过偏置校正后,每一次迭代学习率都有个确定范围,使得参数比较平稳。

将时频图像预处理为56像素×56像素,经过卷积网络、残差网络和CBAM模块,在全局平均池化前得到7×7×512的特征图,最后送入softmax分类层得到调制类别。表1为各网络层特征参数。

表1 各网络层特征参数

在第2~第4每个基础网络块中第2个残差块Residual_2目的是实现通道增加一倍、特征图尺寸减小一半,给出残差块的卷积参数如图7所示。由图7可以看到,残差块Residual_2相比于残差块Residual_1,在跳跃连接线路上增加了卷积核,为了使特征图尺寸减小一半,本文设置卷积核大小为2×2,步长为2,填充为0,保证了通过跳跃连接线路的输入x在维度上与残差一致,满足相加运算。

图7 残差块特征参数

5 实验及结果分析

5.1 实验信号设置

本文雷达辐射源信号均通过 Low Probability of Intercept Toolbox产生,产出6种信号调制类型,参数设置如表2所示。

表2 信号参数设置

所有信号参数在取值范围内随机选取,信噪比取值为-20 dB、-15 dB、-10 dB、-5 dB、0 dB、5 dB,并且每个信噪比下、每种信号随机产生1 500个训练样本、500个测试样本。

信号产生及时频图像数据产生使用数字仿真软件平台;网络搭建及训练使用Pytorch学习框架;计算机配置:CPU为Inter(R) Core(TM) i7-8750H,8 GB内存,GPU为NVIDIA GeForce GTX 1050Ti。

图8展示了6类调制信号SPWVD时频分布图。由图8可以看出,除了NLFM和FSK信号外,其他4种信号在变化趋势上有类似的地方,这给网络训练识别增加了一定难度。

图8 6类调制信号的SPWVD时频分布

5.2 识别网络整体性能分析

图9展示了在信噪比为-10 dB下,网络迭代100次的训练误差、测试误差和识别率曲线图。由图9可以看出,网络训练中,训练集和测试集很快得到收敛,识别率也是在前9次迭代后迅速从57%上升至90%,在经过94次迭代后,误差及识别率趋于稳定。

图9 训练误差、测试误差及识别率

为对比使用SPWVD时频变换的优势,使用WVD时频变换重新作为输入到本文网络中(称为WVD+本文网络),并且将本文网络与LeNet-5及Ori-ResNet两种卷积网络进行对比,其中LeNet-5为经典的手写识别卷积网络;Ori-ResNet为本文网络去掉注意力机制后剩下的网络。图10为4种网络的识别率对比图。由图10可以看出:WVD时频变换由于能量聚集性较差,使得在低信噪比下网络很难从中提取到有效特征,使得识别率快速下降;同时在信噪比较好的情况下(0 dB及以上),各网络都能进行很好地识别,而当信噪比降到0 dB以下,网络性能出现很大差距,本文算法在-10 dB保持有94.2%的准确率,在-20 dB依然有63.1%的准确率;相比于Ori-ResNet网络,说明本文使用的注意力增强的残差网络对噪声有着较好的抗干扰性,对特征提取有有效的促进作用;相比于LeNet-5网络,说明网络层数增加能够进一步提高识别率,而残差网络的优势能够确保网络加深的同时保持性能良好。

图10 识别率对比

5.3 网络特征可视化及注意力机制分析

为展示每层网络提取到了什么样的特征,在此进行特征可视化操作,以信噪比0 dB的一个NLFM信号为例,将该信号时频图转成56×56像素图片,如图11所示,分别提取到第1、第2个卷积层和第1、第2、第3、第4个CBAM的特征,每层网络取出前12个通道作为示例,如图12所示(图中坐标轴均表示像素)。由图12可以看出:卷积层的操作是对时频信号图像的纹理方面进行提取;CBAM操作是增强了对图像中时频信号能量较高的部分的关注度,每个通道对图像特征都有所响应,说明每个卷积核都参与了学习,并且随着网络加深,提取到的特征越抽象。

图11 输入网络的NLFM信号示例

图12 提取到网络层特征可视化图例

为进一步分析加入注意力机制模块CBAM对网络识别率的影响,将去掉所有注意力机制的网络Ori-ResNet为基础,沿着本文网络框架从上往下依次增加注意力机制模块,每增加一个CBAM进行一次实验,得到的识别率对比如图13所示。可以看出每增加一个CBAM,识别率都有所增加。增加第3个CBAM时,识别率有一个较大的提升,说明第3个注意力机制关注的特征更具区分性。

图13 不同CBAM数量的识别率对比

5.4 不同算法对比

为进一步验证本文算法的优势,与文献[11](LeNet-FisherDDL)、文献[19](MRSAF-DBN)、文献[20](Chrip-Zernike-ResNet)分别在信噪比-20 dB、-10 dB、0 dB下进行对比,如表3所示。由表3可以看出:本文算法在低信噪比条件下具有较强的优势,尤其在信噪比-10 dB下,相比于其他3种算法,识别率分别高出26.5%、20.7%、24.1%,其中本文算法相比于LetNet-5网络更深,提取时频信号特征更为有效;与文献[19]采用的模糊函数主脊切片特征相比,SPWVD时频图像保留更丰富的特征信息;使用注意力机制模块,提高了残差网络对噪声的抗干扰性,因此效果比文献[20]算法识别效果较好。

表3 不同算法识别率

6 结论

针对情报分析中在低信噪比下雷达信号调制样式识别率的问题,本文提出利用注意力机制强化残差网络特征提取及识别的算法,并进行了仿真验证。得出以下主要结论:

1)时频变化作为输入网络前的第1次特征提取,需要得到清晰、明显的二维时频图像;SPWVD可很好地反映信号调制样式的时频关系,并且具有较强的抗干扰性。

2)网络深度越深,特征提取的效果越好,但会出现网络退化问题,残差网络能够有效解决该问题,使得网络层数可进一步加深。

3)注意力机制可以提高网络对某一特征的关注度,使得提取到的特征更具有区分性;实验表明,CBAM在信号调制样式识别中,能够有效地关注到噪声干扰下的时频特征,提高了对噪声的抗干扰性,从而提高了识别率。

猜你喜欢

时频识别率残差
基于双向GRU与残差拟合的车辆跟驰建模
基于残差学习的自适应无人机目标跟踪算法
基于类图像处理与向量化的大数据脚本攻击智能检测
基于递归残差网络的图像超分辨率重建
基于真耳分析的助听器配戴者言语可懂度指数与言语识别率的关系
提升高速公路MTC二次抓拍车牌识别率方案研究
高速公路机电日常维护中车牌识别率分析系统的应用
平稳自相关过程的残差累积和控制图
基于时频分析的逆合成孔径雷达成像技术
对采样数据序列进行时频分解法的改进