APP下载

通道门控Res2Net卷积神经网络自动调制识别*

2023-12-26郭文普

电讯技术 2023年12期
关键词:特征提取信噪比卷积

陈 昊,郭文普,康 凯

(火箭军工程大学 作战保障学院,西安 710025)

0 引 言

自动调制识别(Automatic Modulation Recognition,AMR)用于检测截获信号的调制类型,为信息获取提供前提保证。作为信号检测和解调的关键环节,自动调制识别在多个领域得到了广泛应用,如频谱检测、频谱感知、认知无线电等。

传统的AMR方法可以分为两类:基于最大似然的方法[1]和基于特征的方法[2-3]。基于最大似然的方法在贝叶斯假设下通过最大似然方式获得理论最优的识别效果,但需已知噪声和信道参数场景。基于特征的方法首先提取信号特征,而后利用如决策树、人工神经网络及支持向量机等分类器[4-5]完成分类,但需要用专业知识设计特征,且设计的特征不够具有代表性,极易受噪声的干扰。

深度学习(Deep Learning,DL)已经在AMR领域得到了广泛的探索。文献[6]首次提出卷积无线电调制识别网络,性能优于基于专家特征的分类器性能。文献[7]借鉴图像处理领域残差网络(Residual Network,ResNet)和密集连接网络(Densely Connected Network,Densenet),建立对应调制识别模型,通过跳跃连接来加强不同层之间的特征传播,并同时引入了一种卷积长短期深度神经网络模型(Convolutional Long Short-Term Deep Neural Network,CLDNN)。文献[8-9]通过CNN和GRU(Gate Recurrent Unit,GRU)的有效结合来提升网络模型的特征提取能力。文献[10]对I/Q数据进行预处理得到振幅和相位,再经过双层LSTM进行特征提取。文献[11]将信号的高阶累积量、瞬时特征和循环谱作为输入,利用CNN和GRU并向网络进行特征提取。文献[12]在CNN模型中引入注意力机制。文献[13]提出了一种轻量化设计方案,从时间和空间的角度有效提取信号特征,减少冗余参数。但是,上述神经网络模型均存在不足:涉及的卷积网络模块都是分层叠加的,导致网络层的感受野范围有所受限,特征提取不够充分,低信噪比条件下自动调制识别准确率不高。

文献[14]提出了一种新的构建块Res2Net,在卷积块中构造分组残差连接,增加网络层的感受野范围,与利用分层卷积提取特征方法相正交,在参数数量和计算开销基本不变的条件下特征提取更加细粒度化,在语音识别[15]、时间序列分析[16]和对象检测[17]上取得了不错的应用效果。文献[18]关注特征通道之间的依赖关系,提出了新的架构单元SENet,通过显式地建模通道之间的依赖关系,自适应重新校准通道方向的特征响应,使用全局信息来选择性强调重要特征,抑制不太有用的特征。SENet可易集成到其他网络结构中,如SE-ResNet[19]、SENet-TCN[20]等,在参数少量增加的代价下网络模型得到了较好优化。文献[10]和文献[20]均在识别模型中加入双层LSTM模块,可以有效处理序列数据,提取时域相关性,取得了较好的识别效果。

本文针对卷积网络模块都是分层叠加的,导致网络层的感受野范围有所受限,特征提取不够充分,低信噪比条件下自动调制识别准确率不高的问题,将SENet模块作为门控机制集成到Res2Net模块中,构建得到门控Res2Net模块,用于替换ResNet模型[7]中的前两个卷积层,并在卷积网络后加入双层LSTM,利用LSTM对长时序列的记忆有效性对卷积特征进行序列建模,综合提出了通道门控Res2Net卷积神经网络自动调制识别模型。在基准数据集上与相关模型性能的比较结果表明,本文所提模型能取得更高的识别准确率。

1 通道门控Res2Net卷积神经网络

本文提出的通道门控Res2Net卷积神经网络模型主要由1维卷积层、门控Res2Net模块、2维卷积层、长短期记忆层和全连接层组成,相关详细参数如表1所示,网络结构如图1所示。

表1 通道门控Res2Net卷积神经网络详细结构参数

图1 通道门控Res2Net卷积神经网络

1维卷积层利用1×1卷积核进行特征图升维,门控Res2Net模块将输入特征图均分成4份,利用在卷积块中构造分层残差连接的方式提取多尺度特征,对应卷积核维度分别是1×3和2×3。在残差连接处加入SENet作为门控单元,学习特征通道之间的关系,并自适应调整相关权重,更新优化特征层。经过残差连接后,加强不同层之间的特征传播,将初始卷积特征与经过门控Res2Net模块后的多尺度特征进行融合,而后通过两层2维卷积层进行特征图降维,改变特征数据排序后送入LSTM进行特征序列建模,学习特征之间的关联性,最后通过维度分为128和11的全连接层进行调制样式识别。

1.1 Res2Net

在多个尺度上表示特征对于计算机视觉任务具有重要意义。与大多数卷积网络以分层的方式表示多尺度特征不同,图2所示的Res2Net模块通过在卷积块中构造分层残差连接,增加网络层的感受野范围,在更细粒度的水平上提高了多尺度表示能力。

图2 Res2Net模块

作用机理为:将输入特征图分为s组,用xii∈{1,2,…,s}表示,每个特征图子集空间尺寸相同,ki表示卷积操作,特征子集xi与上一层卷积输出ki-1()相加后进行再卷积ki()。因为分块残差卷积操作,促使特征图在多次卷积后有更大更细的感受野,有利于全局信息和局部信息的提取与融合。

(1)

1.2 SENet

SENet称为压缩与激励网络,通过显式地建模卷积特征通道之间的权重关系,从而来提高网络产生特征的表示质量。SENet模块结构如图3所示。

图3 SENet模块

其作用机理是:输入为C个特征图,维度为H×W,首先进行全局平均池化,此时各特征图分别对应一个权值;对权值整体通过Sigmoid函数进行自适应更新,将更新权值与原特征图进行相乘,通过学习全局信息来选择性强调有用信息特征,抑制不太有用的特征。

由于新的卷积网络模型的设计与开发是一项困难的工程任务,通常需要选择许多新的超参数和图层配置,相比之下,SENet模块结构简单,可直接应用于现有的架构中,从而有效提高网络性能,并且SENet在参数规模上也是轻量级的,只会略微增加模型的复杂性和计算负担。因此,本文将SENet与Res2Net模块进行融合,得到门控Res2Net模块,如图4所示。

图4 门控Res2Net

1.3 LSTM

递归神经网络(Recurrent Neural Network,RNN)被广泛用于从时间序列数据中学习持久性特征。LSTM是一种特殊类型的RNN,它在学习长期依赖关系方面非常有效。LSTM单元结构如图5所示,由输入门、遗忘门和输出门组成,可以在保留重要信息的同时遗忘无关信息,更好地处理长时间依赖性问题,本文将LSTM用于卷积网络层后,对卷积特征进行序列建模,提升特征提取的有效性。

2 实验结果与分析

先给出实验数据和参数设置,然后设置两个实验来评估基于通道门控Res2Net卷积神经网络的性能。为确保实验公平公正,本文对比对象为使用RML2016.10a公开数据集进行训练的网络,第一个实验主要用于评估卷积层替换为门控Res2Net模块和加上LSTM模块的有效性,第二个实验用于将本文所提模型与CLDNN[7]、PET-CGDNN[8]、CGDNet[9]和LSTM[10]在分类准确率上进行对比。

2.1 实验数据与参数设置

为方便对比验证所提模型的性能,本文使用GNU无线电生成的Radio2016.10a作为数据集。该数据集包含WBFM、AM-DSB、AM-SSB、BPSK、CPFSK、GFSK、4PAM、16QAM、64QAM、QPSK和8PSK共11种常用调制信号,每种调制信号信噪比范围为-20~18 dB,每间隔2 dB生成1 000个样本,共生成220 000个调制信号。该数据集每个信号长度为128,由实部I分量和虚部Q分量合并存储为一个复数组,在模拟恶劣的传播环境中产生,如高斯白噪声、多路径衰落、采样率偏移、中心频率偏移等。

将数据集内各调制样式单个信噪比的信号,以6∶2∶2随机分为训练集、验证集和测试集。梯度更新的批处理大小为400,使用Adam优化器,交叉熵损失作为损失函数,如果验证损失在10个时期内没有改善则利用回调函数减半学习率,如果验证损失在50个时期内没有改善则利用回调函数停止训练。所有实验在单个NVIDIA GeForce GTX1050Ti GPU上运行。

2.2 模块有效性

为探究本文提出卷积模块替换为门控Res2Net模块和加入LSTM模块对网络模型识别准确率的影响,设置了第一个实验,3个对比对象分别为:对象1是文献[7]提出的ResNet模型;对象2是在对象1基础上将前两个卷积模块换为门控Res2Net模块,其中卷积层内卷积核数量及维度保持一致;对象3是在对象2的基础上,在卷积网络后加上双层LSTM模块,即为本文提出的通道门控Res2Net卷积神经网络。不同模块组成在不同信噪比下的识别准确率如图6所示。

图6 不同模块组成下模型识别准确率

从图6中可以看出,整体上随着卷积层替换为门控Res2Net模块和添加LSTM模块,模型在各信噪比上识别精度均有一定提升,尤其是替换为门控Res2Net模块后,相较于ResNet模型在信噪比大于0 dB后有7%~9%的准确率提升,且原卷积模块与门控Res2Net模块两者参数量相差不大,说明了门控Res2Net模块对于特征获取和调制识别的有效性。在卷积网络后加入双层LSTM,使得模型较为复杂,运行时间有所增加,但在可接受范围内,并且因为添加LSTM模块,使得卷积层不用直接与全连接层相连,参数量得以减少,如表2所示。

表2 不同模块组成下模型运行时长及参数量对比

2.3 不同模型识别准确率比较

图7给出了本文所提模型与CLDNN[7]、PET-CGDNN[8]、CGDNet[9]和LSTM[10]在识别准确率上的对比结果。

图7 Radio2016.10a下不同网络的识别准确率

由图7可知,本文所提网络模型在不同信噪比下识别准确率优于其他模型,当信噪比大于2 dB时平均识别准确率在91%以上,在信噪比为12 dB时准确率达到92.68%,而其他网络最高识别准确率依次为84.9%(CLDNN),90%(PET-CGDNN),84.2% (CGDNet),90.9%(LSTM)。不同网络模型的参数量和大于0 dB后平均识别准确率如表3所示。

表3 参数量和平均识别准确率对比

由表3可知,本文所提网络模型在与传统CLDNN模型参数量基本相同的前提下,平均识别准确率提升了约7%。轻量化模型PET-CGDNN、CGDNet和LSTM通过简化网络结构在降低参数数量的同时识别准确率随之降低。本文所提通道门控Res2Net网络虽然参数量较大,但在轻量化网络模型的基础上,并非简单地增加参数就能获得更好的识别准确率,如本文采用的LSTM模型(层数为2,每层单元数为128),文献[10]在不同层数和不同单元数下进行了对比实验,结果表明,在网络结构固定时,增加每层单元数,即增加用于表征的参数数量并不会带来较大性能提升。如在LSTM模型层数为2和3时,单层单元数由128调整到256,但网络模型识别准确率未有提升。

为进一步证明通道门控Res2Net卷积神经网络的识别有效性,本文选择信噪比为4 dB时各网络的识别结果,并以混淆矩阵的形式表示出来,如图8所示。

图8 信噪比为4 dB时各网络识别混淆矩阵

从混淆矩阵中可以发现,识别错误主要在16QAM与64QAM之间和AM-DSB与WBFM之间,原因可能是16QAM和64QAM因在数字域存在大量重叠星座点而引起混淆,AM-DSB和WBFM两者均为连续调制,均通过模拟音频信号产生,两者特征在复平面上趋于一致。

为进一步证明通道门控Res2Net卷积神经网络模型的泛化性,将其与CLDNN[7]、PET-CGDNN[8]、CGDNet[9]和LSTM[10]在更大的基准数据集Radio2016.10b下进行训练验证,识别准确率如图9所示。

从图9中可以看出,本文所提的通道门控Res2Net卷积神经网络模型识别准确率优于其他对比模型,在更大规模数据集下验证了其具有较强的泛化性。

3 结束语

针对低信噪比下如何提高自动调制识别准确率的问题,本文提出了通道门控Res2Net卷积神经网络自动调制识别模型。该模型主要在ResNet模型的基础上,通过将卷积层替换为门控Res2Net模块使得特征提取更加细粒度化,自适应调整特征通道权重,并在卷积网络后加入双层LSTM对卷积特征进行序列建模。基准数据集仿真实验证明,本文提出的网络在不同信噪比下识别精度均有一定提升,证实了引入的多尺度卷积模块、门控机制和长短期记忆网络的有效性。

但是,本文模型复杂度和计算量依然较大,不利于计算资源受限的边缘通信设备应用部署,因此,在后续工作中将围绕模型轻量化进行研究论证。

猜你喜欢

特征提取信噪比卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
基于深度学习的无人机数据链信噪比估计算法
从滤波器理解卷积
基于Daubechies(dbN)的飞行器音频特征提取
低信噪比下LFMCW信号调频参数估计
基于傅里叶域卷积表示的目标跟踪算法
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
Bagging RCSP脑电特征提取算法
保持信噪比的相位分解反褶积方法研究
基于MED和循环域解调的多故障特征提取