APP下载

基于卷积神经网络的宽带合作频谱感知

2022-10-26方广进许怀文

关键词:池化分类器宽带

张 红,申 滨,张 燕,方广进,许怀文

(1.重庆邮电大学 通信与信息工程学院,重庆 400065;2.重庆大学 辛辛那提大学联合学院,重庆 400044)

0 引 言

认知无线电(cognitive radio, CR)旨在不影响主用户(primary user, PU)正常通信的前提下,通过动态频谱接入,实现次用户(secondary user, SU)对空闲频谱的共享和使用,从而提高频谱利用率、缓解频谱资源的不足[1]。保证PU的正常通信是CR的前提,因此,频谱感知(spectrum sensing, SS)是CR中的核心技术。

由于无线电传播介质中的非视距通信和隐藏终端问题,单节点的频谱感知性能不可靠。为了减少这些问题的影响,合作频谱感知[2-4]被提出。合作频谱感知是一种利用用户在不同空间位置的观测样本的多样性可以获得空间分集增益,从而提高感知性能的方法。其中,基于硬融合[5-6]规则的合作频谱感知将每个SU的二进制感知结果发送给融合中心(fusion center, FC),而基于软融合[7-8]规则的合作频谱感知则通过FC收集多个SU的原始感知信息,最后由FC决定PU是否存在。

近年来,宽带频谱感知由于能够灵活地监控宽带授权频段(wideband licensed frequency band, WLFB)上的可用空闲频段而受到广泛关注。传统的宽带频谱感知的研究主要包括宽带能量检测技术[9]、压缩感知技术[10]、小波变换方法[11]等。宽带能量检测技术和压缩感知技术是最常用的方法。宽带能量检测技术将宽带信号转换为多通道并行窄带信号,然后将各路信号的能量值与预设阈值进行比较,判断各路窄带信号是否被占用,该方法的关键是各路信号的阈值选择。另外,在现实环境中,噪声功率并非恒定不变,噪声功率的不确定性往往导致其性能偏离预期。压缩感知充分利用宽带信号的稀疏性或可压缩性,对宽带信号进行欠采样,通过重构算法恢复原始信号,由于其实现的前提是信号具有稀疏性或可压缩性,压缩感知的精度较差,可能无法满足实际应用的要求。

机器学习作为人工智能的核心技术之一,从理论上分析,它可以收集认知无线电网络的各种状态和环境信息,利用决策学习算法得到准确的判断,使认知无线电系统更加智能化。文献[12]提出了几种基于ML的合作频谱感知算法,如支持向量机(support vector machine, SVM)、K最近邻(K-nearest neighbor, KNN)、K均值、高斯混合模型(Gaussian mixture model, GMM)。该类算法和传统的频谱感知算法相比具有较大的性能优势[13]。然而,ML采用能量向量作为特征向量,当参与合作的用户数变大时,ML算法所需求的计算量迅速增加。为了解决这一问题,在文献[14]中,利用低维概率向量作为特征向量,实现了基于ML的合作频谱感知。文献[15]提出一种基于强ML分类器和决策树相结合的频谱感知算法,该算法中采用强ML分类器作为第一级分类器,决策树作为第二级分类器,最终确定频谱状态。仿真结果表明,与经典的ML分类算法相比,该算法在分类性能上得到了提高。此外,相较于机器学习,该算法可以使用更多的数据进行更好的扩展,性能更加稳定,无需使用更复杂的方法来提高准确性[16]。文献[17]讨论了一种基于协方差矩阵与卷积神经网络的频谱感知方法,将SU多天线采集的能量向量的协方差矩阵作为CNN的输入,经过特征提取和降维后,将得到的概率值转化为似然比,并将其作为检验统计量与阈值进行比较,得到判决结果。文献[18]提出了一种深度合作频谱感知方法,将深度学习应用于合作频谱感知。该方法以多个SU收集到的不同子带上的能量观测矩阵或多个SU检测到的每个子带的二值判决结果矩阵作为CNN分类器的输入,由训练好的CNN分类器执行分类任务,判断PU是否存在于整个频带中。文献[19]提出一种利用CNN及协方差矩阵的协作频谱感知方案,将接收的I、Q两路正交信号的归一化协方差矩阵形成双通道输入矩阵作为CNN分类器的输入,并对分类器进行训练。最后,将得到的分类器用于频谱感知。

上述研究与传统的频谱感知方法相比,在算法设计与性能方面有了较大的突破,但所考虑的范围仍然以窄带感知为核心,因此,将相关工作扩展至宽带频谱显得尤为必要。本文对多种典型的ML分类算法进行讨论与研究,在此基础上实现了宽带频谱感知,并重点提出了一种基于CNN的宽带合作频谱感知方案。该方案的设计思想和出发点主要有2个方面:①将传统的基于用户合作的窄带感知算法,扩展到宽带感知的系统框架,利用多个用户数据的空间分集特性,为宽带感知提供更多的用户分集数据;②将传统的以信号处理和以单个子带门限检测为基础的宽带合作频谱感知问题转化为以占用子带的起始位置和连续占用子带个数为模式特征的多种模式分类问题,并通过机器学习分类器的方法加以解决。首先,采集大量不同环境下的能量观测数据以及相应的频带占用模式标签作为训练数据集,并基于此数据集对ML监督学习分类器进行训练,得到可用于执行频带占用模式分类任务的分类器;然后,对实时信号进行分类得到频带占用模式,从而实现宽带合作频谱感知。该方案相对于传统宽带合作频谱感知和ML监督学习分类算法下的宽带合作频谱感知方案,在性能上有明显的提升,且感知时间短。

1 系统模型

图1 系统模型示意图Fig.1 Diagram of system model

在i时刻,第m个SU接收到的第q个子带上的观测信号表示为

(1)

(2)

在第t次感知过程中,第m个SU接收到的第q个子带的能量值为

(3)

(3)式中:时间带宽积2wτ表示一个感知间隔内的信号采样点数,单次感知间隔时长为τ。因此,所有SU接收到的全部子带上的观测信号能量值组成的能量观测矩阵为

(4)

利用能量观测数据矩阵Xt可以实现由数值到图像的映射。不同频带占用模式下的能量观测矩阵映射成图2所示的图像(其中,亮度越高,表明能量值越大)。

2 传统宽带合作频谱感知方案

2.1 硬融合

(5)

传统的基于硬融合准则的合作频谱感知通过结合所有SU的感知结果来提高感知可靠性。子带q的全局判决准则为

(6)

图2 能量矩阵映射图像Fig.2 Energy matrix mapping image

2.2 软融合

在软融合中,FC对所有SU汇报的原始能量观测值进行处理得到判决结果,如等增益合并(equal gain combination, EGC)法,该方法取所有SU关于第q个子带的能量观测值的平均值作为检验统计量,将该检验统计量与采用恒虚警率法设置的恒虚警率下的阈值χq进行比较,得到第q个子带上的全局判决结果为

(7)

(8)

(8)式中:E表示期望;C|·|表示集合的势;P(H0)、P(H1)分别为全部子频带皆为空闲状态和至少1个子带被PU占用的概率。

3 基于ML分类算法的宽带合作频谱感知

3.1 支持向量机

SVM是一种典型的二分类器,针对前述的g(t)多分类问题时,需要构造合适的多分类器。本文采用一对剩下所有(one-versus-rest, OVR)分类法建立起SVM多分类模型,对于K分类问题,此方法需要构造K个SVM分类器,其中,第k个SVM二分类器用于识别数据是否属于第lk类,在抽取训练数据的时候,属于第lk类的训练数据作为正集,其他的类作为负集,表1展示了实现6分类的一对多分类方案的编码矩阵。

利用K个训练集分别训练,可以得到K个SVM分类模型。在测试时,将测试数据分别输入到K个模型中,得到K个结果,取其中值最大的一个作为分类结果。

表1 6分类OVR-SVM方案的编码矩阵Tab.1 OVR-SVM scheme’s coding matrix for six-class problem

3.2 K最近邻

KNN算法在训练集Θ中找到与测试实例X*最邻近的K个样本,若此K个样本的多数属于某个类,则把测试数据分类到这个类中。测试能量观测矩阵X*到训练集样本Xt的距离为

(9)

(9)式中:X*到所有样本的距离向量为l*=[l*(1),l*(2),…,l*(T)]T,对距离向量进行升序排序,取前K个,找出与X*最近的K′个点,组成一个集合,记为M,根据决策规则,决定X*的类别

(10)

(10)式中:χ∈{c1,c2,…,cT}且ck是M中第k个最近邻的标签,k=1,2,…,K′;I(·)为指示函数。

3.3 随机森林

随机森林(random forest, RF)是利用多棵决策树对样本进行训练和预测的一种分类器。首先从原始的数据集D={(X1,L(1)),(X2,L(2)),…,(XT,L(T))}中采取有放回的抽样,构造子数据集Di,子数据集的数据量和原始数据集相同;然后利用子数据集来构建子决策树hi=ξ(Di)。每次向RF分类器输入新的数据X*时,通过对各个子决策树的输出结果进行投票得到最终结果,表示为

(11)

(11)式中:y={0,1,…,K}。

3.4 Adaboost分类器

Adaboost的核心思想是先从初始训练集训练出一个基学习器,再根据基学习器的表现对训练样本分布进行调整,使得先前基学习器分错的样本在后续受到更多关注,然后基于调整后的样本分布训练下一个基学习器,如此重复进行,直至基学习器数目达到事先指定的值I;最后将这I个基学习器进行加权结合。

具体步骤:首先,初始化训练数据的权值D1(t)=1/T,对于I个分类器,使用具有权值分布Di的训练集进行学习,得到第i个基分类器hi(Xt)=ξ(D,Di)。

然后,计算第i个基分类器在训练数据集上的分类误差率,表示为

(12)

根据第i个基分类器的误差计算其权重系数αi=1/2ln(1-i/i),误差值越小的基分类器在最终分类器中的作用越大;得到第i个基分类器的权重后更新训练数据集的样本权值分布,表示为

(13)

3.5 CNN分类器

本文采用的CNN模型由3个卷积层和1个全连接层组成,其中前2个卷积层均包含1个卷积层和1个池化层。具体的模型结构和滤波尺寸如表2所示。

表2 CNN分类器采用的结构参数Tab.2 Structural parameters used by the CNN classifier

卷积层的输出分别为

v∈{1,2,…,n1}

(14a)

v∈{1,2,…,n2}

(14b)

v∈{1,2,…,n3}

(14c)

(15)

池化操作将相邻的多个特征用一个特征代替,该网络模型采用平均池化方法,即从相邻的多个特征中选取它们的平均值作为池化后的特征。池化通过缩小特征图尺寸达到了减小计算量的目的。

全连接层有K个全连接单元,分别表示K个类,在得到最后一个卷积层的输出特征图后,将最后一个卷积层输出的特征图与每个分类都一一相连,全连接层的输出为

OFC=WFC*XFC+bFC

(16)

(16)式中:XFC、WFC和bFC分别是全连接层的输入向量、权重向量和偏置向量。

全连接层的输出经过softmax分类器后输出的输入样本被分为每一类的概率,表示为

j={1,2,…,K}

(17)

本文中的网络模型采用随机梯度下降(stochastic gradient descent, SGD)优化方法来训练CNN,使用分类交叉熵作为目标损失函数,表示为

(18)

(18)式中:θ为CNN模型中的参数;S为全部样本s的总体数量;yi,s∈{0,1}表示样本s是否被分为第i类,是则取1,反之取0;pi,s是softmax分类器输出的预测概率值,表示第s个样本能量观测矩阵被预测为标签i的概率。当yi,s=1且pi,s=1时,交叉熵最小;当目标损失函数达到最小时,停止训练。具体的基于CNN分类器的宽带频谱感知流程如图3所示。

4 仿真结果

为了验证本文方案在性能上的优势,采用Matlab-2019b软件进行仿真验证,并与传统的频谱检测方案进行对比。在仿真中,所有SU随机分布在一个6 km×6 km的区域,如图4所示。SU的数量M=16、子带数Q=30、每个子带的带宽w=200 kHz、PU占用频带的宽度NP为8~16个子带、PU占用频带的起始位置d为0~15、感知时间τ=100 μs、路径损耗系数α=4、阴影衰落因子的变化为4~6 dB。另外,经实验验证对比,在KNN算法中的K取5,以下仿真算法取上述参数值。

图3 基于CNN分类器的宽带合作频谱感知流程图Fig.3 Workflow of CNN based wideband cooperative spectrum sensing algorithm

图4 PU和SU位置分布Fig.4 Location distribution of PU and SU

在仿真过程中,生成信噪比间隔为1 dB、-20~ 0 dB下的数据,每种信噪比下的采样数为1 000,最终产生的训练集、测试集样本量为21 000。

4.1 CNN超参数对检测性能的影响

由于CNN的网络模型参数设置、池化方法和参数优化方法的选取会对模型训练过程及测试效果产生影响,本文设计9种不同的CNN模型,分别对这9种模型进行训练和测试,分别记录每一种模型的各种性能指标,具体如表3所示。

由表3的编号1—5可见,随着卷积层的卷积核数量增加,检测率与虚警率增大,训练时间也随之增加;由编号5—7可见,当最后一个卷积层的神经元数量增加时,检测率与虚警率降低,但训练时间增加;而由序号5、8、9可见,当卷积核大小增大时,检测率和虚警率随之降低,训练时间也随之降低。综合考虑,以下仿真中均选用编号5所对应的网络模型。

CNN中池化操作的目的是提取有用特征信息的同时降低数据维度,常见的池化方法主要有平均池化和最大池化2种。平均池化通过提取特定区域特征信息的平均值作为池化后的结果,而最大池化则是提取特定区域中特征信息的最大值作为池化后的结果。CNN训练过程中为了减小误差函数,可通过优化方法调整网络参数使得误差函数收敛,目前普遍使用的优化方法有SGD和自适应矩估计(adaptive moment estimation, ADAM),表4分析对比了不同池化方法和优化方法下的检测性能。

表3 不同网络参数性能对比Tab.3 Performance comparison of different network parameters

表4 池化及优化方法对检测性能的影响Tab.4 Impact of pooling and optimization methods on detection performance

由表4可以看出,采用平均池化及SGD优化方法的网络模型的检测率和虚警率最高。采用同样池化方法的网络模型中,使用SGD优化方法的检测率和虚警率较高;采用同样SGD优化方法的网络模型中,平均池化效果更好,而训练时间上整体差别不大。

4.2 算法性能分析

根据4.1节中的各项性能结果,采用的CNN模型为卷积层1(16×3×3)、卷积层2(32×3×3)、卷积层3(128个神经元)、池化层的窗口大小(2×2),采用平均池化及SGD参数优化方法。以下比较了本文方案与其他典型ML方案的性能。

图5比较了2种SU数目下不同分类算法在信噪比为-20~0 dB时的检测概率。从图5可以看出,使用ML分类算法的方案整体优于传统方案,尤其在低信噪比下效果更明显。其中,使用CNN算法的检测率最高,检测率排序为CNN>SVM>KNN。此外,随SU数目的增加,所有算法的感知性能有所提升。

图6给出了不同分类算法在信噪比为-20~0 dB时的错误概率曲线图。由图6可以看出,ML分类算法相对于传统算法具有较低的错误检测率。均保持在0.45以下,其中,CNN错误率最低。

图6 错误率Fig.6 Error rate

表5比较了不同的算法在不同样本数量的训练集和测试集下所需的训练时间以及在线检测时间。从表5可以看出,随着训练集数据的增加,所需的训练时间也增加,其中,SVM算法所需的训练时间最少。传统算法中,EGC所需的预测时间最少,ML分类算法中,CNN算法所需时间最少。

5 结束语

为了提高认知无线电网络的感知性能,提出了一种基于CNN频带占用模式分类的宽带合作频谱感知方案。在频带占用模式分类中,与传统方案及ML分类算法下的频带占用模式分类方案相比,该方案的性能有了很大的提高。该方案在相同的实现条件下具有最优的检测率和最低的错误检测,且在线检测时间较短。因此,该方案可以作为实现宽带协作频谱感知的首选方案。

表5 不同算法的线下训练时间及在线检测时间Tab.5 Offline training time and online detection time of different algorithms

进一步,有关多PU场景下的基于该方案的宽带频谱感知性能有待继续研究与验证。另外,监督学习分类器需要与训练集对应的标签集,但在实际场景中这些标签难以获取,因此,基于非监督学习的宽带频谱感知方案也将是后续工作的重点。

猜你喜欢

池化分类器宽带
基于高斯函数的池化算法
我国行政村、脱贫村通宽带率达100%
卷积神经网络中的自适应加权池化
装宽带的人
基于卷积神经网络和池化算法的表情识别研究
用于手写汉字识别的文本分割方法
基于差异性测度的遥感自适应分类器选择
基于实例的强分类器快速集成方法
一种新颖的宽带大功率分配器
基于层次化分类器的遥感图像飞机目标检测