APP下载

基于深度学习的噪声背景通信信号端点检测

2023-06-15程涛姚万华姚克栗高尚

无线互联科技 2023年2期
关键词:卷积神经网络深度学习

程涛 姚万华 姚克 栗高尚

摘要:在复杂的电磁和地理自然环境中,通信链路常常受到噪声的干扰。基于此,文章提出了一种基于深度学习的方法来解决噪声背景下的通信信号端点检测问题,该方法使用深层卷积神经网络(Deep Convolutional Neural Networks,DCNN)提取样本特征,用于描述信号活跃区域和背景噪声之间的差异,并获得样本特征图。同时,通过多尺度区域检测方法确定特征图中的通信信号的起止端点,并使用线性回归方法精修区域参数,使端点检测结果更接近真值。在实验验证方面,文章利用构建的仿真通信信号数据集进行训练和测试,实验结果表明,该方法能够在毫秒级延迟下准确地检测出淹没在噪声中的通信信号,且检测精度优于现有方法。

关键词:端点检测;深度学习;卷积神经网络(CNN);边框回归

中图分类号:V221+.3;TB553   文献标志码:A

0 引言

在现代通信中,識别通信信号是一个重要的研究方向,对信号出现起止时刻(也称信号端点,Endpoint)的检测是对信号进行识别和分析的基础。然而在现实中,通信信号往往会受到复杂而恶劣的电磁环境的影响,使信号衰落严重,背景噪声强。具体表现为:通信信号的信噪比低,通信时隙中充满较强背景噪声,严重影响信号检测的效果。因此,在强背景噪声条件下进行通信信号检测,具有较强的研究与应用价值[1]。

目前,典型的信号检测方法主要分为两类:一类是基于能量检测的方法[2]。此类方法通过设定门限的方式感知信号,具有计算复杂度低、可根据实际情况调整阈值之优点。但这类方法也存在较大局限,其信号和噪声必须在能量方面表现出明显差异,且在极端条件下,当信号衰减严重噪声强时,这类检测方法的性能较低。另一类,是基于经典信号特征的活跃区域检测,例如小波特征[3]、频谱特征[4]等。此类方法计算复杂度高于前者,但通用性差,只能针对特定的信号。此外,一些统计方法也能应用于解决信号区域检测问题,比如Bayes网络[5]、Kruskal-Wallis检验[6]等,但这些统计方法普遍存在计算复杂、耗时长、在低信噪比下表现较差的问题。近年来,深度学习在图像、语音处理领域发展迅速,其中,图像领域在目标检测方面取得了显著成就,其常用算法可分为两类:基于区域提名的R-CNN系列[7]和无需区域提名的YOLO[8]、SSD[9]系列;语音领域目前还处于起步阶段,其常用算法有CNN[10],T2FNN[11]等。而在通信信号检测领域,深度学习尚未得到广泛应用。

针对以上问题,本文面向通信信号提出了一种基于深度学习的噪声背景通信信号端点检测方法。通过使用深层卷积神经网络对信号进行特征提取,得到信号特征图,并在特征图上生成多尺度检测框,对检测框进行有效性二分类和位置尺寸精修,最终输出信号活跃区域。针对电磁信号采集的困难,本文通过真实地理环境仿真生成强噪声背景通信信号数据集,实现网络的训练和测试。仿真实验证明,本文的方法能够在毫秒级延迟下准确检测强背景噪声下的通信信号,具有较高的实时性和适用性。

1 相关理论技术

在实际通信环境中,复杂的地理环境,障碍物的遮蔽以及信号在障碍物表面的反射和散射带来的多径效应会造成通信信号衰减严重。此外,通信往往存在一定时间间隔,而噪声始终存在,具体如图1所示,在这种情况下,信号衰减较大,信噪比较低,通信间隙背景噪声较强。针对这一问题,本文提出了一种基于深度学习的方法来实现噪声背景下的通信信号端点检测,即提取信号的起止时刻,相关的理论技术主要涉及卷积神经网络和指数概率模型。

1.1 卷积神经网络

卷积神经网络是深度学习领域的代表算法之一,广泛应用于计算机视觉[12]、自然语言处理等领域。与传统神经网络相比,卷积神经网络能够充分利用数据矩阵的动态特性和位置信息,通过编码学习网络中神经元的权重和偏置,使神经网络能够自适应学习数据的特征,并且能够显著地降低训练参数的数目。图2展示了经典卷积神经网络的结构,其主要包括卷积层、池化层和全连接层。

以目前应用广泛的图像领域为例,输入一张图片后进行卷积和池化操作。每个卷积层都有多个卷积核,它们会对图像数据添加权重和偏置,并进行特定特征的提取,产生多个卷积结果。卷积层后,为进一步减少参数数量,采用池化层,对卷积结果局部取最大值,缩小特征图。此后再经过多次卷积和池化操作,增加网络深度,得到最终特征映射图,通过全连接层后输出结果。

1.2 指数概率模型

指数概率(softmax)在机器学习领域应用广泛[13],尤其针对分类问题时,通常需要通过指数概率的方式对输出进行处理。该模型具有理论清晰、收敛速度快和分类准确度高等优点,已经被广泛应用在神经网络模型和机器学习算法中的输出层。指数概率模型可以看作一个由特征层直接映射到输出层的神经网络,公式定义如式(1)所示:

py=ezy∑iezi=eWTyixi+byi∑nj=1eWTjxi+bj(1)

其中,x为特征数据输入,y是相关的真值标签,z为指数概率转换值。

对于训练集{(x(1),y(1)),…,(xm,ym)},有yi∈{1,2,3,…,k},总共有k个分类,对于每个输入x都会有对应每个类的概率,即p(y=j|x),从向量角度看即公式(2):

hθ(xi)=p(yi=1|xi;θ)

p(yi=2|xi;θ)

p(yi=k|xi;θ)=1∑kj=1eθTj·xieθT1·xi

eθT2·xi

eθTk·xi(2)

代价函数可看成是最大化似然函数,也即最小化负对数似然函数,如公式(3):

J(θ)=-1m∑mi=1∑kj=11{yi=j}·log(p(yi=j|xi;θ))(3)

其中包含了示性函數1{j=y(i)},表示如果第i个样本的类别为j,则yij=1。

2 基于深度学习的通信信号端点检测

为在复杂的电磁环境中从较强背景噪声中检测通信信号端点,本文基于深度学习提出一种新的检测方法,其方法流程如图3所示。首先,通过多核深层卷积神经网络对信号进行特征提取,将卷积神经网络变换后的信号视作特征,并将其作为后续端点检测网络的输入。其次,在特征图上生成多尺度区域检测框,根据与标定的活跃区域的交并比(Intersection over Union, IoU)将这些检测框划分为正样本和负样本,利用指数概率对这些检测框进行二分类,得到粗估计的端点位置。最后,为进一步提升活跃区域检测的精度,本文基于线性回归调整这些粗估计检测框的位置和尺寸,并通过这种方式检测得到精确的信号的起止端点,即活跃区域。

2.1 基于卷积神经网络的信号特征提取

传统的卷积神经网络通常用于处理二维信息,比如图像。但是,由于信号是一维的,所以本文使用一维卷积核来代替二维卷积核。一维卷积核在最新的卷积神经网络中已被广泛使用[14],它能够提取一维数据的向量特征,并实现多个特征映射的融合。

在卷积神经网络中,每一层卷积层由若干个不同大小的卷积核组成,其尺寸由人工设定并在训练前初始化参数。因为卷积核在信号的每个样本中均是共用的,所以每个卷积核可称为一个特征提取单元,不同层的神经元之间依靠卷积核连接,这种与位置无关来共享参数的方式能够有效降低学习参数的数量,且卷积运算所形成局部感知野的形式,同样适用于提取通信信号局部变化的特征。通过一个尺寸为k的卷积核生成特征结果y的过程如公式(4)所示:

yi=f(W·xi:i+k-1+b)(4)

式中,xi:i+k-1表示数字通信信号从i时刻至i+k-1时刻的数据,b是偏置参数,f为非线性激活函数。构建多个卷积层进行公式(4)的计算,即可得到特征映射图(feature map)。与图像数据相比,由于一维信号数据量较少,因而本文并未使用池化层进行降采样。

2.2 基于指数概率的多尺寸检测框有效性二分类

在通过卷积神经网络处理信号生成特征图之后,本文在特征图上的每个点以中心生成多种尺寸的检测框,并利用指数概率进行二分类,从而得到粗估计的信号活跃区域位置。

为在分类学习中维护正负样本的数量平衡,本文针对每一条信号数据生成的各个尺寸的检测框取256个正样本和256个负样本,这样的样本总数为512×N,其中N为检测框的尺寸数量。在训练中,本文使用指数衰减法调整学习率,初始学习率为0.01,每500步衰减0.95,可表征为公式(5):

α=0.001×0.95[i/500](5)

式中,α为学习率,i为训练步数,[·]表示向下取整。

2.3 基于线性回归的检测框精修

经过检测框有效性二分类,本文可以得到粗略估计的检测框尺寸。但是,由于实际中检测框尺寸是人为设定的,且尺度不会太大,因此在获取的检测框的位置和尺寸与实际值的位置和尺寸之间仍存在一定差距。

本文通过线性回归[15]的方法,进一步对检测框的尺寸和未知信息进行修正。在给定输入的特征向量X的情况下,学习一组参数W,使得经过线性回归后的值跟真实值Y非常接近,即Y≈WX。本文拟采用位置平移和尺寸伸缩的方式,实现粗估计的有效检测框的位置和尺寸进一步精修,使真实值和理论值进一步接近,这种平移和伸缩原理如公式(6)所示:

Gx=W·ΔX+X

Gw=W·exp(ΔW)(6)

其中,Gx,Gw为精修后的检测框的位置和尺寸,X和W为粗估计检测框的位置和尺寸。检测框是经过卷积神经网络输出的,其有效性得到一定保证,且与真实值相差较小。这种变换可以被看作是一种线性变换,因此本文使用简单的线性回归来建模对窗口进行精修,其输入为粗检测框的位置和尺寸信息,通过相应的映射关系得到精修后的检测框,映射关系可表征为公式(7):

tx=(Gx-Px)/Pw

tw=log(Gw/Pw)(7)

式中Px,Pw为输入检测框的位置和尺寸,tx,tw为相应的映射关系。

损失函数可表征为公式(8):

Loss=∑Niti*-ω*∧Ts(Pi)2(8)

式中s(P)为输入检测框的特征向量,ω*为要学习的映射参数,t*为映射参数的真实值。

3 实验数据集构建

3.1 信号仿真生成

由于目前缺乏公开的电磁信号数据集,因此本文采用仿真生成的方法来构建通信信号数据集,以验证信号端点检测方法的有效性,该方法能够导入真实的地理信息,根据地理环境高程数据和收发端天线位置构建真实信道模型,生成信号数据。方法流程如图4所示。

在信道选择方面,本文采用Longley-Rice[16]信道模型,该模型基于传播理论,结合了真实的地理信息,考虑了多种参数,如发射频率、天线高度、传播路径距离、极化方向、地表有效半径、表面绕射率和地面导电常数,来确定传输损耗的多少。此外,该模型还考虑了视距内的地面反射损耗、由于地球曲率造成的远距离绕射损耗和视距外的对流层散射损耗,还考虑到了传播环境中介质的电传导率特性。根据Longley-Rice模型,输入信号发射源的天线高度、经纬度、气候类型、极化方式、辐射频率,基于信号侦测点的位置数据即可构建真实信道模型。

基于信道模型,输入信号参数生成信号数据。通信信号可以由式(9)表达:

y(t)=x(t)·c(t)+n(t)(9)

式中c(t)为构建的信道衰减模型。x(t)是发射端传输的有效通信信号,通常以式(10)表示:

x(t)=(Ac+jAs)ej(2πft+θ)g(t-nT)

=(Accos(2πft+θ)-Assin(2πft+θ))g(t-nT)(10)

式中Ac和As分別为同相和正交通道基带数字信号的幅值,f为信号中心频率,θ为载波初始相位,g(t-nT)为数字采样脉冲信号。对于ASK,FSK和PSK数字调制信号而言,As幅度为0。进制为M的数字调制信号,其基带数字信号取值分布于[0-M]范围内的随机整数。ASK,FSK和PSK调制方式分别作用于信号的Ac,f和θ,根据数字基带信号取值,其Ac、f和θ将随时间t在[0-M],[1-M]和[0-2π/M]范围内变化。n(t) 为加性高斯白噪声,是最基本的噪声和干扰类型,实际通信系统中无论有无信号,噪声都始终存在,其功率谱密度在全频率下均为常数,噪声信号取值服从高斯分布。

3.2 数据集设定与样本标注

本文训练样本选取自无人机通信信号,根据工信部公布的无人驾驶航空器系统频段使用要求,现阶段使用频率为840.5~845MHz、1 430~1 444MHz和2 408~2 440MHz,其中1 430~1 444MHz频段用于无人驾驶航空器系统信息传输链路。本文基于1 430~1 444MHz频段,调研无人机数据链信号常用调制方式和带宽,引入真实地理环境和飞行数据,使用Longley-Rice信道模型仿真生成了训练集和测试集,具体参数如表1所示。

信号仿真生成的地理环境如图5所示。图5是使用谷歌卫星地图获得的地形图,其范围约为40.244°N~40.912°N,108.540°E~109.418°E。在仿真中,使用无人机飞行数据作为接收端位置,并在真实地理环境中设定地面站发射天线位置参数和信号参数后,即可仿真生成信号。

在标签标注方面,训练集中的每一条样本数据都包含通信信号的开始和结束位置标签,同时也包含了多尺寸检测框的标签。检测框的标签由检测框和真实区域的IoU决定:IoU>0.7为正样本,IoU<0.3为负样本,其余为不参与训练样本。IoU计算公式为:

IoU=|ST∩SG||ST∪SG|(11)

式中ST和SG分别表示训练集中设定的检测框区域和真实的通信信号活跃区域,∩和∪分别表示交集和并集操作,|·|表示信号区域内包含的点数。测试集样本则只包含通信信号的开始和结束位置标签,用于测试活跃区域检测准确率。

4 实验结果与分析

4.1 参数影响的分析

通信信号端点检测常用的准确率指标为输出的信号活动区域和标定的真实活动区域的IoU,与式(11)定义类似,主要影响IoU的因素为卷积层数和活跃区域通信信号的信噪比。卷积层数与网络参数越多,提取的特征也就越准确。但是,过多的卷积层数也会使参数量过多,网络训练测试耗费时间长,而过少的卷积层数则会使提取到的特征不准确,IoU过低;另外,通信信号的信噪比对IoU也有较大影响,信噪比越高,信号与背景噪声越容易区分。利用训练集和测试集对上述主要影响因素进行调整,并在Ryzen 1600 3.2 GHz处理器和NVIDIA GTX1060 6G显卡的计算机平台上测试算法性能,检测结果如图6所示。

从图中可以看出,IoU与通信信号信噪比呈正相关,在每个信噪比上卷积层数到8之后IoU没有明显提升,因此,本文选用8层卷积层。当卷积层为8时,本文网络在各个信噪比均达到了较高的IoU,在信噪比为0达到89.5%、在信噪比为20时达到93.6%,这体现了本文的算法具有优秀的检测性能。在参数和时间方面,本文网络共包含1 466 278个参数,网络每一步训练时间和测试时间分别为0.060 1 s和0.023 0 s,具有很高的实时性。

4.2 实验方法对比

对比试验采用未加入边框回归部分的CNN+Softmax算法及文献[4-6]中的算法,结果如表所示。由实验结果可以看出,相对于CNN+Softmax,本文算法在加入边框回归部分后准确率得到大幅提升。另外,在信噪比较高时,虽然本文算法的准确率相对于部分算法存在劣势,但是在低信噪比下,本文算法的检测准确率取得了明显提升,这表明本文算法在弱信号检测方面具有很强的优越性。

5 结语

本文基于深度学习提出了一种噪声背景通信信号端点检测方法,通过实验验证,得到如下结论:

(1)本文通过构建卷积神经网络,成功提取了一维信号的特征,从而实现在噪声背景下通信信号端点的检测,与传统方法相比,具有一定优势。

(2)本文算法利用指数概率模型,对多尺寸检测框进行判定后进一步回归精修,有效提升了准确率。

(3)在各个信噪比下,本文方法均获得较高的端点检测准确率。在信噪较高的情况下,本文方法检测的准确率与传统方法接近,而在信噪比较低情况下,检测准确率提高了27.1%。

参考文献

[1]杨康,王虎.基于相位估计的InSAR信号优化处理[J].指挥信息系统与技术,2020(1):50-54.

[2]刘安定,肖先勇,邓武军.基于离散余弦变换和小波变换的电能质量扰动信号检测方法[J].电网技术,2005(10):5.

[3]行正世,谢永亮,刘正奇.基于小波变换低信噪比下的雷达目标提取[J].现代雷达,2015(5):47-48,70.

[4]WU D,ZHAO H,TAO Z,et al. Speech endpoint detection in low-SNRs environment based on perception spectrogram structure boundary parameter[J]. 声学学报(英文版), 2014(4):13.

[5]MA T,YAU C. A pairwise likelihood-based approach for changepoint detection in multivariate time series models[J]. Biometrika,2016:409-421.

[6]LUNG-YUT-FONG A, LEVY-LEDUC C, CAPPE O.Robust retrospective multiple change-point estimation for multivariate data: 10.1109/SSP.2011. 5967716[P]. 2011-02-09.

[7]REN S,HE K,GIRSHICK R,et al. Faster R-CNN: Towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2017(6):1137-1149.

[8]ZHOU Z, ZHANG J, GONG C. Automatic detection method of tunnel lining multi-defects via an enhanced You Only Look Once network[J]. Computer-Aided Civil and Infrastructure Engineering, 2022(6):37.

[9]汪宋,费树岷.SSD(SINGLE SHOT MULTIBOX DETECTOR)目标检测算法的研究与改进[J].工业控制计算机,2019(4):103-105.

[10]ABHISHEK, SEHGAL, NASSER, et al. A Convolutional neural network smartphone App for real-time voice activity detection[J]. IEEE Access,2018(6):9017-9026.

[11]CHENG S, CHEN S, HUANG Z. A novel autocratic decision making method using group recommendations based on ranking interval type-2 fuzzy sets[J]. Information Sciences, 2016(361-362):135-161.

[12]車瀚钰,严勇杰,刘洋,等.基于深度学习的遮挡人脸快速检测识别算法[J].指挥信息系统与技术,2021(5):14-20.

[13]刘桂雄,黄坚.基于标签预留SOFTMAX算法的机器视觉检测鉴别语义分割迁移学习技术[J].光学精密工程,2022(1):117-125.

[14]ZHANG D, DING W, ZHANG B, et al. Automatic modulation classification based on deep learning for unmanned aerial vehicles[J]. Sensors, 2018(3):924.

[15]LUO D, WEN G, LI D, et al. Deep-learning-based face detection using iterative bounding-box regression[J]. Multimedia Tools and Applications, 2018 (19):24663-24680.

[16]徐文杰,周新力,吴龙刚.LONGLEY-RICE等效散射模型的建立[J].无线电工程,2011(4):42-44.

(编辑 王雪芬)

End-point detection for noise background communication signal based on deep learning

Cheng  Tao, Yao  Wanhua, Yao  Ke, Li  Gaoshang

(The 28th Research Institute of China Electronics Technology Group Corporation, Nanjing 210028, China)

Abstract:  In complex electromagnetic and geographical natural environments, communication links are often disturbed by noise. Based on this, this paper proposes a method based on deep learning to solve the problem of communication signal endpoint detection in the background of noise. This method uses deep convolutional neural network (DCNN) to extract sample features to describe signal activity. difference between the region and the background noise, and obtain sample feature maps. At the same time, the start and end endpoints of the communication signals in the feature map are determined by the multi-scale region detection method, and the region parameters are refined by using the linear regression method, so that the endpoint detection results are closer to the true value. In terms of experimental verification, the simulated communication signal data set constructed in this paper is used for training and testing. The experimental results show that the method can accurately detect communication signals submerged in noise with a delay of milliseconds, and the detection accuracy is better than that of existing methods. method.

Key words: endpoint detection; deep learning; convolutional neural networks(CNN); bounding box regression

猜你喜欢

卷积神经网络深度学习
基于深度卷积神经网络的物体识别算法
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望