APP下载

基于字典学习的主动声呐目标分类方法

2020-11-10孙同晶

声学技术 2020年5期
关键词:字典信噪比重构

王 红,孙同晶,刘 桐

(杭州电子科技大学通信信息传输与融合技术国防重点学科实验室,浙江杭州310018)

0 引 言

主动声呐目标分类[1-2]作为水声信号处理的重要研究方向之一,在国防和民用方面都有重要应用价值。主动声呐是常用的水声设备[3-4],通过接收发射脉冲信号与目标冲击响应的卷积,得到携带大量反映目标本质信息的回波信号,用于水下目标分类研究。典型分类方法[5-8]分为特征提取和分类器设计两个部分,如 Li等[9]利用分数傅里叶变换频谱对水雷回波信号进行特征提取,然后利用主成分分析对特征进行压缩后再放入支持向量机(Support Vector Machine,SVM)分类器进行分类。但当海洋环境复杂以及研究目标为小物体时,接收的目标回波信号较弱,基于原信号的分类方法无法满足研究需求。

1993年,Mallat等[10]结合稀疏表示理论解决了低信噪比信号的处理问题。稀疏表示[11]利用信号在变换域(字典)中具有稀疏的特性,有效地去除了信号的噪声[12],提高了信噪比。稀疏表示是由字典中有限的列向量线性表示信号的过程,因此,字典的设计直接影响稀疏表示性能。研究初期,信号的表示大多基于通用的固定字典,如余弦变换基、傅里叶变换基[13]和小波基[14]等。而后,研究者们提出了学习字典的方法,其中 K-奇异值分解算法(K-Singular Value Decomposition,K-SVD)算法K-SVD[15]是目前最常用的字典学习算法,最早由Aharon等提出,因其快速的计算效率,受到了广泛的关注[16-18]。基于训练学习的字典带有目标信号类别信息(由目标信号样本作为初始字典训练出的最贴近目标特性的学习字典,具有对同类别目标更有效的信息),本文基于字典学习这一优势,提出一种基于字典学习的稀疏表示分类方法,根据回波信号学习出带有类别信息的学习方式,以重构信号与原信号的匹配度作为分类策略进行分类,有望提高水下目标分类方法的性能。

1 稀疏表示分类基本原理

1.1 稀疏表示原理

稀疏表示是逼近思想的一种衍生。设一个回波信号Y,线性逼近过程是将Y投影到正交基ψ={ψ1ψ2… ψN} 上,以ψ中N个向量ψi线性表示Y:

基于信号逼近的思想,定义稀疏表示:设N维希尔伯特(Hilbert)空间有一组正交字典D={d1,d2,…,dN},di为原子函数,将 Y表示为K(K≪N)个原子的线性组合形式:

把待表示信号Y考虑为一个M×1的向量,一般而言,该向量大多数元素不为0,稀疏表示就是将信号Y在字典D上表示成具有很多0元素向量X的过程,使得数据具有稀疏性,字典D是一个M×N的矩阵。稀疏表示原理如图1所示。

为了用尽可能少的原子表示信号的本质特征,获得待表示信号Y的最稀疏形式,限定稀疏系数非0项的个数为ε,求解如下优化问题:

图1 稀疏表示原理图Fig.1 Schematic diagram of sparse representation

l0-范数是一个多项式复杂程度的非确定性问题(NP-hard problem),很难直接优化求解。由于l1-范数表示计算非零元素绝对值之和,是l0-范数的最优凸近似,并且更好优化求解,因此,使用l1-范数替代l0-范数,优化问题等价于如下问题:

当优化目的为得到与信号Y误差最小的稀疏表示形式时,改写优化问题为

式中,γ表示误差最大值。

1.2 稀疏表示分类

典型的稀疏表示分类方法是基于信号在字典中呈现稀疏状态,用一组原子函数线性地表示信号,在满足一定稀疏度的条件下,获取对原始信号的良好近似,并捕捉信号内在的本质特征,得到特征明显的稀疏信号。在此基础上选择并提取特征,最后结合分类器对信号进行分类。

本文提出了基于字典学习的稀疏表示水下目标分类方法(Dictionary Learning-Sparse Representation Classification,DLSRC),该方法与典型稀疏表示分类方法在原理上都是基于信号在字典中呈稀疏状态,将信号表示为稀疏形式,不同点在于分类方法。本文采用学习的类别字典进行分类,以重构信号与测试信号的匹配度作为分类策略,实现目标分类。

2 基于字典学习的主动声呐目标稀疏表示分类方法

2.1 基于字典学习的稀疏表示水下目标分类

本文提出的DLSRC方法,是由字典学习算法得到各类别字典,通过各字典重构信号,根据重构信号与原信号的匹配度来判断数据的类别,DLSRC方法框图如图2所示。将实测信号分为训练集和测试集导入Matlab程序中,训练集由字典学习算法训练出具有类别信息的字典,测试集赋初始类别标签。

图2 DLSRC方法总框图Fig.2 General block diagram of DLSRC method

具体步骤如下:

(1)导入实测信号:将信号分为训练集和测试集导入Matlab软件中;

(2)加噪声:利用Matlab软件通过仿真给所有信号加入高斯噪声;

(3)训练字典:采用K-SVD算法训练出各类对应的字典,分别标记为字典1、字典2、字典3、字典4;

(4)标记测试信号:每类测试集附上各自的初始类别标签(测试集本身没有标签,此步是为了计算分类模型的准确率);

(5)计算稀疏系数:测试信号分别放入各类别字典中,经过正交匹配追踪(Orthogonal Matching Pursuit,OMP)算法得到不同的稀疏系数(每个测试信号产生4个稀疏系数);

(6)重构数据:由各类别字典及对应的稀疏系数重构出对应的数据;

(7)计算匹配率:计算测试信号与其对应重构数据的匹配率(每个测试信号对应4个匹配度);

(8)判定标签:找到与测试信号匹配率最高的重构信号,判定类别与其对应字典相同;

(9)计算准确率:判断初始类别标签和新的类别标签是否相同,相同即分类正确,统计正确个数,得到准确率。

2.2 基于训练学习的字典构造

K-SVD算法主要由稀疏编码和更新字典两个步骤迭代。首先,由OMP算法计算稀疏编码矩阵,然后逐列更新字典(奇异值分解方法),同时在当前字典下更新稀疏编码矩阵,最后反复迭代、更新,直到收敛或满足结束条件。K-SVD算法的流程图如图3所示。

图3 K-SVD字典学习算法流程图Fig.3 Flow chart of k-SVD dictionary learning algorithm

通过求解如式(4)的优化问题,得到最优字典D。具体实现步骤如下:

(1)初始化:设训练集为字典D的初始矩阵,初始化稀疏编码矩阵X为0矩阵;

(2)稀疏编码:已知字典D,用OMP算法稀疏编码近似求解稀疏系数X,惩罚项可以写为

(3)更新字典和稀疏系数:已知稀疏系数 X,固定除当前更新原子di外其它K-1项原子,剥离原子di的贡献,逐列更新字典D。目标函数为

(4)迭代更新 D和 X,直到收敛或满足结束条件。

2.3 稀疏编码方法

稀疏表示中,字典学习和稀疏分解均用到了稀疏编码计算稀疏系数。1993年,Mallat等[10]提出了匹配追踪(Matching Pursuit,MP)算法。为了改进MP算法收敛速度慢这一缺点,研究者们提出了正交匹配追踪(OMP)算法[19],引入施密特正交化,对每一步分解所选择的全部原子进行正交化处理,由于残差总是与被选择过的原子正交,一个原子不会被重复选择,加快了收敛速度。目标函数为

(1)给定字典D,初始化残差 e0=y,y为信号;

(2)选择与残差内积绝对值最大的原子,表示为φ1;

(3)将被选中的原子φ1作为列组成矩阵φt(每次循环不清空),计算φt的正交投影算子矩阵P,通过目标函数计算残差e1。

(4)对残差迭代执行(2)、(3)步,在迭代过程中被选择过的原子均与残差正交,不会重复选中,φt为所有被选择过的原子组成的矩阵;

(5)达到设定迭代次数或残差小于设定值时,计算结束。

OMP算法的流程如图4所示。

图4 OMP算法流程图Fig.4 Flow chart of OMP algorithm

2.4 分类策略

本方法以测试信号与重构信号的匹配度[20]作为分类策略,匹配率根据l2-范数计算。首先,分别计算原信号和重构信号误差和两者总和的l2-范数,然后,将结果减去误差的l2-范数,最后计算其在总和中的占比。匹配度越高,信号越相似。其数学模型为

基于字典学习的稀疏表示分类的判别方法为:每一个测试信号通过 4类字典稀疏重构,得到 4个重构信号,分别计算重构信号与当前测试信号的匹配度,得到匹配度最高的重构信号,其对应字典可以最好地重构当前测试信号,随即判定当前测试信号类别与对应字典类别相同。

3 基于字典学习的稀疏表示分类方法在主动声呐目标分类中的应用

在消声水池中,利用主动声呐发射脉冲信号,接收4类目标的回波信号。为了产生不同信噪比的回波信号,将原始回波信号加入高斯噪声,形成信噪比分别为-5、-3、0、3、6 dB的弱信号,然后采用本文提出的DLSRC方法对其进行水下弱目标分类。对信号进行短时傅里叶变换,提取频域信号作为特征与支持向量机(SVM)、K-最近邻(KNN)和柔性最大值(Softmax)分类器结合作为对比方法。

3.1 实测目标回波信号

测试条件:入射信号为线性调频信号、频率范围为100~200 kHz、脉宽为0.5 ms。

测试目标:包括空心铝管、实心 PVC管、实心铝圆柱和加肋圆柱壳体4类形似小型目标。这4类目标的原始回波信号如图5所示。

图5 4类目标原始回波信号Fig.5 The original echo signals of four types of targets

3.2 基于DLSRC方法的主动声呐目标分类和对比分析

本文的DLSRC分类方法的核心是由实测信号训练学习的字典。这实质上是对庞大数据集的降维表示,使得字典保留了目标的大部分特征,当测试样本集过大时,当前学习字典无法表示的特征会更多,出现的分类错误率也会相应增大。学习字典稀疏表示测试样本的过程则是利用计算残差与字典原子最大内积的方法,找到最适合表示当前测试信号的有限原子,再由这些有限原子得到含噪信号的近似(更接近于目标的无噪信号),可以有效地去除大部分噪声,降低信号中噪声对分类结果的影响,提高对低信噪比信号的分类准确率。

对此,从三个角度测试说明DLSRC方法分类性能。在不同测试样本数和不同信噪比的情况下,分析测试样本数和信噪比对本方法的影响,在信噪比分别为-5、-3、0、3、6 dB时对比DLSRC方法与其他分类方法的准确率,分析本方法的优势。

3.2.1 不同测试集样本数时DLSRC方法的准确率

固定训练集样本数,分别使用120、200和400个测试信号下测试DLSRC方法的准确率,说明测试信号数量对分类器的影响。结果如图6~7所示。

图6 不同样本数的测试集分类准确率对比Fig.6 Comparison of classification accuracy of test sets with different sample numbers

由图6可知,在120个测试信号、信噪比大于3 dB情况下,分类准确率达到 100%。由此可见DLSRC分类方法受测试集样本数量影响较大,信噪比不变时,测试集样本数越少,分类准确率越高。说明本方法对小样本分类效果较好;反之,在测试样本集过大时效果欠佳,为了得到更高的分类准确率,可以对字典学习算法进行改进。

3.2.2 不同信噪比时DLSRC方法的准确率

固定训练集样本数和测试集样本数,在信噪比分别为-5、-3、0、3、6 dB时对比DLSRC方法的准确率,说明不同信噪比对分类方法的影响。结果如图7所示。

由图7可知,在相同测试集样本数、不同信噪比时,DLSRC方法的分类准确率结果较为接近,验证了该方法中稀疏表示重构的去噪能力,使得该方法受信噪比的影响较小。

3.2.3 DLSRC方法与其他分类方法分类准确率对比

在200个测试样本数下,信噪比分别为-5、-3、0、3、6 dB时,DLSRC 方法的准确率与其他分类方法进行对比。对比采用频域信号结合支持向量机(SVM)、K-最近邻(KNN)和柔性最大值(SoftMax)分类器的方法。其中SoftMax分类器是Logistic回归推广到多类分类的形式,常用于神经网络分类中,具有良好的分类效果。结果如图8~9所示。

图7 不同信噪比时DLSRC法的分类准确率Fig.7 Classification accuracy of DLSRC method under different SNR

由图8~9可知,与其他3种分类方法相比,DLSRC方法的优势在于不同信噪比情况下的分类准确率较为稳定,且在低信噪比时可以达到较高的准确率。由图8可知,SVM受信噪比影响较大,不适合对低信噪比信号进行分类;由图9可以看出,对比受信噪比影响较小的KNN和SoftMax分类方法,DLSRC方法在各个信噪比下的准确率均较高,具有更好的分类效果。对比结果验证了DLSRC方法分类准确率较高,且在低信噪比信号下也可以达到较好的分类效果,具有良好的分类性能和抗噪性能。

图8 不同信噪比下4种不同分类方法的对比图Fig.8 Comparison of four different classification methods under different SNR

图9 4种不同方法的分类准确率对比Fig.9 Comparison of classification accuracy of four different methods

4 结 论

本文针对主动声呐目标分类问题,基于稀疏表示理论和字典学习,提出了基于学习字典的稀疏表示分类方法(DLSRC)。实现了4类低信噪比的主动声呐弱目标的分类,并与SVM、KNN和SoftMax方法进行了对比分析。

结果表明,DLSRC分类方法更适用于小样本分类,在测试集样本数过大时准确率降低,且本方法受信噪比的影响较小,说明对于低信噪比弱信号的处理能力较好。由DLSRC分类方法与其他分类方法的对比结果可知,DLSRC分类方法在不同信噪比时相对其他3种方法具有更好的分类准确率。综上,DLSRC分类方法在小样本和低信噪比信号分类时具有良好性能,但对于大样本分类效果欠佳。初步分析,其原因在于 K-SVD字典学习算法不适用于处理大样本数据。为解决这一问题,今后需要在 K-SVD字典学习算法基础上加以改进,研究如何提高类别字典的信号表示能力。

猜你喜欢

字典信噪比重构
两种64排GE CT冠脉成像信噪比与剂量对比分析研究
视频压缩感知采样率自适应的帧间片匹配重构
长城叙事的重构
基于深度学习的无人机数据链信噪比估计算法
字典的由来
北方大陆 重构未来
低信噪比下基于Hough变换的前视阵列SAR稀疏三维成像
大头熊的字典
北京的重构与再造
正版字典