水声通信中的信道估计与机器学习交叉研究进展

2022-07-29张永霖王海斌台玉朋

声学技术 2022年3期

张永霖，王海斌，李超，汪俊，台玉朋

（1.中国科学院声学研究所声场声信息国家重点实验室，北京 100190；2.中国科学院大学，北京 100190）

0 引言

由于海水的吸收作用，电磁波在海水中衰减十分严重，声波是目前水下可以进行远距离信息传输的最有效载体[1-3]。多年来，水声通信技术不断发展，从非相干通信到相干通信，从单载波通信到以正交频分复用技术（Orthogonal Frequency Division Multiplexing,OFDM）为代表的多载波通信，水下通信对速率及带宽的需求与日俱增[4-8]。与此同时，水下组网技术蓬勃发展，多点组网能够有效实现信息互通、共享的目的，既可以大范围地获取海洋信息，也可以快速、便捷地传递和控制组网信息[9-10]。然而，由于水声传播特性复杂多变，导致水声信道面临强多途、快衰落、强背景噪声等一系列问题，这也给水下声信息传输带来了极大的困难与挑战[11-12]。综上所述，随着水下通信需求的剧增，基于模块化、模型化驱动的传统通信技术面临着瓶颈。具体而言，当未来水下通信面临更加复杂的环境变化以及多维度的网络资源需要通过细粒度精确配置时，传统的水声通信技术将面临精度以及鲁棒性的严峻考验，而基于专家知识所建立的、广泛适用的通信模型也具有一定的局限性。

近年来以深度学习为代表的机器学习技术飞速发展，在诸多领域得到广泛应用，取得了瞩目的成果，为解决上述水声通信中的挑战提供了新的思路[13-14]。机器学习在水声通信技术中的应用尽管稍迟于在水声探测及水声目标定位[15-22]领域中的应用，但依然被赋予了高度期望，受到各国学者的广泛关注[23]，成为了当前海洋信息科学研究的热点。

水声通信与机器学习交叉研究的示意图如图1所示。交叉研究中的重点发展方向及优势结合点。水声通信与机器学习的典型应用包括：（1）以节点间通信为主的物理层，包括水声信道估计与均衡、水声自适应调制、频谱感知与分配、通信质量预测等[24-31]；（2）以组网为应用场景的网络层，包括网络拓扑分簇、节点功率分配、水声网络路由设计、水声网络安全等[32-37]。随着水下通信技术研究的不断深入，上述研究方向正伴随水下装备智能化、一体化的需求，逐渐表现出新的发展趋势，具体体现在数据量、节点的迅速增长，运算效率以及安全性要求不断提高，而机器学习为解决这些问题提供了新的解决方案，水声通信与机器学习方法的具体结合思路如下：

图1 水声通信与机器学习交叉研究的示意图 Fig.1 Schematic diagram of the intersection research on UWA communication and machine learning

（1）大数据：随着水下信息获取技术的发展，实验过程中积累了大量的实验数据。海量信息亟需进一步融合、蒸馏、提纯。深度学习方法能够有效整合数据并充分挖掘数据中的信息量[13,38]。

（2）多智能体：水下组网引发的多智能体间的信息融合与智能博弈。借助强化学习，水下多智能体通过与环境直接互动，学习到利益最大化的习惯性行为，进而实现在高维且动态的真实场景中通过交互和决策完成更错综复杂的任务[39-40]。

（3）快速学习：海洋环境瞬息万变，机器学习模型应具有强鲁棒性，以快速实现对未知环境的响应，进而实现泛化场景的水声通信。少样本学习相较深度学习，强调模型利用以往知识经验来指导新任务学习[41-43]，即具备学会学习的能力，该类机器学习方法被视为实现通用人工智能的基础，也是突破固定场景下水声通信的主要手段。

（4）数据保护：水声组网及通信数据隐私保护与安全至关重要。联邦学习作为一种高效率的隐私保护手段被提出[44-47]，该种分布式的机器学习方法可以在不直接获取数据源的前提下，通过参与方的本地训练和参数传递，得到一个无损的学习模型。

综上，机器学习方法具备推动水声通信技术进一步发展的巨大潜力。此类方法在使用形式上具有较高的通用性，可在水声信息处理多处节点形成潜在技术方案，涉及通信可靠性、速率、信息安全等诸多方面。传统水声学研究和大量实践表明，物理层技术的发展水平对推动整个领域的突破具有重要意义，在学科发展中率先受到关注，是现阶段的重点突破方向。而水声信道的准确估计是物理层实现高质量通信的保障，是贯穿物理层各模块的重要环节。水声通信中信道估计研究面临的样本不足、标签标定困难以及环境失配等问题，这也是机器学习与水声通信技术在跨学科研究中所面临的科学、技术难题。本文将聚焦水声通信物理层中信道估计与机器学习的结合，围绕相关研究的进展、难点及解决方案展开分析与讨论。最后，对该领域的研究进行展望。

1 水声信道估计中的机器学习

水声传播特性的复杂多变，导致水声信道面临强多途，快衰落，复杂噪声干扰等一系列问题，这给水下信息传输带来了极大的困难和挑战。水声信道估计及均衡可以有效获取信道信息并在接收端恢复发射信号，是实现水下综合信息感知和信息交互的重要一环，具有十分重要的研究意义。

在传统水声通信系统中，通常需要在发射端发射固定先导序列，并在接收端通过一定的技术手段对信道进行准确的估计，进而实现对数据信号的恢复。常用的信道估计及均衡方法包括最小二乘（Least Squares,LS）算法以及最小均方误差（Minimum Mean Square Error,MMSE）算法[48-49]。LS算法虽然实现简单，但是整体性能欠佳，而MMSE算法虽然能够逼近统计意义上的最优解，但是需要先验的信道状态作为前提，因此实际应用中的可操作性不强。除此之外，该类算法由于并不具备自适应的特点，因此对先导序列的依赖性很大，在一定程度上影响了水声通信的传输效率。

近年来，基于机器学习的水声通信系统设计成为新兴研究课题。该研究方向探索性强，前期研究成果及可参考文献较少。典型的工作包括，2018 年Chen 等[50]提出了一种基于多层感知机的水声通信接收机设计，Zhang 等[24]于2019 年搭建了更为稠密的 5 层神经网络模型（每层神经元个数分别为1 024，1500，600，128，32）用于水声信道估计及均衡，该模型在基于BELLHOP 的仿真信道中进行离线的训练和在线测试，结果表明了基于深度神经网络（Deep Neural Network,DNN）的网络模型相较传统算法具有明显优势，尤其在OFDM 通信导频数量有限的场景下优势更明显。同年Jiang 等[51]通过仿真实验对比分析了不同尺寸DNN 结构在水声通信误码率以及运算量上的表现，并进一步提出了一种更轻的模型结构，显著降低了运算时间以及存储负担，更加适用于实际的在线水声通信体系。此外，Zhang 等[52]也提出了一种联合水声OFDM 解调、信道估计以及均衡的神经网络结构，实现了接收端的一体化。Zhao 等[53]于2021 年提出一种基于多任务学习的水声通信接收机，通过对信道估计、均衡以及解调的联合优化，实现了通信整体性能的提升。同年，新加坡科技设计大学Lee-Leon等[54]提出一种基于深度置信网络（Deep Belief Network,DBN）的水声接收系统，有效缓解了通信中多普勒效应及多途传播引起的性能衰退，仿真及海上试验结果验证了该方法的有效性。中国科学院声学（简称：声学所）在该方向的前期研究中，由Zhang等[55]提出了一种基于一维卷积神经网络（Convolutional Neural Network,CNN）的水声OFDM接收系统，该研究还重点讨论了模型中跨层连接的性能增益，并对水声环境失配情况下模型的鲁棒性进行了考察，初步归纳了神经网络模型性能与水声环境之间的潜在关联。

基于上述已有研究，可以将基于机器学习的水声信道估计归纳为图2 所示的基本结构。水声信道可以看作是多径时变信道的线性组合：

其中：δ激响应；r代表多径的个数；hi以及τi分别代表多径强度以及多径时延。因此，相应的接收信号可表示为

其中：⊗表示卷积运算，x（n）和w（n）分别表示发送信号及加性高斯白噪声。OFDM 是一种典型的多载波水声通信方式，本文以此为例进行机器学习模型设计，其在频域的接收信号通常表示为

如图2 所示，基于机器学习的DNN 信道估计模块由输入层、隐层以及输出层构成，其中相邻两层之间通过神经元的权重进行调节。L层神经网络模型以发送及接收的训练序列（或导频符号）作为输入信息，输出为信道估计结果。以时域信道估计为例，模型通常可以表示为

其中：M为模型训练中的批大小（Batch size）。通常采用的优化器包括随机梯度下降算法（Stochastic Gradient Descent,SGD）[56]、前向均方根梯度下降算法（Root Mean Square Propagation,RMSProp）[57]、自适应梯度算法（Adaptive Gradient,AdaGrad）[58]以及自适应矩估计算法（Adaptive Moment Estimation,Adam）[59]等。

虽然现有研究已证明机器学习方法能够有效提升水声信道估计的整体性能，但考虑到具体的水声应用场景，仍存在诸多关键问题有待解决。现将主要有以下三点：

（1）样本不足：水声通信受限于海试条件等因素，导致水声环境中采集效率较低，水声通信数据的获取成本较高。因此，水声通信在有限时间内采集的样本量通常难以支撑模型的有效训练，因此会造成模型的过拟合。

（2）数据标定困难：现有模型通常将真实信道冲激响应作为训练标签。然而，真实的水声通信中难以实时地获取信道的真值，即无法实现训练标签的标定，因此模型的学习通常需要离线进行。

（3）环境失配：水声信道时变、空变明显，会造成离线训练得到的模型无法在环境失配的情况下在线部署。现有基于机器学习的水声通信系统设计中，模型的训练方法均采用传统的分步式（Step-by-step）迭代方法，训练得到的模型可移植性较差。因此当水声通信环境改变时，又需要大量来自新环境中数据进行重新训练或微调（Fine-tune），从而导致模型的通用性大大降低。

下文将针对以上三点问题展开讨论，提供相应的初步解决思路。

2 基于机器学习的水声信道估计

针对上文提及的水声信道样本不足、数据标定困难以及环境失配的问题，本文将分别探讨基于数据增强、无标签学习以及少样本学习的技术思路。值得注意的是，上述三类问题在实际的水声通信中往往是同时存在的，本文通过对具体问题的拆解、分析，为解决实际通信场景中的复杂问题提供了范例。同时，所提方法在应用中具有一定的可融合性，即各项技术路线之间可以实现进一步的相互整合、协同优化。

2.1 基于数据增强的水声信道估计

数据增强（Data Augmentation）是一种借助有限的数据产生更多等价数据的技术[60-61]。该方法是克服模型训练数据不足的有效手段，目前广泛应用于机器学习的各个领域。结合水声通信的应用场景及物理含义，本研究将可应用于水声信道扩展的数据增强算法分为三类：（1）基于原始水声信道分布统计特性的重放技术；（2）基于通信信号处理技术的数据增强方法；（3）基于深度学习的数据增强方法。下面将具体介绍上述三类方法。

2.1.1 水声信道重放技术

信道重放技术能够基于少量实测水声信道，无限生成具有相同统计特性的数据，因此可作为一类数据增强方法使用。已有相关研究提出了一种由测量数据驱动的水声信道模拟器，该方法假设在一个特定的时间窗内，通信信道是一个各态遍历的随机过程[62]。基于此，该方法能够实现对该过程的无限重放。此后，有更多的研究基于实测水声信道的统计特性展开，并依据此提出了更加普适的信道重放方法。文献[63]利用经验模态分解（Empirical Mode Decomposition,EMD）技术，首先将信道拆解为确知部分以及随机部分[64]，该方法在最大程度保证水声信道固有特性的基础上，通过信道重放的方法对后者进行扩展并与确知部分重新组合生成新的水声信道数据。借助水声信道重放技术，可以对少量带标签的信道样本进行扩展，生成分布特性一致的大数据样本，进而辅助模型的训练，基于数据增强的水声OFDM 系统框图如图3 所示。

图3 基于数据增强的水声OFDM 系统 Fig.3 A data augmentation aided UWA-OFDM system

目前，声学所的研究人员就基于数据增强方法的水声OFDM 通信开展了实验验证。初步的仿真实验结果表明，基于增强信道的模型误码率性能相较基础信道模型提高了50%以上。同时，所提的数据增强方法能够有效缓解基础水声信道样本不足造成的模型过拟合问题。

2.1.2 基于通信信号处理技术的数据增强

借助水声通信场景中经常出现的扰动及干扰，如同步误差、多普勒偏移、噪声干扰等，基于通信信号处理技术的数据增强能够实现对数据的扩展。典型工作包括文献[65]中对原始数据施加符号时间偏移以及多普勒偏移实现数据增强，具体方法为：

（1）符号时间偏移：为了保证模型能够对同步误差信号具有较好的鲁棒性，该研究在构造数据集时考虑了时间偏移量：

其中：ε表示由于时间同步不准确造成的偏移量。为了实现数据的扩展，该偏移量ε随机采样自一定的时间偏移区间内。

（2）多普勒偏移：水声通信中由于平台移动造成的频谱偏移，可以表示为

其中，时间尺度上的变化量σ展开为

其中：v和c分别表示平台相对移动速度以及声波在水中的传播速度。通过考虑一定范围内的多普勒偏移，可以进一步实现基础数据集的扩展增强。

基于上述思路，该研究借助仿真数据，分析了数据增强前后的性能提升，验证了方法的有效性。

2.1.3 基于深度学习的数据增强方法

数据增强算法在深度学习的诸多应用领域都存在需求，从深度学习视角所开展的研究为机器学习水声信道估计提供了可借鉴的思路。其中典型算法包括特征空间增强（Feature Space Augmentation,FSA）以及对抗生成网络（Generative Adversarial Network,GAN）数据增强[61,66]。特征空间增强方法首的低维向量，进而可以在特征空间进行数据增强操作，常采用合成少数类过采样技术（Synthetic Minority Oversampling Technique,SMOTE）对k个近邻合并以形成新实例来缓解类不平衡问题[67]。GAN 数据增强方法使用GAN 模型的生成网络生成新的水声信道样本，而同时GAN 判别网络需要对生成样本及真实样本进行甄别，二者通过相互博弈的方式进行学习。该数据增强方法得到的合成水声信道数据和真实数据相比既具有语义上的相似性，同时又能够呈现文本上的多样性，因此是一种提升机器学习在水声通信领域应用价值的潜在方法。但需要注意的是，受到神经网络可解释性水平的制约，该类方法目前只能进行笼统的定性分析，尚缺乏坚实的物理机理的支撑。从目前的实验结果来看，该类方法的模型鲁棒性欠佳，且难以实现稳定的训练。

2.2 基于无标签学习的水声信道估计

基于数据驱动的机器学习架构通常需要大量带标签的水声信道数据进行训练，而真实的信道信息在实际应用中往往是未知的，且大批量地进行信道标签的标注将造成大量的时间成本损耗。为此，ZHANG 等[68]提出了一种基于无标签学习的水声OFDM 信道估计方法，其模型结构如图4 所示。

图4 基于无标签学习的水声OFDM 系统[68] Fig.4 A machine learning label-free based UWA-OFDM system[68]

区别于现有的有监督学习方法，本研究中的优化目标并非最小化，而是计算实际接收导频信号Y(k)与之间的距离，计算公式为

该研究基于WATERMARK 水声实测信道数据库进行了信道估计性能测试[69]，其中频域信道的跟踪结果如图5 所示（信噪比为0 dB）。

图5 无标签学习网络信道跟踪结果[68]Fig.5 UWA channel tracking results with label-free network[68]

基于信道估计结果，均衡后的发射信号估计值可以通过迫零（Zero Forcing,ZF）算法得到，进而各算法的性能可以通过通信误码率（Bit Error Rate,BER）进行评价，实验结果如图6 所示。

图6 无标签学习网络误码率性能[68]Fig.6 BER performance with label-free network[68]

该实验结果表明：所提出的无标签网络模型相较传统的LS 算法能够取得更加稳定的信道跟踪结果，同时观察到所提方法可以逼近统计意义最优解。由于该网络模型突破了带标签样本的限制，因此可以实现模型的在线学习，更加适用于实际水声通信的应用场景。

2.3 基于少样本学习的水声信道估计

水声信道复杂多变，这往往会造成机器学习模型训练阶段和部署阶段的环境出现失配现象，而环境的失配将会导致前期训练得到的模型参数在目标环境中的性能出现明显下降。近期，声学所研究人员提出一种解决实际应用中源域、目标域失配问题的思路，通过将少样本学习（Few-Shot Learning,FSL）中的元学习（Meta-learning）方法引入到水声信道估计与均衡中，实现了模型在环境失配情况下对未知水声环境的快速响应[70]。

元学习也称为“学会学习”，即通过多任务的训练实例来设计能够快速适应新环境的神经网络模型[71]。元学习的基本思路是通过前期在各种学习任务上训练，得到一组泛化能力强的基础模型参数，再通过快速地迁移微调形成可应用于未知任务的模型。

基于元学习的训练策略，该研究首先搭建了如图7 所示的水声OFDM 多任务训练平台，其中训练任务来源于已知的不同环境下的水声通信任务数据集（仿真或历史数据），目标任务来源于未知水声通信环境中的通信采样数据。

如图7 所示，在每个元训练周期，该方法在训练任务全集H中随机选择L个水声环境作为子任务。依照上述操作，可以分别得到支撑集Ctr=,l=1,…,L以及查询集,l=1,…,L用于元学习的嵌套训练结构。

图7 基于元学习的水声OFDM 通信系统[70]Fig.7 Met a-learning based UWA-OFDM communication system[70]

常规的神经网络模型训练策略是在一个训练周期内根据梯度下降方向进行一步迭代。而元学习的训练过程分为两个阶段，即针对具体任务的快速训练和跨任务的渐进训练，二者满足嵌套关系。

（1）内层快速训练：快速训练发生在独立的每一个任务上，即本文中的L个信道环境。基于第l个任务的支撑集Ctr，我们利用梯度下降法进行模型参数迭代：

其中：α为内部学习率，更新后的模型参数Ωl应满足针对具体任务的最优表达。通过内层快速训练，我们共得到针对L个任务的模型参数。

（2）外层渐进训练：渐进训练通过跨任务实现，参数更新利用梯度下降法得到：

其中：β为外部学习率，∇Ω表示对模型参数求偏导数。

通过上述元学习训练过程，神经网络模型能够在参数空间中寻找到一组快速应用于未知任务的参数解，因此在目标任务上相较传统训练方法具有更强的表达能力。

该研究基于WATERMARK 数据库，搭建了如图8 所示的水声多任务训练平台用于元学习模型的性能验证。基于此平台，研究对比了元学习方法与常规机器学习训练方法在目标环境上的迁移速度及误码率性能，结果如图9 所示。

图8 基于WATERMARK 的元训练/测试平台[70] Fig.8 WAT ERMARK based dataset for meta training/testing platform[70]

图9 基于元学习的模型收敛及误码率性能[70]Fig.9 Convergence and BER performance of meta-learning based model[70]

实验结果表明：基于元学习的模型仅通过100步迭代即可实现对未知环境的收敛，而基于传统训练方法的模型则需要约5 000 步的迭代才能实现收敛。所提方法大幅提升了响应速度上实现了，有效缓解了水声失配对机器学习方法的影响，是实现水声泛化场景通信的一次有力尝试。为了进一步考察元学习方法的有效性，研究选取了2017 年某湖试数据作为目标样本，图10 为湖试环境与水声信道结构，该次实验中通信中心频率7.5 kHz，带宽5 kHz。相应实验结果如图11 所示，元学习模型可以通过100 步迭代快速实现对目标湖试环境的收敛，而传统训练方法则需要约5 000 步迭代才能实现收敛。同时，所提方法在误码率性能上相较常规机器学习以及传统算法均有较大的优势。