📄 Transmit Beamforming for High-Rate Underwater Acoustic Communications

#水声通信 #波束成形 #信号处理 #多通道 #接收均衡

学术质量 4.1/8 | 影响力 0.7/1 | 可复现性 0.5/1 | 置信度中

👥 作者与机构

第一作者：Diego A. Cuji (Stony Brook University, Stony Brook, NY USA)
通讯作者：未明确说明
作者列表：Diego A. Cuji (Stony Brook University)、Andrew C. Singer (Stony Brook University)、Milica Stojanovic (Northeastern University, Boston, MA USA)

💡 毒舌点评

本文针对水声通信中发射波束成形对完整、实时信道状态信息（CSI）依赖性强的工程痛点，提出了一种基于主路径到达角的简化策略，并在两个公开实验数据集上验证了其基本可行性。其核心价值在于提供了一种在长反馈延迟条件下实现可靠下行通信的工程折衷方案。然而，从顶会标准审视，其核心创新（基于几何角度的空间滤波）在信号处理领域并非新思想，且论文最大短板在于完全缺乏与现有主流方法（如时间反转镜）在相同条件下的直接量化对比，使得“优越性”或“有效性”的论证严重不足，结论显得空洞，更像一篇工程实验报告而非严谨的学术研究。

📌 核心摘要

本文研究了水下声学通信中的发射波束成形问题。主要挑战在于，传统高精度波束成形（如时间反转镜）需要准确且及时的完整信道冲激响应，而这在实际水声环境中难以获取。论文提出了一种基于角度的波束成形方法，其核心思想是：在存在一个相对稳定的主传播路径（如直达波或底部反射波）的场景下，发射机无需获取完整的信道信息，只需将波束主瓣指向该主路径的到达角。接收机则负责完成时间同步、多普勒补偿和自适应均衡。论文利用SPACE和MACE两个公开的水声实验数据集进行了验证。结果显示，在单用户场景下，该方法在三种不同海况/运动条件下的数据检测均方误差（MSE）分别为-14 dB至-13 dB（SPACE）和-16 dB至-10 dB（MACE），且误码率为零。此外，论文展示了一个双用户异步传输场景，通过波束指向和零陷放置，实现了两个用户可靠通信（MSE约-16 dB和-18 dB，零误码）。该方法的实际意义在于，它降低了对反馈信道实时性和精度的要求，使得在长反馈延迟条件下进行可靠的高速下行水声通信成为可能。主要局限性在于，该方法的性能高度依赖于存在一个稳定主导路径的假设，而在强散射或多径能量相当的环境中可能失效；同时，论文未与现有主流方法（如时间反转镜）在相同实验条件下进行直接性能对比，因此无法评估其相对优劣。

🔗 开源详情

代码：论文中未提及代码链接
模型权重：论文中未提及
数据集：论文中使用了名为“SPACE”和“MACE”的公开数据集，但未在文中提供具体的下载链接、DOI或开源协议说明。
Demo：论文中未提及
复现论文中方法的材料：论文中未提及
论文中引用的开源项目：未提及

🏗️ 方法概述和架构

本文提出了一个完整的单用户/多用户下行水声通信系统框架，其核心设计哲学是将复杂性从发射端（基站）转移到接收端（用户），发射端基于简化的几何信息进行空间滤波，接收端承担时域均衡与同步的主要任务。

主要组件详解：

发射端波束成形模块：
- 功能：将单个数据流通过均匀线性阵列以特定空间方向发送，增强目标方向（主路径到达方向）的信号强度。实现：基于对主路径到达角θ₀的估计，系统首先计算该方向对应的阵列导向向量 sₘ(χ) = [1, e^{-jχ}, …, e^{-j(M-1)χ}]ᵀ，其中 χ = 2πf ∆τ₀，∆τ₀ = (δ sinθ₀)/c 是由阵元间距δ和角度θ₀决定的增量时延（公式9）。频域波束成形向量 Φ(f) = (1/√M) sₘ(2πf ∆τ₀)（公式10），其设计确保了发射功率归一化（Φᴴ(f) Φ(f) = 1）。在实际离散化实现中，考虑到发射信号仅占用有限带宽（由符号率R和升余弦滚降系数αrc决定），系统仅对信号占用的频带内的频率点 fℓ 计算非零权重，其余频点置零（公式11-12）。时域波束成形滤波器 ψₘ[n] 通过对频域权重进行逆离散傅里叶变换（IDFT）得到（公式13）。
- 输入输出：输入为估计的主路径角度θ₀；输出为M个时域波束成形滤波器 ψₘ(t)。
等效信道模型：
- 功能：描述发射阵列、水声信道和接收机天线构成的等效基带信道，是系统设计的基础。
- 实现：论文推导了发射波束成形后的等效复合基带信道响应 h_eq(τ, t)（公式7）。它由M个子信道 h_{m,dn}(τ, t)（公式8）与各自的发射脉冲 gₘ(t)（公式1）卷积求和构成。每个子信道被建模为多径模型，包含路径增益、时延和多普勒频移。论文特别指出，在波束成形聚焦于主路径（路径索引p=0）后，接收到的信号可分解为主路径信号项、多径干扰项 I(t)（公式15）和噪声。主路径信号经历的等效脉冲为 ˜g₀(t)（公式16）。
接收端自适应均衡模块：
- 功能：在接收端完成关键的同步、多普勒补偿和码间干扰消除，以恢复发送符号。这是确保系统在发射端信息不完整情况下仍能可靠工作的核心。
- 实现：采用分数间隔（Ts=T/2，两倍符号率采样）的判决反馈均衡器（DFE）。其关键创新是引入了自适应延迟跟踪机制：通过估计主路径的残余载波相位 φ₀(t)（由二阶锁相环PLL跟踪），并用其驱动线性插值器对采样信号进行微调（公式17-18），以补偿多普勒引起的非均匀延迟。均衡器前馈滤波器 a[n]（长度为Nf）处理跟踪后的输入信号 y[n]（公式19），反馈滤波器 b[n]（长度为Nb）处理历史判决符号。两者系数通过递归最小二乘（RLS）算法联合更新（公式21）。判决操作取最近星座点。
- 输入输出：输入为下变频和粗同步后的接收信号 v(t)；输出为估计符号 ĉ[n]。
多用户波束成形扩展：
- 功能：在多用户场景下，为不同用户设计独立的波束，在指向目标用户的同时抑制对其他用户的干扰。
- 实现：对于两个用户，分别设置两个波束成形向量，一个指向用户1的角度 θ₀,₁，另一个指向用户2的角度 θ₀,₂，并同时在对方角度上形成零陷。论文未详细阐述具体优化准则，但提到了线性约束最小方差（LCMV）或类似准则的思想。

组件间数据流与交互：数据流是前向的：发射端波束成形 → 水声信道传播 → 接收端均衡。然而，系统存在关键的反馈依赖：发射端波束成形严重依赖于对主路径角度θ₀的估计，而这个估计信息需要通过反馈从接收端获得。论文通过在实验中固定引入3秒延迟来模拟实际反馈延迟和处理时间，以验证方法对延迟的容忍能力。此外，接收端均衡器的性能（能否有效消除多径干扰和跟踪多普勒）直接决定了系统是否能利用发射端基于角度的简化信息实现可靠通信，二者构成了一个紧密的耦合系统。

关键设计选择及动机：

选择基于角度的波束成形而非时间反转（TR）：动机是降低对精确、实时完整信道状态信息（CSI）的依赖。TR需要完整的信道冲激响应，而基于角度的方法仅需要一个几何参数（角度），该参数在一定时间内可能比完整的时变信道更稳定，尤其当主路径（如直达波）占主导时。
采用单通道DFE而非空时均衡：论文聚焦于发射端波束成形的简化，接收端采用相对简单的单通道处理，将复杂度更多留在发射端（需要M个滤波器），这符合基站（可承受较高复杂度）向移动用户（通常资源受限）传输的场景假设。
在频域设计波束成形向量：便于精确处理频率相关的信号带宽，仅在信号占用的频带内计算权重，提高了效率，并可与实际频域处理系统对接。

架构图：图1（系统框图）清晰展示了端到端流水线：发射端，数据符号d[n]经脉冲成形g(t)后分为M路，每路通过独立的波束成形滤波器ψₘ(t)，上变频后发射；中间为并行的M个水声信道h_{m,dn}(τ,t)；接收端，接收信号r(t)经下变频、同步和均衡，得到估计符号。图2（均衡器框图）详细描述了接收端DFE与自适应延迟跟踪的结合：输入信号v(t)首先通过一个由残余相位估计驱动的插值器I进行非均匀重采样，重采样后的信号y(nTs)构成前馈滤波器a[n]的输入，判决符号经反馈滤波器b[n]相减，误差e[n]和相位估计用于更新滤波器系数和PLL。

💡 核心创新点

提出一种基于角度的简化发射波束成形策略：核心贡献在于明确地将波束成形设计与主路径的几何到达角（AoA）绑定，以此作为对完整信道信息需求的一种简化替代方案，特别针对存在稳定主路径的水声下行场景。
构建发射-接收联合处理框架：系统性地设计了从发射端角度波束成形到接收端自适应均衡（集成多普勒延迟跟踪）的完整通信链路，明确了“发射端空域滤波 + 接收端时域均衡”的功能划分。
在公开数据集上进行实证验证：没有依赖仿真，而是使用了两个真实的、公开的海上实验数据集（SPACE和MACE）来验证方法，增强了结果的实用参考价值。
初步验证多用户场景的扩展性：通过一个简单的双用户异步传输场景，展示了该框架通过结合波束指向和零陷放置，具备支持空间复用的潜力。

📊 实验结果

论文在两个公开数据集上评估了所提方法的性能，主要指标为数据检测均方误差（MSE）的累积分布函数（CDF）和误码率（BER）。

表1：SPACE和MACE信号参数

参数	SPACE	MACE
中心频率 fc [kHz]	12.5	13
采样频率 fs [kHz]	107/256	107/256
符号率 R [symbols/s]	6510.4	4882.8
M序列长度	2^12 - 1	2^11 - 1
调制方式	BPSK	BPSK
阵元数 (M)	24	12
阵元间距 δ [m]	0.05	0.12

单用户性能（图4）：

论文对每个数据集选取了三次传输（对应不同海况或运动模式），每次传输后处理过程重复1000次以考虑信道和噪声随机性。
图4(a)展示了SPACE数据集的MSE CDF曲线，三次传输（对应Julian Day 288, 294, 300，海况从平静到风暴）的平均MSE值介于-14 dB到-13 dB之间，且所有情况下BER为零。
图4(b)展示了MACE数据集的MSE CDF曲线，三次传输（对应同一天不同时间，平台运动模式不同）的平均MSE值分布在-16 dB到-10 dB之间，平台运动对性能影响更大，但BER同样为零。

多用户性能（图5）：

在一个异步双用户场景中，用户1位于θ₀,₁ = -8.7°（远离阵列），用户2位于θ₀,₂ = 8°（以1 m/s速度向阵列靠近）。信号调制为QPSK，信号干扰比（SIR）设为0 dB。
图5(a)和(b)显示了两个用户的QPSK星座图，清晰聚合。用户1的MSE为-16.37 dB，用户2的MSE为-18.00 dB，且BER为零。
图5(c)和(d)的PLL输出显示了与相对运动一致的相位变化（用户1下降，用户2上升），证明了多普勒跟踪的有效性。

与基线对比：论文未与任何基线方法（如无波束成形、全CSI波束成形、时间反转镜）进行直接对比。其论证依赖于展示在自身设定的实验条件下（3秒反馈延迟）能够实现零误码通信，但这无法证明该方法相对于现有技术的优越性或效率。

消融实验：论文未进行任何消融实验，例如移除角度波束成形、移除接收端的自适应延迟跟踪、或改变角度估计精度，以分析各组件的贡献。

🔬 细节详述

训练数据：
- SPACE：每个传输包含86个重复的、长度为4095（2^12-1）的BPSK调制M序列。总帧长度 Nd = 10 * 4095 个符号。
- MACE：每个传输包含128个重复的、长度为2047（2^11-1）的BPSK调制M序列。总帧长度 Nd = 10 * 2047 个符号。
- 多用户场景：使用QPSK调制序列，未详细说明具体数据长度。
损失函数：未明确说明。均衡器训练过程通过最小化均方误差进行，误差信号 e[n] = ˜d[n] - ĉ[n]（训练期）或 e[n] = ˜d[n] - ĉ[n]（判决导向期）。
训练策略：
- 均衡器采用RLS算法更新系数，遗忘因子 λ = 0.995。
- 训练序列长度：SPACE中 N_t = 4(N_f + N_b) = 4*(20+20) = 160 个符号；MACE中 N_t = 4(15+8) = 92 个符号。
- 波束成形权重估计与应用：在随机起始时间估计主路径角度，构造波束成形权重，然后延迟3秒应用到后续信号上，以此模拟实际反馈延迟。
关键超参数：
- SPACE：前馈滤波器长度 N_f=20，反馈滤波器长度 N_b=20，PLL增益 K_{f1}=10^{-4}，K_{f2}=K_{f1}/10=10^{-5}，RLS遗忘因子 λ=0.995。
- MACE：前馈滤波器长度 N_f=15，反馈滤波器长度 N_b=8，PLL增益 K_{f1}=0.01，K_{f2}=0.001，RLS遗忘因子 λ=0.995。
训练硬件：未说明。
推理细节：
- 均衡器以分数间隔（Ts = T/2）工作。
- 使用线性插值器（公式18）实现基于残余相位估计的自适应延迟跟踪和信号重采样。
- 符号判决采用最近星座点。
- 每帧处理重复1000次以获取统计量。
正则化或稳定训练技巧：未明确提及，RLS算法本身具有较好的收敛速度和稳定性。

⚖️ 评分理由

创新性：1.0/3 论文提出的“基于��路径到达角的波束成形”本质上是一种空间滤波策略，其思想在信号处理和阵列处理领域（如固定波束成形、波束跟踪）有广泛先例。论文的主要贡献在于将这一相对简单的思想明确应用于水声通信的特定约束（长反馈延迟）下，并进行实验验证。这属于针对具体工程问题的应用性改进，缺乏理论或方法上的显著突破。与已有的简化波束成形方法的区分度不足。

技术严谨性：1.5/2 论文的信号模型推导清晰，从发射波束成形到等效信道再到接收均衡的数学框架是连贯的。主要严谨性缺陷在于：1）对于“主路径稳定”这一核心假设，未提供任何量化指标或边界条件分析，使得方法适用性模糊；2）多普勒模型（公式8）采用了路径相关的时延漂移ε_{p,dn}(t)，但后续均衡器设计主要针对主路径的多普勒，对干扰项I(t)的多普勒处理未做分析；3）多用户波束成形的具体权重设计细节被略过。

实验充分性：0.8/2 这是论文最大的短板。尽管使用了真实数据集，但实验设计存在严重不足：1）完全缺乏关键基线对比：没有与无波束成形、传统波束成形或时间反转镜在相同数据、相同延迟条件下进行对比，无法证明所提方法的相对性能；2）缺乏消融研究：无法量化角度估计误差、主路径假设失效对性能的影响；3）结果解读有限：仅报告了MSE和零BER，未讨论性能的下界、失败案例或信道条件边界；4）多用户实验过于初步：仅有一个特例，缺乏干扰抑制比、用户数可扩展性等关键系统性能分析。

清晰度：0.8/1 论文结构清晰，图表（系统框图、均衡器框图）有助于理解。主要清晰度问题：1）部分公式推导（如公式15-16中的˜g_p(t)）可读性一般；2）多用户场景的波束成形设计被一笔带过；3）一些关键假设（如主路径稳定性、反馈延迟处理方式）未被显式强调为方法成立的前提条件。

影响力：0.7/1 影响力局限于水声通信的特定细分场景。由于缺乏与主流方法的对比，其推广价值不明。对更广泛通信领域（如毫米波通信）的启示有限。作为一项工程实践，对水声通信社区有参考价值，但学术影响力有限。

可复现性：0.5/1 论文提供了详细的实验参数（表I）和均衡器设置。然而，代码未公开，数据集虽为公开但未提供明确链接或获取方式。核心的波束成形权重计算、角度估计、特别是接收端自适应延迟跟踪的实现细节，使得完全复现存在困难。

（创新性1.0 + 技术严谨性1.5 + 实验充分性0.8 + 清晰度0.8 + 影响力0.7 + 可复现性0.5 = 5.3。考虑到使用了真实数据集并进行了端到端验证，给予一定认可，上调至6.5。）

🚨 局限与问题

论文明确承认的局限：

方法依赖于存在一个主导的、相对稳定的传播路径。
实验仅针对特定的实验数据集（SPACE和MACE），信道条件可能不具有普遍代表性。
未来工作可探索更复杂的场景。

审稿人发现的潜在问题：

核心假设的脆弱性与未定义性：“主路径稳定”是方法成立的关键前提，但论文未定义“稳定”的标准（如角度抖动范围、能量占比阈值），也未分析该假设在何种典型水声环境（如浅海强多径）下会失效。这使得方法的适用边界完全不清晰。
反馈延迟模拟过于理想化：仅用固定3秒延迟测试，无法反映实际中随机变化的延迟和随之变化的信道。方法在动态延迟下的鲁棒性未得到验证。
接收机复杂度未被纳入考量：论文将复杂度从发射端（M个滤波器）部分转移到接收端（需要高复杂度的RLS均衡器和PLL跟踪）。对于资源受限的水下移动用户，其计算负担和能耗可能仍然过高。
缺乏与SOTA的定量对比是致命缺陷：论文声称减少了对完整CSI的依赖，但未证明在相同3秒延迟下，其性能是否优于、等于或劣于使用定期更新的不完美CSI的时间反转镜。没有这个对比，其“有效性”的论证是不完整的。
多用户结论过强：仅基于一个特定角度差和SIR的双用户特例，就得出“支持可靠高速下行水声通信”的结论过于草率。未分析用户角度分离度、多径扩展、动态移动对零陷效果的影响。
未讨论性能下界：当主路径假设不严格成立时，系统性能会如何退化？是否存在BER不为零的情况？论文未提供这方面的分析或实验。

← 返回 2026-05-15 论文速递

📄 Transmit Beamforming for High-Rate Underwater Acoustic Communications#

👥 作者与机构#

💡 毒舌点评#

📌 核心摘要#

🔗 开源详情#

🏗️ 方法概述和架构#

💡 核心创新点#

📊 实验结果#

🔬 细节详述#

⚖️ 评分理由#

🚨 局限与问题#

📎 相关论文