LMPAN: A Lightweight Multi-Path Alignment Network for Joint Full-Duplex Acoustic Echo Cancellation and Noise Suppression
📄 LMPAN: A Lightweight Multi-Path Alignment Network for Joint Full-Duplex Acoustic Echo Cancellation and Noise Suppression #回声消除 #语音增强 #自监督学习 6.2/10 | 创新 1.2/2 | 严谨 1/1.5 | 实验 1.1/1.5 | 清晰 0.6/1 | 影响 0.9/1.5 | 开源 0/1.5 | 复现 0.2/0.5 | 工程 1.2/1.5 ✅ 6.2/10 | 前50% | #语音增强 | #自监督学习 | #回声消除 | arxiv 👥 作者与机构 第一作者:Chengwei Liu(Qwen Business Unit of Alibaba, China) 通讯作者:未明确说明,但根据惯例及作者署名,或为共同通讯作者。Shaofei Xue(Qwen Business Unit of Alibaba / TongYi AI Lab)与 Haoyin Yan(TongYi AI Lab of Alibaba Group)均有可能。 作者列表:Chengwei Liu(Qwen Business Unit of Alibaba)、Shaofei Xue(Qwen Business Unit of Alibaba / TongYi AI Lab)、Haoyin Yan(TongYi AI Lab of Alibaba Group)、Xiaotao Liang(Qwen Business Unit of Alibaba)、Zheng Xue(Qwen Business Unit of Alibaba) 💡 毒舌点评 本文的轻量级多路径对齐和两阶段SSL训练是在极低资源预算下的务实组合,将AEC+NS做到了可与更大参数模型竞争的水平,对下游ASR/VAD的提升也颇具说服力。然而,工作更多是已知组件(GTCRN、WavLM、软对齐)的系统化集成,缺乏原理性洞察。全篇未提供任何代码或模型,连batch size、GPU型号等基础训练配置都隐去,复现几乎不可能。动态目标适应带来的收益不如两阶段训练本身,且反而拉低了AECMOS,论文对此闪烁其词。此外,SERt的消融在模拟数据上进行,结论能否迁移到真实环境存疑。整体像一份精心包装的内部技术报告而非完整学术贡献。 ...