语音增强 #对抗防御

ICASSP 2026 - 语音增强 #对抗防御共 1 篇论文 ← 返回 ICASSP 2026 总览排名论文评分分档 🥇 Adversarial Defense via Generative Speech Enhancement Module 7.5分前25% 📋 论文详情 🥇 Adversarial Defense via Generative Speech Enhancement Module ✅ 7.5/10 | 前25% | #语音增强 #对抗防御 | #语音增强 #数据增强 | #语音增强 #对抗防御 👥 作者与机构第一作者：未说明通讯作者：未说明作者列表：Chi-Tao Chen（国立中央大学资讯工程学系），Chun-Shien Lu（中央研究院资讯科技研究所），Jia-Ching Wang（国立中央大学资讯工程学系） 💡 毒舌点评本文巧妙地将对抗防御问题转化为语音增强任务，使用一个轻量级（2M参数）且高效的生成模型（MP-SENet）实现了在多个数据集和攻击类型下的出色防御效果，推理速度远超基于扩散模型的竞品。然而，其核心防御机制（高斯噪声注入+增强）在理论上可能不够“坚固”，面对精心设计的自适应攻击时（如论文表5），性能仍有显著下降，且在SC09这一基准上并未超越最强的对比方法AudioPure。 🔗 开源详情代码：提供了官方GitHub仓库链接：apoman123/SpeechEnhancementDefense。模型权重：论文中提及使用了在DNS Challenge上预训练的MP-SENet模型，但未明确是否公开其微调后的防御专用权重。数据集：使用了公开数据集：SC09（Google Speech Commands子集）， VCTK， QKWS， DNS-Challenge。 Demo：未提及。复现材料：给出了关键的训练数据增强细节（噪声dBFS范围及最优值）、损失函数公式与权重、攻击参数设置。但优化器、学习率等训练配置未说明。引用的开源项目：依赖了公开模型MP-SENet，并引用了多个基线方法和攻击方法的开源实现（如DefenseGAN, AudioPure, PGD攻击代码等）。 📌 核心摘要 ...