MelShield: Robust Mel-Domain Audio Watermarking for Provenance Attribution of AI Generated Synthesized Speech
📄 MelShield: Robust Mel-Domain Audio Watermarking for Provenance Attribution of AI Generated Synthesized Speech #音频安全 #语音合成 #信号处理 #扩散模型 #生成模型 ✅ 7.0/10 | 前25% | #音频安全 | #信号处理 | #语音合成 #扩散模型 | arxiv 学术质量 5.5/7 | 选题价值 1.5/2 | 复现加成 0 | 置信度 高 👥 作者与机构 第一作者:Yutong Jin(Queen’s University, Department of Electrical and Computer Engineering) 通讯作者:Qi Li(Queen’s University, Department of Electrical and Computer Engineering) 作者列表:Yutong Jin(Queen’s University)、Qi Li(Queen’s University)、Lingshuang Liu(University of Waterloo)、Jianbing Ni(Queen’s University) 💡 毒舌点评 亮点在于巧妙利用了Mel频谱图作为TTS流程的“公共接口”,在不改动扩散或GAN声码器的情况下实现了即插即用的水印嵌入,工程实用性强。短板是验证机制依赖于存储参考Mel谱,这在大规模、分布式部署场景下可能带来存储和管理挑战,且论文对实际部署环境下的攻击模型讨论略显不足。 ...