EuleroDec: A Complex-Valued RVQ-VAE for Efficient and Robust Audio Coding
📄 EuleroDec: A Complex-Valued RVQ-VAE for Efficient and Robust Audio Coding #音频生成 #自编码器 #复数值 #音频编码 🔥 8.0/10 | 前25% | #音频生成 | #自编码器 | #复数值 #音频编码 学术质量 8.0/7 | 选题价值 1.5/2 | 复现加成 0 | 置信度 高 👥 作者与机构 第一作者:Luca Cerovaz (Sapienza University of Rome) 通讯作者:Emanuele Rodolà (Sapienza University of Rome, Paradigma) 作者列表:Luca Cerovaz (Sapienza University of Rome), Michele Mancusi (Moises Systems Inc.), Emanuele Rodolà (Sapienza University of Rome, Paradigma) 💡 毒舌点评 亮点在于其优雅的理论动机——完全在复数域操作以自然地保留音频的相位-幅度耦合,这直接消除了对复杂且不稳定的GAN训练的依赖,实现了令人印象深刻的训练效率提升(仅需5万步,减少了约95%的计算)。短板是其评估完全局限于LibriTTS一个数据集,尽管分了域内/域外,但应用场景相对狭窄,且论文未提供代码或模型,极大地影响了社区验证和实际应用。 ...