DiVeQ: Differentiable Vector Quantization Using the Reparameterization Trick
📄 DiVeQ: Differentiable Vector Quantization Using the Reparameterization Trick #向量量化 #语音编码 #模型评估 #开源工具 🔥 8.5/10 | 前25% | #语音编码 | #向量量化 | #模型评估 #开源工具 学术质量 6.5/7 | 选题价值 1.5/2 | 复现加成 0.8 | 置信度 高 👥 作者与机构 第一作者:Mohammad Hassan Vali(ELLIS Institute Finland & Department of Computer Science, Aalto University, Finland) 通讯作者:未明确指定(论文提供了共同的学术邮箱 {mohammad.vali, tom.backstrom, arno.solin}@aalto.fi,未说明谁是通讯作者) 作者列表:Mohammad Hassan Vali¹,Tom Bäckström²,Arno Solin¹ ¹ ELLIS Institute Finland & Department of Computer Science, Aalto University, Finland ² Department of Information and Communications Engineering, Aalto University, Finland 💡 毒舌点评 本文的亮点在于巧妙地将重参数化技巧应用于VQ,使DiVeQ在保留“硬分配”前向传播的同时实现了可微分,并通过SF-DiVeQ解决了码本坍缩和未充分利用的痛点,设计思路优雅且实验验证扎实。短板在于其“通用性改进”的定位虽强,但计算复杂度(如SF-DiVeQ需要对每条线段计算误差)相比原始VQ有所增加,且论文未深入分析在超大规模模型或极端离线场景下的效率影响。 ...