DiVeQ: Differentiable Vector Quantization Using the Reparameterization Trick
📄 DiVeQ: Differentiable Vector Quantization Using the Reparameterization Trick #向量量化 #生成模型 #图像生成 #语音编码 #图像压缩 🔥 8.0/10 | 前25% | #生成模型 | #向量量化 | #图像生成 #语音编码 学术质量 6.5/7 | 选题价值 1.0/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Mohammad Hassan Vali(ELLIS Institute Finland & Department of Computer Science, Aalto University, Finland) 通讯作者:未明确说明(论文提供了三位作者的共同邮箱,未指定单独通讯作者) 作者列表:Mohammad Hassan Vali(ELLIS Institute Finland & Department of Computer Science, Aalto University, Finland)、Tom Bäckström(Department of Information and Communications Engineering, Aalto University, Finland)、Arno Solin(ELLIS Institute Finland & Department of Computer Science, Aalto University, Finland) 💡 毒舌点评 这篇论文精准地“修理”了向量量化在深度学习应用中那个著名的老毛病——梯度消失,提出的DiVeQ和SF-DiVeQ方法就像是给量化层装了一个“梯度导管”,既保持了推理时硬编码的离散性,又让训练信号能顺畅回流,实验部分更是“地毯式轰炸”,在多个任务和数据集上全面碾压了包括NSVQ、RT在内的现有花式方案。不足之处在于SF-DiVeQ的初始化有点“娇气”,需要先跑几个epoch“热身”,而且虽然解决了码本错位问题,但本质上仍是在“码本空间”内做文章,对于如何突破固定码本大小的表达能力瓶颈并未触及。 ...