Entropy-Monitored Kernelized Token Distillation for Audio-Visual Compression
📄 Entropy-Monitored Kernelized Token Distillation for Audio-Visual Compression #音视频事件检测 #知识蒸馏 #多模态模型 #音频分类 #模型压缩 🔥 8.5/10 | 前25% | #音视频事件检测 | #知识蒸馏 | #多模态模型 #音频分类 学术质量 6.2/7 | 选题价值 1.6/2 | 复现加成 0.5 | 置信度 中 👥 作者与机构 第一作者:Hyoungseob Park (Yale University, Amazon AGI 实习期间完成) 通讯作者:未明确说明(论文未标注通讯作者信息) 作者列表: Hyoungseob Park (Yale University) Lipeng Ke (Amazon AGI) Pritish Mohapatra (Amazon AGI) Huajun Ying (Amazon AGI) Sankar Venkataraman (Amazon AGI) Alex Wong (Yale University) 💡 毒舌点评 亮点:将蒸馏对象从“特征本身”或“输出概率”巧妙地转换为“特征间的成对关系矩阵”(核化令牌),从而绕开了师生模型维度必须匹配的硬约束,这个思路非常实用且有效。短板:尽管实验全面,但核心方法(计算Gram矩阵 + 熵加权)更像是经典技术(核方法、信息熵)在现代Transformer蒸馏场景下的工程化应用组合,理论创新深度有限,更像是一个优秀、扎实的“系统解决方案”。 ...