ICASSP 2026 - 视频片段检索 论文列表
ICASSP 2026 - 视频片段检索 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Audio-Visual Feature Fusion for Calibrating Relevance Scores 7.0分 前25% 📋 论文详情 🥇 Audio-Visual Feature Fusion for Calibrating Relevance Scores of Video Moment Retrieval ✅ 7.0/10 | 前25% | #视频片段检索 | #晚期融合 | #重评分 #音视频 👥 作者与机构 第一作者:Takehiro Imamura(名古屋大学,LY Corporation) 通讯作者:未说明(论文中未明确标注通讯作者) 作者列表:Takehiro Imamura(名古屋大学, LY Corporation)、Tatsuya Komatsu(LY Corporation)、Hokuto Munakata(LY Corporation)、Tomoki Toda(名古屋大学) 💡 毒舌点评 这篇论文的亮点在于它精准地识别并试图解决DETR类模型在VMR中“定位准但排序乱”的痛点,提出的LARS模块设计清晰且与主流的早期融合形成完美互补。然而,其短板也相当明显:作为一项融合工作,创新性略显平淡(本质是一个轻量级的重评分网络),且未能与近年来可能更强的SOTA基线(如基于大型视频-语言模型的方法)进行对比,削弱了结论的冲击力。 🔗 开源详情 ...