音频分类 #零样本学习

ICASSP 2026 - 音频分类 #零样本学习共 1 篇论文 ← 返回 ICASSP 2026 总览排名论文评分分档 🥇 Semantic-Guided Pseudo-Feature Attention Network for Audio-V 7.0分前25% 📋 论文详情 🥇 Semantic-Guided Pseudo-Feature Attention Network for Audio-Visual Zero-Shot Learning ✅ 7.0/10 | 前25% | #音频分类 #零样本学习 | #多模态模型 #对比学习 | #音频分类 #零样本学习 👥 作者与机构第一作者：Siteng Ma（苏州大学）通讯作者：Wenrui Li（哈尔滨工业大学）作者列表：Siteng Ma（苏州大学）、Wenrui Li（哈尔滨工业大学）、Haocheng Tang（北京大学）、Yeyu Chai（哈尔滨工业大学）、Jisheng Chu（哈尔滨工业大学）、Xingtao Wang（哈尔滨工业大学） 💡 毒舌点评本文的亮点在于将自适应模态加权、语义引导的变分生成与语义对齐的对比学习巧妙融合，形成了一个逻辑自洽的统一框架来解决GZSL中的核心矛盾，并在两个基准数据集上取得了SOTA。然而，其短板在于对SVG模块中具体网络结构的描述较为简略，且未提供任何开源代码或详细的超参数搜索过程，使得完全复现该工作的细节变得困难。 🔗 开源详情代码：论文中未提及代码链接。模型权重：未提及。数据集：使用了ActivityNet, VGGSound, UCF等公开基准数据集，但论文中未提供具体获取方式。 Demo：未提及。复现材料：论文中提及了部分超参数（损失函数权重λ1-λ5），但缺乏训练细节（如学习率、batch size、优化器、训练轮数）、模型具体配置（如编码器/解码器结构、隐藏维度）以及预训练骨干网络信息。论文中引用的开源项目：论文引用了多个相关工作，但未明确说明其SGPAN实现依赖了哪些具体的开源代码库或工具。总结：论文中未提及开源计划。 📌 核心摘要 ...