SELD-MOHA: A Fine-Tuning Method with the Mixture of Heterogeneous Adapters for Sound Event Localization and Detection

📄 SELD-MOHA: A Fine-Tuning Method with the Mixture of Heterogeneous Adapters for Sound Event Localization and Detection #音频事件检测 #声源定位 #迁移学习 #多通道音频 ✅ 7.0/10 | 前25% | #音频事件检测 | #迁移学习 | #声源定位 #多通道音频 学术质量 6.5/7 | 选题价值 2.0/2 | 复现加成 0.0 | 置信度 高 👥 作者与机构 第一作者:Yun Liang (华南农业大学) 通讯作者:Cankun Zhong (华南农业大学, email: ck.zhong@scau.edu.cn) 作者列表:Yun Liang (华南农业大学), Peng Zhang (华南农业大学), Cankun Zhong (华南农业大学), Yishen Lin (华南农业大学), Luoan Gu (华南农业大学), Yan Chen (华南农业大学, 温氏食品集团股份有限公司) 💡 毒舌点评 亮点:在适配器设计上做得相当扎实,没有满足于用一个万能MLP适配器,而是精心设计了Conv、DCT、SE三种分别针对时频局部结构、去相关、通道注意力的异构适配器,并通过可视化(图1)清晰展示了各自专注的“工作区域”,这种“专家治领域”的思路值得借鉴。 短板:论文最大的遗憾是“关门谢客”——没有开源代码。对于一个强调“参数高效”和“可复现”的微调方法,不提供代码就像厨师不分享菜谱,大大降低了工作对社区的实际推动力。 ...

2026-04-29