原型学习 | 语音/音乐/音频论文速递

📄 APEX: Audio Prototype EXplanations for Classification Tasks #音频分类 #原型学习 #可解释性AI #后验解释 #特征解耦 ✅ 6.2/10 | 前25% | #音频分类 | #原型学习 | #可解释性AI #后验解释 | arxiv 学术质量 6.2/8 | 影响力 0.8/2 | 可复现性 0.5/1 | 置信度高 👥 作者与机构第一作者：Piotr Kawa (Wroclaw University of Science and Technology, Department of Artificial Intelligence) 通讯作者：未明确说明，但论文提供了 piotr.kawa@pwr.edu.pl 作为联系邮箱作者列表：Piotr Kawa^1, Kornel Howil^4,5, Piotr Borycki^2, Miłosz Adamczyk^3, Przemysław Spurek^1, Piotr Syga^4 机构：1 Department of Artificial Intelligence, Wroclaw University of Science and Technology, Poland; 2 Resemble AI, USA; 3 IDEAS Research Institute, Poland; 4 Faculty of Mathematics and Computer Science, Jagiellonian University, Poland; 5 Doctoral School of Exact and Natural Sciences, Jagiellonian University, Poland 💡 毒舌点评本文直击音频可解释性领域的一个核心痛点：如何在不损害现成高性能“黑箱”模型的前提下，为其赋予符合声学直觉的解释。APEX通过插入可逆线性变换解耦特征空间并严格保持输出不变的设计，思路清晰且数学上严谨，为这一目标提供了一个颇具吸引力的解决方案。其针对音频时频特性提出的四种原型提取方案也体现了领域洞察。然而，框架对骨干网络需含全局池化层和线性分类头的硬性要求，严重限制了其普适性，更像是一个专用工具。此外，所谓“通道纯度”优化是否真正得到了人类可理解的“声学概念”，缺乏直接的人工评估或语义对齐验证，这使得其“解释”的有效性打了一定折扣。 ...