APEX: Audio Prototype EXplanations for Classification Tasks
📄 APEX: Audio Prototype EXplanations for Classification Tasks #音频分类 #原型学习 #可解释性AI #后验解释 #特征解耦 ✅ 6.2/10 | 前25% | #音频分类 | #原型学习 | #可解释性AI #后验解释 | arxiv 学术质量 6.2/8 | 影响力 0.8/2 | 可复现性 0.5/1 | 置信度 高 👥 作者与机构 第一作者:Piotr Kawa (Wroclaw University of Science and Technology, Department of Artificial Intelligence) 通讯作者:未明确说明,但论文提供了 piotr.kawa@pwr.edu.pl 作为联系邮箱 作者列表:Piotr Kawa^1, Kornel Howil^4,5, Piotr Borycki^2, Miłosz Adamczyk^3, Przemysław Spurek^1, Piotr Syga^4 机构:1 Department of Artificial Intelligence, Wroclaw University of Science and Technology, Poland; 2 Resemble AI, USA; 3 IDEAS Research Institute, Poland; 4 Faculty of Mathematics and Computer Science, Jagiellonian University, Poland; 5 Doctoral School of Exact and Natural Sciences, Jagiellonian University, Poland 💡 毒舌点评 本文直击音频可解释性领域的一个核心痛点:如何在不损害现成高性能“黑箱”模型的前提下,为其赋予符合声学直觉的解释。APEX通过插入可逆线性变换解耦特征空间并严格保持输出不变的设计,思路清晰且数学上严谨,为这一目标提供了一个颇具吸引力的解决方案。其针对音频时频特性提出的四种原型提取方案也体现了领域洞察。然而,框架对骨干网络需含全局池化层和线性分类头的硬性要求,严重限制了其普适性,更像是一个专用工具。此外,所谓“通道纯度”优化是否真正得到了人类可理解的“声学概念”,缺乏直接的人工评估或语义对齐验证,这使得其“解释”的有效性打了一定折扣。 ...