Explainable AI in Speaker Recognition -- Making Latent Representations Understandable

📄 Explainable AI in Speaker Recognition – Making Latent Representations Understandable #说话人识别 #层次聚类 #可解释AI #模型评估 ✅ 7.5/10 | 前25% | #说话人识别 | #层次聚类 | #可解释AI #模型评估 | arxiv 学术质量 6.0/7 | 选题价值 1.5/2 | 复现加成 0.0 | 置信度 高 👥 作者与机构 第一作者:Yanze Xu (University of Surrey, Centre for Vision, Speech and Signal Processing) 通讯作者:Yanze Xu (yanze.xu@outlook.com) 作者列表:Yanze Xu (University of Surrey, Centre for Vision, Speech and Signal Processing), Wenwu Wang (University of Surrey, Centre for Vision, Speech and Signal Processing), Mark D. Plumbley (King’s College London, Department of Informatics) 💡 毒舌点评 亮点: 论文提出了一个从“分析层次聚类”到“语义解释层次结构”再到“诊断匹配性能”的完整XAI流水线,特别是L-score指标能直接指出是精度(簇内混杂)还是召回(类别遗漏)限制了匹配,诊断性强于F-score。 短板: 实验的“自我循环”论证较明显:用VoxCeleb1数据训练的模型,再用VoxCeleb1数据的标注(身份、国籍、性别)去评估其表示空间的层次聚类,结论的客观性和泛化能力存疑,且缺乏与传统注意力可视化等XAI方法的对比。 ...

2026-04-28