Responsible Benchmarking of Fairness for Automatic Speech Recognition

📄 Responsible Benchmarking of Fairness for Automatic Speech Recognition #语音识别 #基准测试 #公平性 #模型评估 #方法论 📝 5.0/10 | 前50% | #语音识别 | #基准测试 | #公平性 #模型评估 | arxiv 学术质量 5.0/8 | 影响力 0.6/2 | 可复现性 0.3/1 | 置信度 高 👥 作者与机构 第一作者:Felix Herron (Université Paris Dauphine-PSL, MILES Team, LAMSADE;Université Grenoble Alpes, GETALP Team, LIG) 通讯作者:未说明 作者列表:Felix Herron (Université Paris Dauphine-PSL, Université Grenoble Alpes)、Ange Richard (Université Grenoble Alpes, PACTE)、François Portet (Université Grenoble Alpes)、Alexandre Allauzen (Université Paris Dauphine-PSL)、Solange Rossato (Université Grenoble Alpes, PACTE)。注:原文脚注指出 Ange Richard, François Portet, Solange Rossato 对框架中“说话人组的交叉性”和“多变量说话人组”的形成有贡献。 💡 毒舌点评 本文旨在为ASR公平性评估提供一套“负责任”的方法论最佳实践。其核心价值在于系统性地整合了机器学习公平性、社会科学和语音科学领域的建议,并针对ASR场景(如说话人而非话语作为统计单元)进行了适配。案例研究部分通过对比分析(如忽略与控制交叉变量),直观地展示了方法论选择如何颠覆结论,具有警示意义。然而,作为一篇方法论文章,其主要贡献停留在“指出问题”和“提出建议”,缺乏一个经过严格验证、可直接复现的工具包或评估协议。此外,其提出的最佳实践框架本身的有效性,仅通过一个数据集(Fair-speech)的案例进行展示,普适性存疑。 ...

2026-05-12 · 更新于 2026-05-19 · 2 min · 293 words