HATS: An Open data set Integrating Human Perception Applied to the Evaluation of Automatic Speech Recognition Metrics
📄 HATS: An Open data set Integrating Human Perception Applied to the Evaluation of Automatic Speech Recognition Metrics #语音识别 #模型评估 #数据集 #法语 ✅ 7.0/10 | 前50% | #语音识别 | #模型评估 | #数据集 #法语 | arxiv 学术质量 5.5/7 | 选题价值 1.5/2 | 复现加成 0.0 | 置信度 高 👥 作者与机构 第一作者:Thibault Bañeras Roux(Nantes University, LS2N) 通讯作者:未说明 作者列表:Thibault Bañeras Roux(Nantes University, LS2N)、Jane Wottawa(Le Mans University, LIUM)、Mickael Rouvier(Avignon University, LIA)、Teva Merlin(Avignon University, LIA)、Richard Dufour(Nantes University, LS2N) 💡 毒舌点评 亮点:论文构建了一个稀缺的、专注于人类感知的法语ASR错误转录数据集(HATS),并通过精心设计的“困难选择”实验协议,系统性地评估了多种现有指标(从WER到BERTScore)与人类判断的相关性,为该领域提供了宝贵的基准和洞见。短板:研究结论严重受限于单一语言(法语) 和特定数据集(REPERE),其发现能否泛化到其他语言或错误类型存疑;此外,数据集规模(1000个三元组)对于建立普适性结论可能稍显不足。 ...