RAS: a Reliability Oriented Metric for Automatic Speech Recognition
📄 RAS: a Reliability Oriented Metric for Automatic Speech Recognition #语音识别 #强化学习 #鲁棒性 #模型评估 #数据集 ✅ 7.5/10 | 前25% | #语音识别 | #强化学习 | #鲁棒性 #模型评估 | arxiv 学术质量 5.5/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Wenbin Huang(上海交通大学,X-LANCE Lab) 通讯作者:未明确说明(论文首页提供的邮箱为hartmann_psi, qiuyuhang, kai.yu@sjtu.edu.cn,可推测Kai Yu为资深作者或通讯作者之一) 作者列表:Wenbin Huang(上海交通大学,X-LANCE Lab)、Yuhang Qiu(上海交通大学,X-LANCE Lab)、Bohan Li(未说明)、Yiwei Guo(未说明)、Jing Peng(未说明)、Hankun Wang(未说明)、Xie Chen(未说明)、Kai Yu(上海交通大学,X-LANCE Lab)。所有作者均隶属于“X-LANCE Lab, School of Computer Science, Shanghai Jiao Tong University, China”以及“MoE Key Lab of Artificial Intelligence; Jiangsu Key Lab of Language Computing, China”。 💡 毒舌点评 亮点:本文敏锐地抓住了ASR“自信但错误”输出在实际应用中的危害,并系统性地提出从评估指标(RAS)到训练范式(PH-Supv+RL)的完整解决方案,技术贡献扎实且思路清晰。短板:所采用的基线模型(Whisper-Tiny)和对比方法相对传统(如基于logit的启发式方法),缺乏与当前基于大语言模型的ASR或更前沿的主动学习、不确定性估计方法的直接对比,消融研究也仅验证了RL阶段,对PH-Supv阶段不同策略的探讨不足。 ...