Towards Orthographically-Informed Evaluation of Speech Recognition Systems for Indian Languages
📄 Towards Orthographically-Informed Evaluation of Speech Recognition Systems for Indian Languages #语音识别 #基准测试 #大语言模型 #多语言 #低资源 ✅ 7.0/10 | 前25% | #语音识别 | #基准测试 | #大语言模型 #多语言 学术质量 6.0/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Kaushal Santosh Bhogale (印度理工学院马德拉斯分校 AI4Bharat, WSAI) 通讯作者:Mitesh M. Khapra (印度理工学院马德拉斯分校 AI4Bharat, WSAI) 作者列表: Kaushal Santosh Bhogale (印度理工学院马德拉斯分校 AI4Bharat, WSAI) Tahir Javed (印度理工学院马德拉斯分校 AI4Bharat, WSAI) Greeshma Susan John (印度理工学院马德拉斯分校 AI4Bharat, WSAI) Dhruv Rathi (Sarvam AI) Akshayasree Padmanaban (印度理工学院马德拉斯分校 AI4Bharat, WSAI) Niharika Parasa (印度理工学院马德拉斯分校 AI4Bharat, WSAI) Mitesh M. Khapra (印度理工学院马德拉斯分校 AI4Bharat, WSAI) 💡 毒舌点评 亮点:论文直击印度语言ASR评估中“指标失真”这一实际工程痛点,提出了一个系统性的“LLM生成+人工校正”评估框架和OIWER指标,并通过涵盖22种语言的大规模实验验证了其有效性,结果令人信服。短板:其核心方法(用LLM生成变体)属于应用层面的整合创新,且框架的有效性高度依赖LLM对特定语言正字法规则的掌握能力,论文未深入探讨当LLM对某语言知识不足时的失效模式与兜底方案。 ...