LOTUSDIS: A Thai Far-Field Meeting Corpus for Robust Conversational ASR
📄 LOTUSDIS: A Thai Far-Field Meeting Corpus for Robust Conversational ASR #语音识别 #数据集 #远场语音 #迁移学习 #低资源 ✅ 7.5/10 | 前25% | #语音识别 | #数据集 | #远场语音 #迁移学习 学术质量 5.5/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:未说明(论文作者列表未按顺序标注第一作者) 通讯作者:未说明(论文未明确标注通讯作者) 作者列表:Pattara Tipaksorn (NECTEC Speech and Text Understanding Research Team), Sumonmas Thatphithakkul (NECTEC Speech and Text Understanding Research Team), Vataya Chunwijitra (NECTEC Speech and Text Understanding Research Team), Kwanchiva Thangthai (NECTEC Speech and Text Understanding Research Team) 💡 毒舌点评 亮点:数据集设计非常“接地气”——在真实的、有冰箱和空调噪音的办公室里,用从领夹麦到10米远蓝牙音箱的多种普通设备录音,完美模拟了真实会议中“设备杂、距离远、有混响”的痛点,比用专业阵列录音更有工程实践价值。短板:论文的学术贡献主要停留在“造轮子立规矩”阶段,虽然验证了Whisper微调的有效性,但缺乏对ASR模型本身更深入的技术探索(例如如何更好地处理重叠或超远场语音),更像是一个详实的“产品说明书”和“测试报告”。 ...