STITCH: Simultaneous Thinking and Talking with Chunked Reasoning for Spoken Language Models
📄 STITCH: Simultaneous Thinking and Talking with Chunked Reasoning for Spoken Language Models #语音对话系统 #流式处理 #自回归模型 #语音大模型 #端到端 🔥 8.5/10 | 前25% | #语音对话系统 | #流式处理 | #自回归模型 #语音大模型 学术质量 6.5/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Cheng-Han Chiang(National Taiwan University, Microsoft GenAI) 通讯作者:Xiaofei Wang(Microsoft) 作者列表:Cheng-Han Chiang(National Taiwan University, Microsoft), Xiaofei Wang(Microsoft), Linjie Li(Microsoft), Chung-Ching Lin(Microsoft), Kevin Lin(Microsoft), Shujie Liu(Microsoft), Zhendong Wang(Microsoft), Zhengyuan Yang(Microsoft), Hung-yi Lee(National Taiwan University), Lijuan Wang(Microsoft) 💡 毒舌点评 亮点在于将人类“边想边说”的模式形式化为一个可计算的交错生成框架,并在几乎不增加首包延迟的前提下显著提升了数学推理任务的准确率,堪称“偷时间”的艺术。短板在于对生成的“思考链”本身的质量和可靠性缺乏更深入的分析,且实验场景集中于英文数学题,对更复杂对话场景的泛化能力有待验证。 ...