Which Speech Representation Better Matches Text-Native Reasoning? A Study of Speech-Text Alignment on Frame Rate and Representation
📄 Which Speech Representation Better Matches Text-Native Reasoning? A Study of Speech-Text Alignment on Frame Rate and Representation #语音识别 #语音合成 7.5/10 | 创新 7/2 | 严谨 8/1.5 | 实验 7/1.5 | 清晰 8/1 | 影响 7/1.5 | 开源 0/1.5 | 复现 3/0.5 | 工程 7/1.5 ✅ 7.5/10 | 前50% | #语音识别 | #语音合成 | arxiv 👥 作者与机构 Ye, Tan, Li, Zhang, Chan, Liu, Liu, Lin, Dai, Zhang, Sun, Kong, Xue(香港科技大学,腾讯,萨里大学,香港中文大学,香港浸会大学,香港理工大学,独立研究者);Zhen, Xu, Yiming, Guangyan, Chimin, Haohe, Zhengxi, Hongzhan, Zheqi, Xinshen, Peiwen, Qiuqiang, Wei(香港科技大学,腾讯,萨里大学,香港中文大学,香港浸会大学,香港理工大学,独立研究者)。 ...