Can Large Language Models Imitate Human Speech for Clinical Assessment? LLM-Driven Data Augmentation for Cognitive Score Prediction
📄 Can Large Language Models Imitate Human Speech for Clinical Assessment? LLM-Driven Data Augmentation for Cognitive Score Prediction #语音生物标志物 #数据增强 #大语言模型 #医疗音频 #低资源 ✅ 6/10 | 前50% | #语音生物标志物 | #数据增强 | #大语言模型 #医疗音频 | arxiv 学术质量 5.4/8 | 影响力 0.6/1 | 可复现性 0/1 | 置信度 中 👥 作者与机构 第一作者:Si-Belkacem Yamine Ketir (Télécom SudParis, France) 通讯作者:未说明 作者列表:Si-Belkacem Yamine Ketir (Télécom SudParis, France)、Lenard Paulo Tamayo (Nara Institute of Science and Technology, Japan)、Shohei Hisada (Nara Institute of Science and Technology, Japan)、Shaowen Peng (Nara Institute of Science and Technology, Japan)、Shoko Wakamiya (Nara Institute of Science and Technology, Japan)、Eiji Aramaki (Nara Institute of Science and Technology, Japan) 💡 毒舌点评 本文提出了一个逻辑清晰、临床动机明确的数据增强框架,其核心亮点在于“书面锚定+风格转换”的受控生成范式,并创新性地引入相似性引导策略以提升合成数据的语义保真度。然而,其说服力严重受限于实验规模:在一个仅30人、分布极不平衡且未公开的特定语料库上得出结论,且基线选择过于薄弱(仅对比无增强和高斯噪声),未与领域内更相关的文本增强方法(如EDA、回译)或更强大的预测模型进行对比,使得方法优越性的声称显得证据不足。此外,论文依赖于闭源的GPT-5模型,严重损害了工作的可复现性与普适性。 ...