Fine-Tuning Large Audio-Language Models with Lora for Precise Temporal Localization of Prolonged Exposure Therapy Elements
📄 Fine-Tuning Large Audio-Language Models with Lora for Precise Temporal Localization of Prolonged Exposure Therapy Elements #音频事件检测 #多模态模型 #语音生物标志物 #迁移学习 ✅ 6.5/10 | 前50% | #音频事件检测 | #多模态模型 | #语音生物标志物 #迁移学习 学术质量 5.5/7 | 选题价值 1.0/2 | 复现加成 0 | 置信度 高 👥 作者与机构 第一作者:Suhas BN (College of Information Sciences & Technology, The Pennsylvania State University, USA) 通讯作者:论文中未明确标注通讯作者信息。 作者列表: Suhas BN (College of Information Sciences & Technology, The Pennsylvania State University, USA) Andrew M. Sherrill (Department of Psychiatry & Behavioral Sciences, Emory University, USA) Jyoti Alaparthi (Department of Psychiatry & Behavioral Sciences, Emory University, USA) Dominik Mattioli (School of Interactive Computing, Georgia Institute of Technology, USA) Rosa I. Arriaga (School of Interactive Computing, Georgia Institute of Technology, USA) Chris W. Wiese (School of Psychology, Georgia Institute of Technology, USA) Saeed Abdullah (College of Information Sciences & Technology, The Pennsylvania State University, USA) 💡 毒舌点评 亮点:论文精准地切入了一个真实且重要的临床痛点(PE疗法评估),并设计了一套从标注(LLM+人工验证)到建模(多模态微调)再到部署(隐私保护)的完整流水线,展现了扎实的领域应用思维。 短板:实验的说服力很大程度上受限于其“自产自销”——用自己定义的任务、自己标注(尽管经过验证)的数据、自己提出的数据划分来评估自己的方法,缺乏与领域内或更通用任务上现有SOTA方法的横向比较,使得“最佳MAE 5.3秒”的优越性难以完全确立。 ...