Clue2Emo: A Brain-Inspired Framework for Open-Vocabulary Multimodal Emotion Recognition
📄 Clue2Emo: A Brain-Inspired Framework for Open-Vocabulary Multimodal Emotion Recognition #语音情感识别 #多模态模型 #大语言模型 #数据集 🔥 8.5/10 | 前25% | #语音情感识别 | #多模态模型 | #大语言模型 #数据集 学术质量 6.5/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Ziyun Zhang (Ziyun Zhang1,2,†)(北京理工大学医学技术学院,深圳北理莫斯科大学人工智能研究院) 第一作者:Jian Chen (Jian Chen3,†)(香港大学电气与电子工程系) 通讯作者:Chengming Li (Chengming Li2,∗)(深圳北理莫斯科大学人工智能研究院) 通讯作者:Xiping Hu (Xiping Hu1,2,∗)(北京理工大学医学技术学院,深圳北理莫斯科大学人工智能研究院) 作者列表: Ziyun Zhang (北京理工大学医学技术学院,深圳北理莫斯科大学人工智能研究院) Jian Chen (香港大学电气与电子工程系) Yuxuan Hu (香港城市大学数据科学系) Zhen Zhang (深圳北理莫斯科大学人工智能研究院) Xiaoyan Yuan (北京理工大学医学技术学院,深圳北理莫斯科大学人工智能研究院) Min Yang (中国科学院深圳先进技术研究院) Xiangyu Zhao (香港城市大学数据科学系) Edith C. H. Ngai (香港大学电气与电子工程系) Chengming Li (深圳北理莫斯科大学人工智能研究院) Xiping Hu (北京理工大学医学技术学院,深圳北理莫斯科大学人工智能研究院) 💡 毒舌点评 论文提出了一个理论上优雅的“感知线索→推理”两阶段框架,并首次为情感识别构建了“感官线索”数据集MER-CLUE,这为提升黑盒模型的可解释性提供了有希望的路径。然而,其工程实现的细节模糊(如训练硬件、具体超参数未说明)以及代码、模型权重的缺位,让其“可复现性”大打折扣,使得这一精巧的设计目前更像一个高质量的“概念验证”而非开箱即用的解决方案。 ...