AUHead: Realistic Emotional Talking Head Generation via Action Units Control
📄 AUHead: Realistic Emotional Talking Head Generation via Action Units Control #面部动画生成 #扩散模型 #音频大模型 #跨模态 #情感理解 🔥 8.0/10 | 前25% | #面部动画生成 | #扩散模型 | #音频大模型 #跨模态 学术质量 6.0/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Jiayi Lyu (中国科学院大学) 通讯作者:Jian Xue (中国科学院大学) 作者列表:Jiayi Lyu (中国科学院大学), Leigang Qu (新加坡国立大学), Wenjing Zhang (中国科学院大学), Hanyu Jiang (中国科学院大学), Kai Liu (浙江大学), Zhenglin Zhou (浙江大学), Xiaobo Xia (新加坡国立大学), Jian Xue (中国科学院大学), Tat-Seng Chua (新加坡国立大学) 💡 毒舌点评 亮点: 论文最大的亮点在于引入了可解释的面部动作单元(AU)作为中间桥梁,将语音情感理解(通过ALM)和精细面部动画生成(通过扩散模型)优雅地解耦,为解决情感说话头生成中的“可控性与质量”困境提供了一个新颖且通用的框架。 短板: 尽管框架新颖,但作为核心控制信号的AU序列,其预测精度(在MEAD数据集上MAE为0.2085)可能成为整个系统性能的瓶颈;此外,论文中Stage 2的生成模块(Hallo V1, MEMO)并非作者原创,其创新更多体现在控制策略的整合而非生成架构的突破上。 ...