MOMO: A framework for seamless physical, verbal, and graphical robot skill learning and adaptation
📄 MOMO: A framework for seamless physical, verbal, and graphical robot skill learning and adaptation #机器人技能学习 #多模态模型 #大语言模型 #工业应用 ✅ 7.5/10 | 前25% | #机器人技能学习 | #多模态模型 | #大语言模型 #工业应用 | arxiv 学术质量 5.5/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度 中 👥 作者与机构 第一作者:Markus Knauer(德国航空航天中心,机器人与机电一体化研究所;慕尼黑工业大学,计算、信息与技术学院) 通讯作者:未说明 作者列表:Markus Knauer(DLR, RMC; TUM, CIT)、Edoardo Fiorini(DLR, RMC)、Maximilian Mühlbauer(DLR, RMC; TUM, CIT)、Stefan Schneyer(DLR, RMC; TUM, CIT)、Promwat Angsuratanawech(DLR, RMC; TUM, CIT)、Florian Samuel Lay(DLR, RMC)、Timo Bachmann(DLR, RMC)、Samuel Bustamante(DLR, RMC; TUM, CIT)、Korbinian Nottensteiner(DLR, RMC)、Freek Stulp(DLR, RMC)、Alin Albu-Schäffer(DLR, RMC; TUM, CIT)、João Silvério(DLR, RMC)、Thomas Eiband(DLR, RMC) 💡 毒舌点评 亮点:框架设计上实现了“无缝”多模态切换,将物理、语音、图形界面三种交互方式通过“路径点插入”这一统一机制连接,是一个考虑周全的系统工程。短板:论文自称是“框架”,但实验部分更像是一个功能演示,缺乏在标准基准上与基线方法的定量对比,其“有效性”主要依赖于贸易展观众的定性观察,科学严谨性有待加强。 ...