BadRobot: Jailbreaking Embodied LLM Agents in the Physical World
📄 BadRobot: Jailbreaking Embodied LLM Agents in the Physical World #大语言模型 #多模态模型 5.2/10 | 创新 1.3/2 | 严谨 0.8/1.5 | 实验 0.5/1.5 | 清晰 1/1 | 影响 0.4/1.5 | 开源 0.1/1.5 | 复现 0.3/0.5 | 工程 0.8/1.5 📝 5.2/10 | 后50% | #语音合成 | #大语言模型 | #多模态模型 | arxiv 👥 作者与机构 第一作者及通讯作者:Hangtao Zhang, 华中科技大学。 合作者:Chenyu Zhu, Xianlong Wang, Ziqi Zhou, Shengshan Hu (共同通讯作者), 均来自华中科技大学; Leo Yu Zhang 来自格里菲斯大学。 💡 毒舌点评 这篇论文像是给机器人安全社区的一次“开箱测评”,只不过开的是“潘多拉魔盒”。作者成功证明了“用大语言模型当大脑的机器人,很容易被忽悠去干坏事”,这确实是个值得警惕的问题。但这份分析报告和论文本身一样,更像是一份“风险预告”而非严谨的“安全审计报告”。分析报告对论文核心贡献的梳理基本到位,但犯了两个典型毛病:一是对论文自身声称的“发布基准测试集”过于乐观,原文只是说提供文档,实际资源可得性存疑;二是对论文的软肋——实验深度不足、缺乏量化评估——挖掘得还不够狠。整篇论文(和分析)都在强调“我们发现了问题”,但对于“问题有多严重”、“现有防御有多大差距”这些顶会审稿人最关心的问题,却语焉不详。给6.5分,是认可其提出议题的重要性,但对其技术深度和实验证据强度深表怀疑。 ...