GaMi: Geometry-Agnostic Material Identification via Cross-Modal Subtractive Disentanglement
📄 GaMi: Geometry-Agnostic Material Identification via Cross-Modal Subtractive Disentanglement ✅ 7.8/10 | 前50% | arxiv 学术质量 6.1/7 | 影响力 1.2/2 | 可复现性 0.5/2 | 置信度 高 👥 作者与机构 一作/通讯作者: Zhiwei Chen, 电子科技大学 (UESTC), Chengdu, China. 合作者: Yijie Li (新加坡国立大学), Yimo Zhang (UESTC), Shiyun Shao (UESTC), Yichao Chen (上海交通大学), Dian Ding (上海交通大学), Liang Wang (西北工业大学), Haiwei Wu (UESTC), Liwei Guo (UESTC), Jie Yang (UESTC), Xiaosong Zhang (UESTC), Yongzhao Zhang (UESTC). 💡 毒舌点评 这工作想法挺巧,用“减法”在毫米波和声音信号里把“几何”这个共同干扰项减掉,留下“材料”信号。实验也做了,设备也用现成的,看起来像能落地的东西。但仔细一看,问题不少。首先,方法细节抠得不够,比如那个“注意力缩放”模块到底怎么实现的,没说清楚,只提了句用跨模态注意力。其次,实验设计上,虽然搞了“未见几何”测试,但所有测试材料的形状类别在训练时是不是完全没出现过?论文里只说“基于方形训练”,但测试时用了圆形、三角等,这属于“类别内未见”还是“跨类别”?得讲明白。最后,也是最关键的,作为一篇面向机器人应用的工作,其实验场景太“实验室”了,全是静态、单一目标、受控环境,作者自己也承认了多目标和快速运动的局限,但评估中对这些现实挑战的影响量化不足。总的来说,想法有价值,但工程实现和实验深度都还差口气,离顶会顶级工作有点距离。 ...