ICLR 2026 - 基准测试 #数据集 论文列表

ICLR 2026 - 基准测试 #数据集 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 Omni-Reward: Towards Generalist Omni-Modal Reward Modeling w 8.0分 前25% 📋 论文详情 🥇 Omni-Reward: Towards Generalist Omni-Modal Reward Modeling with Free-Form Preferences 🔥 8.0/10 | 前25% | #基准测试 #数据集 | #强化学习 #多任务学习 | #多模态模型 #基准测试 👥 作者与机构 第一作者:Zhuoran Jin(中国科学院大学人工智能学院,中国科学院自动化研究所,国家认知与决策智能重点实验室) 通讯作者:Jun Zhao(中国科学院大学人工智能学院,中国科学院自动化研究所,国家认知与决策智能重点实验室) 作者列表:Zhuoran Jin(中国科学院大学人工智能学院,中国科学院自动化研究所), Hongbang Yuan(中国科学院大学人工智能学院,中国科学院自动化研究所), Kejian Zhu(中国科学院大学人工智能学院,中国科学院自动化研究所), Jiachun Li(中国科学院大学人工智能学院,中国科学院自动化研究所), Pengfei Cao(中国科学院大学人工智能学院,中国科学院自动化研究所), Yubo Chen(中国科学院大学人工智能学院,中国科学院自动化研究所), Kang Liu(中国科学院大学人工智能学院,中国科学院自动化研究所), Jun Zhao(中国科学院大学人工智能学院,中国科学院自动化研究所) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-20 · 1 min · 136 words

ICLR 2026 - 基准测试 论文列表

ICLR 2026 - 基准测试 共 9 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 OmniVideoBench: Towards Audio-Visual Understanding Evaluatio 8.5分 前25% 🥈 MCIF: Multimodal Crosslingual Instruction-Following Benchmar 8.5分 前25% 🥉 WearVox: An Egocentric Multichannel Voice Assistant Benchmar 8.0分 前25% 4. AudioTrust: Benchmarking The Multifaceted Trustworthiness of 7.5分 前25% 5. XModBench: Benchmarking Cross-Modal Capabilities and Consist 7.5分 前25% 6. MMSU: A Massive Multi-task Spoken Language Understanding and 7.5分 前50% 7. VideoMathQA: Benchmarking Mathematical Reasoning via Multimo 7.0分 前25% 8. EchoMind: An Interrelated Multi-level Benchmark for Evaluati 7.0分 前25% 9. STAR-Bench: Probing Deep Spatio-Temporal Reasoning as Audio 6.5分 前25% 📋 论文详情 🥇 OmniVideoBench: Towards Audio-Visual Understanding Evaluation for Omni MLLMs 🔥 8.5/10 | 前25% | #基准测试 | #多模态模型 | #跨模态 #模型评估 ...

2026-05-04 · 更新于 2026-05-20 · 6 min · 1203 words

ICLR 2026 - 声源定位 论文列表

ICLR 2026 - 声源定位 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 Physics-Informed Audio-Geometry-Grid Representation Learning 8.0分 前25% 📋 论文详情 🥇 Physics-Informed Audio-Geometry-Grid Representation Learning for Universal Sound Source Localization 🔥 8.0/10 | 前25% | #声源定位 | #物理信息 | #麦克风阵列 #空间音频 👥 作者与机构 第一作者:Min-Sang Baek(Hanyang University, Department of Electronic Engineering) 通讯作者:Joon-Hyuk Chang(Hanyang University, Department of Electronic Engineering) 作者列表:Min-Sang Baek(Hanyang University, Department of Electronic Engineering)、Gyeong-Su Kim(Hanyang University, Department of Electronic Engineering)、Donghyun Kim(Hanyang University, Department of Electronic Engineering)、Joon-Hyuk Chang(Hanyang University, Department of Electronic Engineering) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-20 · 1 min · 113 words

ICLR 2026 - 多模态推理 论文列表

ICLR 2026 - 多模态推理 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 Compose and Fuse: Revisiting the Foundational Bottlenecks in 7.5分 前25% 📋 论文详情 🥇 Compose and Fuse: Revisiting the Foundational Bottlenecks in Multimodal Reasoning ✅ 7.5/10 | 前25% | #多模态推理 | #基准测试 | #大语言模型 #跨模态 👥 作者与机构 第一作者:Yucheng Wang, Yifan Hou(苏黎世联邦理工学院计算机系,标注为同等贡献) 通讯作者:Mrinmaya Sachan(苏黎世联邦理工学院计算机系) 作者列表:Yucheng Wang(苏黎世联邦理工学院计算机系)、Yifan Hou(苏黎世联邦理工学院计算机系)、Aydin Javadov(苏黎世联邦理工学院计算机系)、Mubashara Akhtar(苏黎世联邦理工学院计算机系)、Mrinmaya Sachan(苏黎世联邦理工学院计算机系) 💡 毒舌点评 亮点:论文构建了一套精妙的逻辑推理框架,将模态交互分解为六种可控模式,这种“解剖学”式的系统评估在当前多模态评估中少见且有价值。短板:依赖高度简化的合成逻辑数据来揭示“根本瓶颈”,其结论能否无缝迁移到复杂、开放的真实世界多模态推理场景中,存疑。 🔗 开源详情 ...

2026-05-04 · 更新于 2026-05-20 · 1 min · 102 words

ICLR 2026 - 多模态模型 论文列表

ICLR 2026 - 多模态模型 共 5 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 Human Behavior Atlas: Benchmarking Unified Psychological And 8.5分 前25% 🥈 NExT-OMNI: Towards Any-to-Any Omnimodal Foundation Models wi 8.0分 前25% 🥉 OmniVinci: Enhancing Architecture and Data for Omni-Modal Un 7.5分 前25% 4. Seeing, Listening, Remembering, and Reasoning: A Multimodal 7.5分 前25% 5. TINY BUT MIGHTY: A SOFTWARE-HARDWARE CO- DESIGN APPROACH FOR 7.0分 前25% 📋 论文详情 🥇 Human Behavior Atlas: Benchmarking Unified Psychological And Social Behavior Understanding 🔥 8.5/10 | 前25% | #多模态模型 | #预训练 | #音频分类 #音视频 ...

2026-05-04 · 更新于 2026-05-20 · 4 min · 671 words

ICLR 2026 - 序列解耦 论文列表

ICLR 2026 - 序列解耦 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 DiffSDA: Unsupervised Diffusion Sequential Disentanglement A 8.0分 前25% 📋 论文详情 🥇 DiffSDA: Unsupervised Diffusion Sequential Disentanglement Across Modalities 🔥 8.0/10 | 前25% | #序列解耦 | #扩散模型 | #自监督学习 #多模态模型 👥 作者与机构 第一作者:Hedi Zisling (Ben-Gurion University) 通讯作者:Omri Azencot (Ben-Gurion University) 作者列表:Hedi Zisling (Ben-Gurion University)、Ilan Naiman (Ben-Gurion University)、Nimrod Berman (Ben-Gurion University)、Supasorn Suwajanakorn (VISTEC)、Omri Azencot (Ben-Gurion University) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-20 · 1 min · 193 words

ICLR 2026 - 数据集 论文列表

ICLR 2026 - 数据集 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 SpeakerVid-5M: A Large-Scale High-Quality Dataset for Audio- 8.5分 前25% 📋 论文详情 🥇 SpeakerVid-5M: A Large-Scale High-Quality Dataset for Audio-Visual Dyadic Interactive Human Generation 🔥 8.5/10 | 前25% | #数据集 | #自回归模型 | #音视频 #音频生成 👥 作者与机构 第一作者:Youliang Zhang(清华大学、StepFun) 通讯作者:Xiu Li(清华大学深圳国际研究生院) 作者列表: Youliang Zhang(清华大学、StepFun) Zhaoyang Li(StepFun) Duomin Wang(StepFun,共同第一作者/责任作者†) Jiahe Zhang(未说明具体机构) Deyu Zhou(香港科技大学(广州)、StepFun) Zixin Yin(香港科技大学、StepFun) Xili Dai(StepFun) Gang Yu(StepFun) Xiu Li(清华大学深圳国际研究生院‡) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-20 · 1 min · 144 words

ICLR 2026 - 机器人操作 论文列表

ICLR 2026 - 机器人操作 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 RoboOmni: Proactive Robot Manipulation in Omni-modal Context 7.5分 前25% 📋 论文详情 🥇 RoboOmni: Proactive Robot Manipulation in Omni-modal Context ✅ 7.5/10 | 前25% | #机器人操作 | #端到端 | #多模态模型 #数据集 👥 作者与机构 第一作者:Siyin Wang(复旦大学、上海创新研究院) 通讯作者:Jinlan Fu(未说明具体机构,对应邮箱jinlanjonna@gmail.com),Xipeng Qiu(复旦大学、上海创新研究院) 作者列表: Siyin Wang(复旦大学、上海创新研究院) Jinlan Fu(国家大学新加坡) Feihong Liu(复旦大学) Xinzhe He(复旦大学) Huangxuan Wu(复旦大学) Junhao Shi(复旦大学、上海创新研究院) Kexin Huang(复旦大学) Zhaoye Fei(复旦大学) Jingjing Gong(上海创新研究院) Zuxuan Wu(复旦大学、上海创新研究院) Yu-Gang Jiang(复旦大学) See-Kiong Ng(国家大学新加坡) Tat-Seng Chua(国家大学新加坡) Xipeng Qiu(复旦大学、上海创新研究院) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-20 · 1 min · 122 words

ICLR 2026 - 模型可解释性 论文列表

ICLR 2026 - 模型可解释性 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 The Deleuzian Representation Hypothesis 8.5分 前25% 📋 论文详情 🥇 The Deleuzian Representation Hypothesis 🔥 8.5/10 | 前25% | #模型可解释性 | #概念提取 | #对比学习 #自监督学习 👥 作者与机构 第一作者:Clément Cornet (Université Paris-Saclay, CEA, List) 通讯作者:Clément Cornet (论文未明确标注通讯作者,根据单位信息推断) 作者列表:Clément Cornet (Université Paris-Saclay, CEA, List)、Romaric Besançon (Université Paris-Saclay, CEA, List)、Hervé Le Borgne (Université Paris-Saclay, CEA, List) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-20 · 1 min · 149 words

ICLR 2026 - 模型比较 论文列表

ICLR 2026 - 模型比较 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 OptMerge: Unifying Multimodal LLM Capabilities and Modalitie 7.0分 前25% 📋 论文详情 🥇 OptMerge: Unifying Multimodal LLM Capabilities and Modalities via Model Merging ✅ 7.0/10 | 前25% | #模型比较 | #迁移学习 | #多模态模型 #模型评估 👥 作者与机构 第一作者:Yongxian Wei (清华大学) 通讯作者:Chun Yuan (清华大学) 作者列表:Yongxian Wei (清华大学), Runxi Cheng (清华大学), Weike Jin (华为诺亚方舟实验室), Enneng Yang (中山大学), Li Shen (中山大学), Lu Hou (华为诺亚方舟实验室), Sinan Du (清华大学), Chun Yuan (清华大学), Xiaochun Cao (中山大学), Dacheng Tao (南洋理工大学) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-20 · 1 min · 121 words