Iclr-2026

ICLR 2026 - 基准测试 #数据集论文列表

ICLR 2026 - 基准测试 #数据集共 1 篇论文 ← 返回 ICLR 2026 总览排名论文评分分档 🥇 Omni-Reward: Towards Generalist Omni-Modal Reward Modeling w 8.0分前25% 📋 论文详情 🥇 Omni-Reward: Towards Generalist Omni-Modal Reward Modeling with Free-Form Preferences 🔥 8.0/10 | 前25% | #基准测试 #数据集 | #强化学习 #多任务学习 | #多模态模型 #基准测试 👥 作者与机构第一作者：Zhuoran Jin（中国科学院大学人工智能学院，中国科学院自动化研究所，国家认知与决策智能重点实验室）通讯作者：Jun Zhao（中国科学院大学人工智能学院，中国科学院自动化研究所，国家认知与决策智能重点实验室）作者列表：Zhuoran Jin（中国科学院大学人工智能学院，中国科学院自动化研究所）， Hongbang Yuan（中国科学院大学人工智能学院，中国科学院自动化研究所）， Kejian Zhu（中国科学院大学人工智能学院，中国科学院自动化研究所）， Jiachun Li（中国科学院大学人工智能学院，中国科学院自动化研究所）， Pengfei Cao（中国科学院大学人工智能学院，中国科学院自动化研究所）， Yubo Chen（中国科学院大学人工智能学院，中国科学院自动化研究所）， Kang Liu（中国科学院大学人工智能学院，中国科学院自动化研究所）， Jun Zhao（中国科学院大学人工智能学院，中国科学院自动化研究所） 💡 毒舌点评 ...

ICLR 2026 - 基准测试论文列表

ICLR 2026 - 基准测试共 9 篇论文 ← 返回 ICLR 2026 总览排名论文评分分档 🥇 OmniVideoBench: Towards Audio-Visual Understanding Evaluatio 8.5分前25% 🥈 MCIF: Multimodal Crosslingual Instruction-Following Benchmar 8.5分前25% 🥉 WearVox: An Egocentric Multichannel Voice Assistant Benchmar 8.0分前25% 4. AudioTrust: Benchmarking The Multifaceted Trustworthiness of 7.5分前25% 5. XModBench: Benchmarking Cross-Modal Capabilities and Consist 7.5分前25% 6. MMSU: A Massive Multi-task Spoken Language Understanding and 7.5分前50% 7. VideoMathQA: Benchmarking Mathematical Reasoning via Multimo 7.0分前25% 8. EchoMind: An Interrelated Multi-level Benchmark for Evaluati 7.0分前25% 9. STAR-Bench: Probing Deep Spatio-Temporal Reasoning as Audio 6.5分前25% 📋 论文详情 🥇 OmniVideoBench: Towards Audio-Visual Understanding Evaluation for Omni MLLMs 🔥 8.5/10 | 前25% | #基准测试 | #多模态模型 | #跨模态 #模型评估 ...

ICLR 2026 - 声源定位论文列表

ICLR 2026 - 声源定位共 1 篇论文 ← 返回 ICLR 2026 总览排名论文评分分档 🥇 Physics-Informed Audio-Geometry-Grid Representation Learning 8.0分前25% 📋 论文详情 🥇 Physics-Informed Audio-Geometry-Grid Representation Learning for Universal Sound Source Localization 🔥 8.0/10 | 前25% | #声源定位 | #物理信息 | #麦克风阵列 #空间音频 👥 作者与机构第一作者：Min-Sang Baek（Hanyang University, Department of Electronic Engineering）通讯作者：Joon-Hyuk Chang（Hanyang University, Department of Electronic Engineering）作者列表：Min-Sang Baek（Hanyang University, Department of Electronic Engineering）、Gyeong-Su Kim（Hanyang University, Department of Electronic Engineering）、Donghyun Kim（Hanyang University, Department of Electronic Engineering）、Joon-Hyuk Chang（Hanyang University, Department of Electronic Engineering） 💡 毒舌点评 ...

ICLR 2026 - 多模态推理论文列表

ICLR 2026 - 多模态推理共 1 篇论文 ← 返回 ICLR 2026 总览排名论文评分分档 🥇 Compose and Fuse: Revisiting the Foundational Bottlenecks in 7.5分前25% 📋 论文详情 🥇 Compose and Fuse: Revisiting the Foundational Bottlenecks in Multimodal Reasoning ✅ 7.5/10 | 前25% | #多模态推理 | #基准测试 | #大语言模型 #跨模态 👥 作者与机构第一作者：Yucheng Wang, Yifan Hou（苏黎世联邦理工学院计算机系，标注为同等贡献）通讯作者：Mrinmaya Sachan（苏黎世联邦理工学院计算机系）作者列表：Yucheng Wang（苏黎世联邦理工学院计算机系）、Yifan Hou（苏黎世联邦理工学院计算机系）、Aydin Javadov（苏黎世联邦理工学院计算机系）、Mubashara Akhtar（苏黎世联邦理工学院计算机系）、Mrinmaya Sachan（苏黎世联邦理工学院计算机系） 💡 毒舌点评亮点：论文构建了一套精妙的逻辑推理框架，将模态交互分解为六种可控模式，这种“解剖学”式的系统评估在当前多模态评估中少见且有价值。短板：依赖高度简化的合成逻辑数据来揭示“根本瓶颈”，其结论能否无缝迁移到复杂、开放的真实世界多模态推理场景中，存疑。 🔗 开源详情 ...

ICLR 2026 - 多模态模型论文列表

ICLR 2026 - 多模态模型共 5 篇论文 ← 返回 ICLR 2026 总览排名论文评分分档 🥇 Human Behavior Atlas: Benchmarking Unified Psychological And 8.5分前25% 🥈 NExT-OMNI: Towards Any-to-Any Omnimodal Foundation Models wi 8.0分前25% 🥉 OmniVinci: Enhancing Architecture and Data for Omni-Modal Un 7.5分前25% 4. Seeing, Listening, Remembering, and Reasoning: A Multimodal 7.5分前25% 5. TINY BUT MIGHTY: A SOFTWARE-HARDWARE CO- DESIGN APPROACH FOR 7.0分前25% 📋 论文详情 🥇 Human Behavior Atlas: Benchmarking Unified Psychological And Social Behavior Understanding 🔥 8.5/10 | 前25% | #多模态模型 | #预训练 | #音频分类 #音视频 ...

ICLR 2026 - 序列解耦论文列表

ICLR 2026 - 序列解耦共 1 篇论文 ← 返回 ICLR 2026 总览排名论文评分分档 🥇 DiffSDA: Unsupervised Diffusion Sequential Disentanglement A 8.0分前25% 📋 论文详情 🥇 DiffSDA: Unsupervised Diffusion Sequential Disentanglement Across Modalities 🔥 8.0/10 | 前25% | #序列解耦 | #扩散模型 | #自监督学习 #多模态模型 👥 作者与机构第一作者：Hedi Zisling (Ben-Gurion University) 通讯作者：Omri Azencot (Ben-Gurion University) 作者列表：Hedi Zisling (Ben-Gurion University)、Ilan Naiman (Ben-Gurion University)、Nimrod Berman (Ben-Gurion University)、Supasorn Suwajanakorn (VISTEC)、Omri Azencot (Ben-Gurion University) 💡 毒舌点评 ...

ICLR 2026 - 数据集论文列表

ICLR 2026 - 数据集共 1 篇论文 ← 返回 ICLR 2026 总览排名论文评分分档 🥇 SpeakerVid-5M: A Large-Scale High-Quality Dataset for Audio- 8.5分前25% 📋 论文详情 🥇 SpeakerVid-5M: A Large-Scale High-Quality Dataset for Audio-Visual Dyadic Interactive Human Generation 🔥 8.5/10 | 前25% | #数据集 | #自回归模型 | #音视频 #音频生成 👥 作者与机构第一作者：Youliang Zhang（清华大学、StepFun）通讯作者：Xiu Li（清华大学深圳国际研究生院）作者列表： Youliang Zhang（清华大学、StepFun） Zhaoyang Li（StepFun） Duomin Wang（StepFun，共同第一作者/责任作者†） Jiahe Zhang（未说明具体机构） Deyu Zhou（香港科技大学（广州）、StepFun） Zixin Yin（香港科技大学、StepFun） Xili Dai（StepFun） Gang Yu（StepFun） Xiu Li（清华大学深圳国际研究生院‡） 💡 毒舌点评 ...

ICLR 2026 - 机器人操作论文列表

ICLR 2026 - 机器人操作共 1 篇论文 ← 返回 ICLR 2026 总览排名论文评分分档 🥇 RoboOmni: Proactive Robot Manipulation in Omni-modal Context 7.5分前25% 📋 论文详情 🥇 RoboOmni: Proactive Robot Manipulation in Omni-modal Context ✅ 7.5/10 | 前25% | #机器人操作 | #端到端 | #多模态模型 #数据集 👥 作者与机构第一作者：Siyin Wang（复旦大学、上海创新研究院）通讯作者：Jinlan Fu（未说明具体机构，对应邮箱jinlanjonna@gmail.com），Xipeng Qiu（复旦大学、上海创新研究院）作者列表： Siyin Wang（复旦大学、上海创新研究院） Jinlan Fu（国家大学新加坡） Feihong Liu（复旦大学） Xinzhe He（复旦大学） Huangxuan Wu（复旦大学） Junhao Shi（复旦大学、上海创新研究院） Kexin Huang（复旦大学） Zhaoye Fei（复旦大学） Jingjing Gong（上海创新研究院） Zuxuan Wu（复旦大学、上海创新研究院） Yu-Gang Jiang（复旦大学） See-Kiong Ng（国家大学新加坡） Tat-Seng Chua（国家大学新加坡） Xipeng Qiu（复旦大学、上海创新研究院） 💡 毒舌点评 ...

ICLR 2026 - 模型可解释性论文列表

ICLR 2026 - 模型可解释性共 1 篇论文 ← 返回 ICLR 2026 总览排名论文评分分档 🥇 The Deleuzian Representation Hypothesis 8.5分前25% 📋 论文详情 🥇 The Deleuzian Representation Hypothesis 🔥 8.5/10 | 前25% | #模型可解释性 | #概念提取 | #对比学习 #自监督学习 👥 作者与机构第一作者：Clément Cornet (Université Paris-Saclay, CEA, List) 通讯作者：Clément Cornet (论文未明确标注通讯作者，根据单位信息推断) 作者列表：Clément Cornet (Université Paris-Saclay, CEA, List)、Romaric Besançon (Université Paris-Saclay, CEA, List)、Hervé Le Borgne (Université Paris-Saclay, CEA, List) 💡 毒舌点评 ...

ICLR 2026 - 模型比较论文列表

ICLR 2026 - 模型比较共 1 篇论文 ← 返回 ICLR 2026 总览排名论文评分分档 🥇 OptMerge: Unifying Multimodal LLM Capabilities and Modalitie 7.0分前25% 📋 论文详情 🥇 OptMerge: Unifying Multimodal LLM Capabilities and Modalities via Model Merging ✅ 7.0/10 | 前25% | #模型比较 | #迁移学习 | #多模态模型 #模型评估 👥 作者与机构第一作者：Yongxian Wei (清华大学) 通讯作者：Chun Yuan (清华大学) 作者列表：Yongxian Wei (清华大学)， Runxi Cheng (清华大学)， Weike Jin (华为诺亚方舟实验室)， Enneng Yang (中山大学)， Li Shen (中山大学)， Lu Hou (华为诺亚方舟实验室)， Sinan Du (清华大学)， Chun Yuan (清华大学)， Xiaochun Cao (中山大学)， Dacheng Tao (南洋理工大学) 💡 毒舌点评 ...