ICLR 2026 - 序列解耦 论文列表

ICLR 2026 - 序列解耦 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 DiffSDA: Unsupervised Diffusion Sequential Disentanglement A 8.0分 前25% 📋 论文详情 🥇 DiffSDA: Unsupervised Diffusion Sequential Disentanglement Across Modalities 🔥 8.0/10 | 前25% | #序列解耦 | #扩散模型 | #自监督学习 #多模态模型 👥 作者与机构 第一作者:Hedi Zisling (Ben-Gurion University) 通讯作者:Omri Azencot (Ben-Gurion University) 作者列表:Hedi Zisling (Ben-Gurion University)、Ilan Naiman (Ben-Gurion University)、Nimrod Berman (Ben-Gurion University)、Supasorn Suwajanakorn (VISTEC)、Omri Azencot (Ben-Gurion University) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-21 · 1 min · 193 words

ICLR 2026 - 数据集 论文列表

ICLR 2026 - 数据集 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 SpeakerVid-5M: A Large-Scale High-Quality Dataset for Audio- 8.5分 前25% 📋 论文详情 🥇 SpeakerVid-5M: A Large-Scale High-Quality Dataset for Audio-Visual Dyadic Interactive Human Generation 🔥 8.5/10 | 前25% | #数据集 | #自回归模型 | #音视频 #音频生成 👥 作者与机构 第一作者:Youliang Zhang(清华大学、StepFun) 通讯作者:Xiu Li(清华大学深圳国际研究生院) 作者列表: Youliang Zhang(清华大学、StepFun) Zhaoyang Li(StepFun) Duomin Wang(StepFun,共同第一作者/责任作者†) Jiahe Zhang(未说明具体机构) Deyu Zhou(香港科技大学(广州)、StepFun) Zixin Yin(香港科技大学、StepFun) Xili Dai(StepFun) Gang Yu(StepFun) Xiu Li(清华大学深圳国际研究生院‡) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-21 · 1 min · 144 words

ICLR 2026 - 机器人操作 论文列表

ICLR 2026 - 机器人操作 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 RoboOmni: Proactive Robot Manipulation in Omni-modal Context 7.5分 前25% 📋 论文详情 🥇 RoboOmni: Proactive Robot Manipulation in Omni-modal Context ✅ 7.5/10 | 前25% | #机器人操作 | #端到端 | #多模态模型 #数据集 👥 作者与机构 第一作者:Siyin Wang(复旦大学、上海创新研究院) 通讯作者:Jinlan Fu(未说明具体机构,对应邮箱jinlanjonna@gmail.com),Xipeng Qiu(复旦大学、上海创新研究院) 作者列表: Siyin Wang(复旦大学、上海创新研究院) Jinlan Fu(国家大学新加坡) Feihong Liu(复旦大学) Xinzhe He(复旦大学) Huangxuan Wu(复旦大学) Junhao Shi(复旦大学、上海创新研究院) Kexin Huang(复旦大学) Zhaoye Fei(复旦大学) Jingjing Gong(上海创新研究院) Zuxuan Wu(复旦大学、上海创新研究院) Yu-Gang Jiang(复旦大学) See-Kiong Ng(国家大学新加坡) Tat-Seng Chua(国家大学新加坡) Xipeng Qiu(复旦大学、上海创新研究院) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-21 · 1 min · 122 words

ICLR 2026 - 模型可解释性 论文列表

ICLR 2026 - 模型可解释性 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 The Deleuzian Representation Hypothesis 8.5分 前25% 📋 论文详情 🥇 The Deleuzian Representation Hypothesis 🔥 8.5/10 | 前25% | #模型可解释性 | #概念提取 | #对比学习 #自监督学习 👥 作者与机构 第一作者:Clément Cornet (Université Paris-Saclay, CEA, List) 通讯作者:Clément Cornet (论文未明确标注通讯作者,根据单位信息推断) 作者列表:Clément Cornet (Université Paris-Saclay, CEA, List)、Romaric Besançon (Université Paris-Saclay, CEA, List)、Hervé Le Borgne (Université Paris-Saclay, CEA, List) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-21 · 1 min · 149 words

ICLR 2026 - 模型比较 论文列表

ICLR 2026 - 模型比较 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 OptMerge: Unifying Multimodal LLM Capabilities and Modalitie 7.0分 前25% 📋 论文详情 🥇 OptMerge: Unifying Multimodal LLM Capabilities and Modalities via Model Merging ✅ 7.0/10 | 前25% | #模型比较 | #迁移学习 | #多模态模型 #模型评估 👥 作者与机构 第一作者:Yongxian Wei (清华大学) 通讯作者:Chun Yuan (清华大学) 作者列表:Yongxian Wei (清华大学), Runxi Cheng (清华大学), Weike Jin (华为诺亚方舟实验室), Enneng Yang (中山大学), Li Shen (中山大学), Lu Hou (华为诺亚方舟实验室), Sinan Du (清华大学), Chun Yuan (清华大学), Xiaochun Cao (中山大学), Dacheng Tao (南洋理工大学) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-21 · 1 min · 121 words

ICLR 2026 - 模型评估 论文列表

ICLR 2026 - 模型评估 共 2 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 VoxPrivacy: A Benchmark for Evaluating Interactional Privacy 9.5分 前10% 🥈 MAPSS: Manifold-based Assessment of Perceptual Source Separa 8.5分 前25% 📋 论文详情 🥇 VoxPrivacy: A Benchmark for Evaluating Interactional Privacy of Speech Language Models 🔥 9.5/10 | 前10% | #模型评估 | #基准测试 | #语音大模型 #数据集 👥 作者与机构 第一作者:Yuxiang Wang(香港中文大学(深圳)) 通讯作者:未明确说明(根据惯例和贡献推断,Zhizheng Wu可能性较大) 作者列表:Yuxiang Wang¹, Hongyu Liu¹, Dekun Chen¹, Xueyao Zhang¹, Zhizheng Wu¹,²,³,⁴ ¹ 香港中文大学(深圳) ² 深圳大数据研究院 ³ 澳门城市大学 ⁴ Amphion Technology Co., Ltd.(星尘智能科技有限公司) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-21 · 2 min · 281 words

ICLR 2026 - 生态计算 论文列表

ICLR 2026 - 生态计算 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 MIAM: Modality Imbalance-Aware Masking for Multimodal Ecolog 8.5分 前25% 📋 论文详情 🥇 MIAM: Modality Imbalance-Aware Masking for Multimodal Ecological Applications 🔥 8.5/10 | 前25% | #生态计算 | #数据增强 | #多模态模型 #鲁棒性 👥 作者与机构 第一作者:Robin Zbinden(洛桑联邦理工学院,EPFL) 通讯作者:Robin Zbinden(robin.zbinden@epfl.ch,洛桑联邦理工学院,EPFL) 作者列表: Robin Zbinden(洛桑联邦理工学院,EPFL,*共同第一作者) Wesley Monteith-Finas(洛桑联邦理工学院,EPFL,*共同第一作者) Gencer Sumbul(洛桑联邦理工学院,EPFL) Nina van Tiel(洛桑联邦理工学院,EPFL) Chiara Vanalli(洛桑联邦理工学院,EPFL) Devis Tuia(洛桑联邦理工学院,EPFL) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-21 · 1 min · 130 words

ICLR 2026 - 生成模型 论文列表

ICLR 2026 - 生成模型 共 2 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 DiVeQ: Differentiable Vector Quantization Using the Reparame 8.0分 前25% 🥈 AUHead: Realistic Emotional Talking Head Generation via Acti 7.5分 前25% 📋 论文详情 🥇 DiVeQ: Differentiable Vector Quantization Using the Reparameterization Trick 🔥 8.0/10 | 前25% | #生成模型 | #向量量化 | #图像生成 #语音编码 👥 作者与机构 第一作者:Mohammad Hassan Vali(ELLIS Institute Finland & Department of Computer Science, Aalto University, Finland) 通讯作者:未明确说明(论文提供了三位作者的共同邮箱,未指定单独通讯作者) 作者列表:Mohammad Hassan Vali(ELLIS Institute Finland & Department of Computer Science, Aalto University, Finland)、Tom Bäckström(Department of Information and Communications Engineering, Aalto University, Finland)、Arno Solin(ELLIS Institute Finland & Department of Computer Science, Aalto University, Finland) 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-21 · 2 min · 272 words

ICLR 2026 - 生物声学 论文列表

ICLR 2026 - 生物声学 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 AVEX: What Matters for Animal Vocalization Encoding 7.0分 前25% 📋 论文详情 🥇 AVEX: What Matters for Animal Vocalization Encoding ✅ 7.0/10 | 前25% | #生物声学 | #预训练 | #自监督学习 #模型比较 👥 作者与机构 第一作者:Marius Miron(Earth Species Project),David Robinson(Earth Species Project)(共同贡献) 通讯作者:Marius Miron, David Robinson(Earth Species Project) 作者列表:Marius Miron(Earth Species Project),David Robinson(Earth Species Project),Milad Alizadeh(Earth Species Project),Ellen Gilsenan-McMahon(Earth Species Project),Gagan Narula(Earth Species Project),Emmanuel Chemla(Earth Species Project),Maddie Cusimano(Earth Species Project),Felix Effenberger(Earth Species Project),Masato Hagiwara(Earth Species Project),Benjamin Hoffman(Earth Species Project),Sara Keen(Earth Species Project),Diane Kim(Earth Species Project),Jane Lawton(Earth Species Project),Jen-Yu Liu(Earth Species Project),Aza Raskin(Earth Species Project),Olivier Pietquin(Earth Species Project),Matthieu Geist(Earth Species Project)。 💡 毒舌点评 ...

2026-05-04 · 更新于 2026-05-21 · 1 min · 193 words

ICLR 2026 - 神经网络架构 论文列表

ICLR 2026 - 神经网络架构 共 1 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 Deep Learning with Learnable Product-Structured Activations 8.0分 前10% 📋 论文详情 🥇 Deep Learning with Learnable Product-Structured Activations 🔥 8.0/10 | 前10% | #神经网络架构 | #神经网络架构 | #隐式神经表示 #深度学习理论 👥 作者与机构 第一作者:Saanjali Maharaj(University of Toronto) 通讯作者:Prasanth B. Nair(University of Toronto) 作者列表:Saanjali Maharaj(University of Toronto)、Prasanth B. Nair(University of Toronto) 💡 毒舌点评 亮点在于LRNN架构将低秩函数分解思想巧妙地引入深度学习,其理论分析严谨(证明了通用逼近和维度诅咒缓解),并且实验设计得极为全面,从ImageNet图像到PDE求解,几乎“打穿”了隐式表示领域的主流基准。短板则是,尽管架构思想优美,但其每个“神经元”内部实际嵌套了一个小型MLP(用于参数化一元函数),这无疑显著增加了计算复杂度和训练时间,论文在性能与效率的权衡上讨论稍显不足,可能限制其在大规模实时应用中的部署。 🔗 开源详情 代码:论文明确提供了公开的代码仓库链接:https://github.com/dacelab/lrnn。 模型权重:论文中未提及公开预训练模型权重。 数据集:使用了公开的数据集(ImageNet, DIV2K, GTZAN, LibriSpeech等),但论文中未说明是否提供处理后的特定任务数据集。 Demo:论文中未提及在线演示。 复现材料:论文提供了极其详尽的复现信息,包括: 所有实验的具体超参数设置(学习率、调度器、模型尺寸等)。 架构的实现细节(如组件MLP的结构、LayerNorm的使用、方差控制缩放)。 各类消融研究的设计和结果。 训练硬件信息(单张RTX 4090 GPU)。 论文中引用的开源项目:论文依赖并对比了多个开源基准模型,包括SIREN、SPDER、WIRE、Gaussian Activated Networks等的官方实现。其实现基于PyTorch框架。 📌 核心摘要 ...

2026-05-04 · 更新于 2026-05-21 · 1 min · 97 words