Omni-DeepSearch: A Benchmark for Audio-Driven Omni-Modal Deep Search

📄 Omni-DeepSearch: A Benchmark for Audio-Driven Omni-Modal Deep Search #基准测试 #模型评估 #跨模态 #音频问答 #多模态代理 ✅ 6.0/10 | 前25% | #基准测试 | #模型评估 | #跨模态 #音频问答 | arxiv 学术质量 6.0/8 | 影响力 1.8/2 | 可复现性 0.8/1 | 置信度 高 👥 作者与机构 第一作者:Tao Yu (中国科学院自动化研究所 CASIA,中国科学院大学 UCAS,北京人工智能研究院 BAAI) 通讯作者:Yan Huang (中国科学院自动化研究所 CASIA),Liang Wang (中国科学院自动化研究所 CASIA) 作者列表:Tao Yu (CASIA, UCAS, BAAI),Yiming Ding (CASIA),Shenghua Chai (CASIA),Minghui Zhang (CASIA),Zhongtian Luo (CASIA),Xinming Wang (CASIA, UCAS),Xinlong Chen (CASIA, UCAS),Zhaolu Kang (Peking University),Junhao Gong (Peking University),Yuxuan Zhou (Tsinghua University),Haopeng Jin (CASIA),Zhiqing Cui (CASIA),Jiabing Yang (CASIA, UCAS),YiFan Zhang (CASIA, UCAS),Hongzhu Yi (UCAS),Zheqi He (BAAI),Xi Yang (BAAI),Yan Huang (CASIA, UCAS),Liang Wang (CASIA, UCAS) 💡 毒舌点评 亮点:论文精准地识别了当前全模态评测中“被动接收多模态信息”范式的局限,定义了“音频驱动的主动全模态深度搜索”这一重要且现实的新任务,并系统性地构建了首个基准。这对于推动多模态智能体从“理解”走向“行动”具有明确的指导价值。短板:作为基准,其影响力受限于相对有限的规模(640个样本) 和对特定搜索工具、流程及提示策略的强依赖。论文声称解决了“主动搜索”的评测空白,但其核心贡献更接近于一个高度结构化的、依赖工具的评估流水线,而非对模型内在推理能力的无偏测量。实验部分缺乏与现有相关基准(如BrowseComp-VL, VideoBrowserComp)在类似模型上的直接横向对比,削弱了其挑战性定位的独特性。 ...

2026-05-12 · 更新于 2026-06-12 · 3 min · 438 words

Task-Aware Answer Preservation under Audio Compression for Large Audio Language Models

📄 Task-Aware Answer Preservation under Audio Compression for Large Audio Language Models #音频大模型 #长音频处理 #音频压缩 #音频问答 #模型评估 #部署优化 ✅ 6.5/10 | 前25% | #音频问答 | #音频压缩 | #音频大模型 #长音频处理 | arxiv 学术质量 6.5/7 | 选题价值 2.0/2 | 复现加成 0.0 | 置信度 高 👥 作者与机构 第一作者:Amir Ivry(Technion–Israel Institute of Technology,电气与计算机工程系) 通讯作者:Amir Ivry(aivry@ieee.org) 作者列表:Amir Ivry(Technion–Israel Institute of Technology,电气与计算机工程系) 💡 毒舌点评 这篇论文为“如何在压缩音频时保住回答正确率”这个实际问题,搭建了一套非常严谨的理论评估框架(家庭级超额风险),比简单地看平均准确率高级得多。它还煞费苦心地设计了实验来验证理论预测,比如平均指标如何“隐藏”最差情况。然而,理论很丰满,实践却骨感:论文自己用作案例的“学习型选择器”不仅在V1里训练得“早退”了,而且在V2实验中,那个理论上能省预算的“查询条件压缩”,增益忽正忽负,甚至在特定数据集(MMSU)上还帮了倒忙,让人怀疑这个“任务感知”到底有多少实战价值。最终,它更像是一份严谨的“评估方法论文”而非一个“压缩算法突破”。 📌 核心摘要 要解决什么问题:大型音频语言模型在部署时,常需压缩输入音频以降低内存和延迟。但这可能导致对某些特定类型问题的回答准确性急剧下降,而这种损害会被整体平均准确率所掩盖,存在部署风险。 方法核心是什么:提出一个任务感知的答案保留框架。该框架将压缩器的评估从“整体误差”转向“最坏查询家族的超额误差”。它形式化了家庭级超额风险(Δ_𝒬)和答案保留前沿(b_𝒬⋆),并推导出一个实用的签核协议,该协议考虑了查询家族划分、统计置信区间和解耦审计(§4, 5)。 与已有方法相比新在哪里:据作者称,这是首个将部署时的压缩预算决策与特定查询家族的答案保留明确联系起来的框架。它超越了基于平均性能或感知保真度的传统评估,引入了家庭级风险保证和查询条件压缩的理论优势分析(定理3.4),并提供了可操作的签核流程(算法1)。 主要实验结果如何:在五个音频问答基准和两个Qwen骨干模型上评估。关键发现包括: (a) 家庭级损害隐藏:数据集平均误差(Δ_avg)总是低估了最坏家族的误差(Δ_fam),差距在AudioMCQ-StrongAC上高达6.79个百分点(在关键词划分下,见表1和图1、图3)。 (b) 划分决定结论:查询家族划分的粒度(关键词、原生、语义)显著影响测得的家庭级风险差距和批准的压缩预算(表13)。 (c) 查询条件压缩是情景依赖的:理论上可节省预算(定理3.4),但在实践中仅在AudioMCQ-StrongAC数据集上表现出稳定正增益(表3和表20、21),在MMSU的某些任务(如对话轮次计数、语调感知)上甚至有害(表28、图13,§I.11)。 (d) 查询条件压缩器在使用查询:解耦审计(§5.1)表明,在AudioMCQ-StrongAC上,查询条件选择器的查询使用对下游答案保留前沿有显著影响(表4)。 实际意义是什么:为音频大模型的部署提供了一套更可靠的压缩接口签核流程。它强调了报告家庭级性能、审慎选择查询划分的重要性,并指出了查询条件压缩策略的适用边界和局限性。 主要局限性是什么:(a) 实验依赖特定类型的“硬分块保留”压缩器和启发式查询家族划分(§H.2,§G.6)。(b) 作为案例的学习型选择器在V1中训练不完整(早停,§H.3),其查询条件压缩优势在实践中不稳定(§I.7)。(c) 理论假设查询在编码时可用,且与音频独立,这不适用于离线归档压缩(§Limitations)。(d) 论文未完全解耦信息丢失与下游模型能力不足的影响(仅部分估计了模型类差距,§J.5)。 🔗 开源详情 代码:论文中未提及代码链接。 模型权重:论文中未提供(论文引用了 Qwen2-Audio-7B-Instruct [3] 和 Qwen2.5-Omni-7B [25],但未提供具体下载链接)。 数据集: DCASE 2026 dev: https://dcase-repo.github.io/dcase2026/challenge/task_audio_dependent_question_answering/dev/ AudioMCQ-StrongAC: https://huggingface.co/datasets/voidful/AudioMCQ (论文中引用了 [9],并指出评测集为 “StrongAC” 子集) MMSU: https://huggingface.co/datasets/moonwu/MMSU (论文引用 [24]) MMAR: https://huggingface.co/datasets/juliusfrost/MMAR (论文引用 [15]) BigBench Audio: https://huggingface.co/datasets/juliusfrost/bigbench-audio (论文引用 [20, 21]) Demo:论文中未提及。 复现材料:论文提供了非常详尽的附录,构成了主要的复现材料: 附录 D:扩展的问题设置和操作预算细节。 附录 E:主文所述理论的完整证明和辅助推导。 附录 F:实际估计器、不确定性聚合和坐标轴约定。 附录 G:数据集和查询家族详情。 附录 H:实验协议,包括模型、选择器架构、训练配方、评估协议和推断时压缩器配置。 算法 1:面向实践者的候选压缩器签核协议。 附录 I:包含所有次要图表、表格、消融研究和家族级分析。 附录 J:记录了不完整或可疑结果及注意事项。 论文中引用的开源项目: Qwen2-Audio: https://arxiv.org/abs/2407.10759 (论文引用 [3]) Qwen2.5-Omni: https://arxiv.org/abs/2503.20215 (论文引用 [25]) SoundStream: https://arxiv.org/abs/2107.00637 (论文引用 [28]) EnCodec: https://arxiv.org/abs/2210.13438 (论文引用 [5]) AudioLM: https://arxiv.org/abs/2208.09392 (论文引用 [2]) Gumbel-softmax: https://arxiv.org/abs/1611.01144 (论文引用 [10]) AdamW 优化器: 未提供具体链接,但为标准优化器(论文提及)。 e5-large-v2 嵌入模型:用于语义分区,但未提供具体链接(论文在 J.6 部分提及)。 Bootstrap 重采样方法:论文引用了 [12, 6, 19, 8] 等标准统计文献。 🏗️ 方法概述和架构 该论文提出的是一个评估框架和签核协议,而非一个端到端的压缩模型。其核心是定义一套方法论,用于判断一个给定的音频压缩器在特定部署配置下是否可被接受。 ...

2026-05-08 · 更新于 2026-06-12 · 4 min · 751 words

MedMosaic: A Challenging Large Scale Benchmark of Diverse Medical Audio

📄 MedMosaic: A Challenging Large Scale Benchmark of Diverse Medical Audio #音频问答 #数据集 #多模态模型 #医学音频 #基准测试 ✅ 6.5/10 | 前25% | #音频问答 | #数据集 | #多模态模型 #医学音频 | arxiv 学术质量 5.5/7 | 选题价值 0.5/2 | 复现加成 0.5 | 置信度 中 👥 作者与机构 第一作者:Harshit Rajgarhia(未说明所属机构) 通讯作者:论文中未提及 作者列表:Harshit Rajgarhia(未说明)、Shuubham Ojha(未说明)、Asif Shaik(未说明)、Akhil Pothanapalli(未说明)、Rachuri Lokesh(未说明)、Abhishek Mukherji(未说明)、Prasanna Desikan(未说明) 💡 毒舌点评 亮点:论文正视了医学音频领域数据获取难的痛点,并通过结合合成语音与真实临床对话的方式,构建了一个任务类型丰富、规模可观(46,701 QA对)的基准测试集,填补了该领域的评估空白。短板:摘要仅展示了评测结果(如Gemini 2.5 Pro仅68.1%),但对数据集构建过程中的关键技术(如合成语音如何“精心构造”以模拟伪影)、详细的实验对比分析(与其他音频QA或医学QA基准的对比)着墨甚少,使得其作为“基准”的深度和说服力略显不足。 🔗 开源详情 代码:论文中未提及代码链接。 模型权重:论文中未提及。 数据集:论文中未提及具体的下载链接或开源协议。 Demo:论文中未提及。 复现材料:论文中未提及。 论文中引用的开源项目:未提及。 补充信息 [实验结果] 补充:论文中明确指出,对13个音频和多模态推理模型进行了评测,并观察到“性能在不同问题类型上存在显著差异”(substantial performance variation across question types)。尽管分析报告中提到“摘要未提供其他模型的具体性能数字”,这与原文信息一致,但原文中强调的“13个模型”这一具体数量和对“问题类型间差异”的观察是明确存在的事实,可以作为更完整的背景信息。 (注:经仔细比对,提供的“深度分析结果”已全面且准确地覆盖了“论文原文”中所有实质性信息,包括模型架构(未提及)、实验结果核心数据(Gemini-2.5-pro约68.1%)、训练细节(不适用)、消融实验(未提及)、自我声明的局限性(分析中已推断)以及SOTA差距(仅提及单一模型结果)。原文本身为摘要性质,未提供更详细的实验数据、对比表格或消融分析,因此分析报告无法基于现有信息补充更多具体数值或细节。) ...

2026-05-05 · 更新于 2026-06-12 · 1 min · 119 words

Can Vision-Language Models Answer Face to Face Questions in the Real-World?

📄 Can Vision-Language Models Answer Face to Face Questions in the Real-World? #音频问答 #基准测试 #多模态模型 #音视频 🔥 8.0/10 | 前25% | #音频问答 | #基准测试 | #多模态模型 #音视频 学术质量 6.0/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Reza Pourreza(Qualcomm AI Research) 通讯作者:未明确说明 作者列表:Reza Pourreza(Qualcomm AI Research), Rishit Dagli(University of Toronto / Qualcomm AI Research), Apratim Bhattacharyya(Qualcomm AI Research), Sunny Panchal(Qualcomm AI Research), Guillaume Berger(Qualcomm AI Research), Roland Memisevic(Qualcomm AI Research) 💡 毒舌点评 论文的亮点在于精准地抓住了当前多模态大模型从“离线理解”走向“实时交互”的关键瓶颈,并构建了一个极具针对性的真实世界问答基准,为社区指明了明确的改进方向。然而,其短板在于数据集规模相对有限(2900条),且核心评估指标依赖LLM judge,可能引入新的评估偏差,而提出的“流式基线”方法相对简单,更多是概念验证而非技术突破。 ...

2026-05-04 · 更新于 2026-06-12 · 2 min · 261 words

Echo: Towards Advanced Audio Comprehension via Audio-Interleaved Reasoning

📄 Echo: Towards Advanced Audio Comprehension via Audio-Interleaved Reasoning #音频大模型 #强化学习 #音频问答 #多模态模型 #数据集 🔥 8.5/10 | 前10% | #音频问答 | #强化学习 | #音频大模型 #多模态模型 学术质量 6.0/7 | 选题价值 1.8/2 | 复现加成 0.7 | 置信度 高 👥 作者与机构 第一作者:Daiqing Wu(中国科学院信息工程研究所 IIE, ByteDance中国) 通讯作者:Yangyang Kang(ByteDance中国), Yu Zhou(南开大学 VCIP & TMCC & DISSec) 作者列表: Daiqing Wu(IIE, ByteDance中国, 中国科学院大学) Xuan Zhang(ByteDance中国) Dongbao Yang(IIE) Jiashu Yao(ByteDance中国) Longfei Chen(上海科技大学信息科学与技术学院) Qingsong Liu(ByteDance中国) Sicheng Zhao(清华大学心理学与认知科学系) Can Ma(IIE) Yangyang Kang(浙江大学, ByteDance中国)(带†和‡标注,应为共同通讯或同等贡献) Yu Zhou(南开大学 VCIP & TMCC & DISSec)(带†和‡标注,应为共同通讯或同等贡献) 💡 毒舌点评 这篇论文最亮眼的是提出了一个符合人类认知直觉的“音频交错推理”框架,并用一套从数据生成到训练的完整工程化方案将其落地,实验也做得扎实全面。然而,其性能提升高度依赖于自动合成的训练数据(EAQA),这本质上是用一个强大的“教师”(DeepSeek-R1)的知识来蒸馏模型,而数据生成的“天花板”和潜在偏差可能限制模型的上限;此外,模型当前只能“回放”原始音频片段,无法进行更复杂的音频分析操作(如慢放、滤波),这为未来的扩展留下了空间,但也是当前的局限。 ...

2026-05-04 · 更新于 2026-06-12 · 2 min · 226 words

ICLR 2026 - 音频问答 论文列表

ICLR 2026 - 音频问答 共 6 篇论文 ← 返回 ICLR 2026 总览 排名 论文 评分 分档 🥇 Incentivizing Consistent, Effective and Scalable Reasoning C 8.5分 前10% 🥈 Echo: Towards Advanced Audio Comprehension via Audio-Interle 8.5分 前10% 🥉 Query-Guided Spatial–Temporal–Frequency Interaction for Musi 8.0分 前25% 4. Can Vision-Language Models Answer Face to Face Questions in 8.0分 前25% 5. Measuring Audio’s Impact on Correctness: Audio-Contribution- 7.5分 前25% 6. WorldSense: Evaluating Real-world Omnimodal Understanding fo 7.0分 前25% 📋 论文详情 🥇 Incentivizing Consistent, Effective and Scalable Reasoning Capability in Audio LLMs via Reasoning Process Rewards 🔥 8.5/10 | 前10% | #音频问答 | #强化学习 | #音频大模型 #推理 ...

2026-05-04 · 更新于 2026-06-12 · 3 min · 541 words

Incentivizing Consistent, Effective and Scalable Reasoning Capability in Audio LLMs via Reasoning Process Rewards

📄 Incentivizing Consistent, Effective and Scalable Reasoning Capability in Audio LLMs via Reasoning Process Rewards #音频问答 #强化学习 #音频大模型 #推理 🔥 8.5/10 | 前10% | #音频问答 | #强化学习 | #音频大模型 #推理 学术质量 8.5/7 | 选题价值 2.0/2 | 复现加成 0.0 | 置信度 高 👥 作者与机构 第一作者:Jiajun Fan (伊利诺伊大学厄巴纳-香槟分校 Siebel 计算与数据科学学院) 通讯作者:未说明 作者列表:Jiajun Fan (伊利诺伊大学厄巴纳-香槟分校),Roger Ren (Amazon),Jingyuan Li (Amazon),Rahul Pandey (Amazon),Prashanth Gurunath Shivakumar (Amazon),Ivan Bulyko (Amazon),Ankur Gandhe (Amazon),Ge Liu (伊利诺伊大学厄巴纳-香槟分校),Yile Gu (Amazon) 💡 毒舌点评 亮点在于系统性地诊断并解决了音频LLM推理的“测试时逆缩放”这一实际且重要的“反直觉”现象,并建立了一套从过程奖励到可扩展能力的完整方法论。短板是其基于GRPO的在线强化学习训练计算成本高昂(需要8块H200训练61小时),且多奖励组件的超参数调节(如α权重)虽经实验验证,但给实际复现增加了一定复杂度。 ...

2026-05-04 · 更新于 2026-06-12 · 2 min · 261 words

Measuring Audio's Impact on Correctness: Audio-Contribution-Aware Post-Training of Large Audio Language Models

📄 Measuring Audio’s Impact on Correctness: Audio-Contribution-Aware Post-Training of Large Audio Language Models #音频问答 #音频大模型 #强化学习 #数据集 #后训练 ✅ 7.5/10 | 前25% | #音频问答 | #强化学习 | #音频大模型 #数据集 学术质量 6.0/7 | 选题价值 1.0/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Haolin He(香港中文大学、蚂蚁集团) 通讯作者:Jian Liu(蚂蚁集团), Qiuqiang Kong(香港中文大学) 作者列表:Haolin He(香港中文大学、蚂蚁集团), Xingjian Du(罗切斯特大学), Renhe Sun(蚂蚁集团), Zheqi Dai(香港中文大学), Yujia Xiao(香港中文大学), Mingru Yang(蚂蚁集团), Jiayi Zhou(蚂蚁集团), Xiquan Li(上海交通大学), Zhengxi Liu(香港中文大学), Zining Liang(香港中文大学), Chunyat Wu(香港中文大学), Qianhua He(华南理工大学), Tan Lee(香港中文大学), Xie Chen(上海交通大学), Wei-Long Zheng(上海交通大学), Weiqiang Wang(蚂蚁集团), Mark D Plumbley(伦敦国王学院), Jian Liu(蚂蚁集团), Qiuqiang Kong(香港中文大学) 💡 毒舌点评 亮点:论文敏锐地捕捉并量化了“音频语言模型不听音频”这一核心问题,提出的“音频贡献”度量与过滤方法逻辑自洽,且基于此设计的Weak-to-Strong和Mixed-to-Strong训练范式确实有效,在多个基准上取得了扎实的SOTA结果。 短板:整个框架高度依赖Qwen2.5-Omni作为基座模型验证,其结论在不同架构(如纯编码器-解码器模型)上的泛化性未可知;且“音频贡献”的定义(用静音替换音频)过于粗暴,无法区分解码器是“忽略”了音频还是“错误处理”了音频。 ...

2026-05-04 · 更新于 2026-06-12 · 2 min · 243 words

Query-Guided Spatial–Temporal–Frequency Interaction for Music Audio–Visual Question Answering

📄 Query-Guided Spatial–Temporal–Frequency Interaction for Music Audio–Visual Question Answering #音频问答 #多模态模型 #音视频 #时频分析 🔥 8.0/10 | 前25% | #音频问答 | #多模态模型 | #音视频 #时频分析 学术质量 7.5/7 | 选题价值 1.0/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Kun Li(University of Twente;IT University of Copenhagen) 通讯作者:Sami Sebastian Brandt(IT University of Copenhagen) 作者列表:Kun Li(University of Twente, IT University of Copenhagen)、Michael Ying Yang(University of Bath)、Sami Sebastian Brandt(IT University of Copenhagen) 💡 毒舌点评 这篇论文的亮点在于它为音乐音视频问答(AVQA)设计了一个从问题引导到最终预测的端到端框架,并创新性地将音频的频率域特征作为一等公民纳入时空交互中,有效解决了视觉线索微弱时(如演奏者动作不明显)的识别难题,消融实验也扎实地证明了各模块的必要性。然而,其主要短板在于提出的框架相对复杂,引入了多个预训练编码器(CLIP, VGGish, AST),整体计算开销和模型复杂度可能限制其在资源受限场景的应用,且实验主要集中在音乐场景这一相对小众的benchmark上。 ...

2026-05-04 · 更新于 2026-06-12 · 2 min · 244 words

STAR-Bench: Probing Deep Spatio-Temporal Reasoning as Audio 4D Intelligence

📄 STAR-Bench: Probing Deep Spatio-Temporal Reasoning as Audio 4D Intelligence #基准测试 #音频大模型 #音频问答 #空间音频 #数据集 ✅ 6.5/10 | 前25% | #基准测试 | #数据集 | #音频大模型 #音频问答 学术质量 5.5/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Zihan Liu (北京航空航天大学, 上海人工智能实验室) 通讯作者:Yuhang Zang (上海人工智能实验室), Jiaqi Wang (上海人工智能实验室, 上海创新研究院) 作者列表:Zihan Liu(北京航空航天大学,上海人工智能实验室),Zhikang Niu(上海交通大学,上海创新研究院),Qiuyang Xiao(上海交通大学),Zhisheng Zheng(上海交通大学),Ruoqi Yuan(北京航空航天大学),Yuhang Zang(上海人工智能实验室),Yuhang Cao(上海人工智能实验室),Xiaoyi Dong(上海人工智能实验室,香港中文大学),Jianze Liang(上海人工智能实验室),Xie Chen(上海交通大学,上海创新研究院),Leilei Sun(北京航空航天大学),Dahua Lin(香港中文大学,上海人工智能实验室),Jiaqi Wang(上海人工智能实验室,上海创新研究院) 💡 毒舌点评 本文最大的亮点在于精准地指出了当前音频大模型“懂得多但听不懂”的尴尬现状——用文本描述就能回答大部分问题,证明现有基准测试太“水”。它设计的STAR-Bench像一份严苛的“听力体检表”,从音高、响度等基础感知到时空推理,层层深入,确实能测出模型的真实短板。不过,论文本身止步于“诊断医生”,并未给出“治疗方案”,其核心价值依赖于未来模型能否利用这个基准取得进步,稍显被动。 📌 核心摘要 本文指出,现有的音频基准测试主要评估可通过文本描述传达的语义内容,无法衡量模型对“语言难以描述”的细粒度音频线索的深层时空推理能力。为此,论文提出了“音频4D智能”的概念,即结合时间(1D)和三维空间(3D)进行深度推理的能力。作者构建了STAR-Bench基准,包含两个层级:基础声学感知(对音高、响度、时长、方位角、仰角、距离等六个属性的绝对感知范围和相对辨别灵敏度进行量化评估)和整体时空推理(包括连续过程与离散事件序列的时间推理,以及静态定位、多源关系和动态轨迹跟踪的空间推理)。数据构建流程结合了程序化合成音频和严格的人工标注四阶段流程。在对19个模型(16个开源,3个闭源)的评测中,STAR-Bench展现出巨大挑战性,人类表现远高于所有模型。研究发现:闭源模型(如Gemini 2.5 Pro)在知识和推理上领先,但细粒度感知仍是其瓶颈;开源模型则在感知、知识和推理各方面均存在基础性缺陷。例如,在仅使用音频文本描述答题时,MMAU和MMAR基准的准确率仅下降5.9%和9.0%,而STAR-Bench上时间推理和空间推理的准确率分别暴跌31.5%和35.2%,证明了其评测的是更深层的音频智能。论文通过详细的错误分析和消融研究,为未来模型改进指明了方向,如增强密集音频描述、改善多音频推理能力以及开发原生支持多通道音频的架构。 ...

2026-05-04 · 更新于 2026-06-12 · 2 min · 257 words