ICASSP 2026 - 异常声音检测 论文列表

ICASSP 2026 - 异常声音检测 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 RASD-SR: A Robust Anomalous Sound Detection Framework with S 8.5分 前10% 📋 论文详情 🥇 RASD-SR: A Robust Anomalous Sound Detection Framework with Score Recalibration 🔥 8.5/10 | 前10% | #异常声音检测 | #预训练 #自监督学习 | #音频事件检测 #预训练 👥 作者与机构 第一作者:Ting Wu(中国科学院声学研究所噪声与音频研究实验室,中国科学院大学) 通讯作者:Xiaobin Cheng(中国科学院声学研究所噪声与音频研究实验室,中国科学院大学) 作者列表: Ting Wu(中国科学院声学研究所噪声与音频研究实验室,中国科学院大学) Lu Han(中国科学院声学研究所噪声与音频研究实验室,中国科学院大学) Zhaoli Yan(北京化工大学机电工程学院) Xiaobin Cheng(中国科学院声学研究所噪声与音频研究实验室,中国科学院大学) Jun Yang(中国科学院声学研究所噪声与音频研究实验室,中国科学院大学) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 情感分析 论文列表

ICASSP 2026 - 情感分析 共 3 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 MCF: Text LLMS for Multimodal Emotional Causality 8.0分 前25% 🥈 Temporal-Spatial Decouple Before Act: Disentangled Represent 7.5分 前25% 🥉 ACIR-MACL: Effective Multimodal Sentiment Analysis via Atten 7.0分 前25% 📋 论文详情 🥇 MCF: Text LLMS for Multimodal Emotional Causality 🔥 8.0/10 | 前25% | #情感分析 | #多模态模型 | #大语言模型 #数据集 👥 作者与机构 第一作者:Yulong Li(西安交通大学-利物浦大学;穆罕默德·本·扎耶德人工智能大学) 通讯作者:Yichen Li(华中科技大学);Chong Li(西安交通大学-利物浦大学);Jionglong Su(西安交通大学-利物浦大学) 作者列表: Yulong Li(西安交通大学-利物浦大学;穆罕默德·本·扎耶德人工智能大学) Yuxuan Zhang(西安交通大学-利物浦大学) Rui Chen(西安交通大学-利物浦大学) Man Lei(西安交通大学-利物浦大学) Yibo Yuan(西安交通大学-利物浦大学) Xiwei Liu(穆罕默德·本·扎耶德人工智能大学) Runyi Lin(西安交通大学-利物浦大学) Tianrui Li(西安交通大学-利物浦大学) Mingze Jiang(西安交通大学-利物浦大学) Anyi Liu(西安交通大学-利物浦大学) Yichen Li(华中科技大学) Chong Li(西安交通大学-利物浦大学) Jionglong Su(西安交通大学-利物浦大学) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 情感识别 论文列表

ICASSP 2026 - 情感识别 共 2 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 APKD: Aligned And Paced Knowledge Distillation Towards Light 7.5分 前25% 🥈 DSSR: Decoupling Salient and Subtle Representations Under Mi 7.5分 前25% 📋 论文详情 🥇 APKD: Aligned And Paced Knowledge Distillation Towards Lightweight Heterogeneous Multimodal Emotion Recognition ✅ 7.5/10 | 前25% | #情感识别 | #知识蒸馏 | #多模态模型 #语音情感识别 👥 作者与机构 第一作者:Yujian Sun(山东理工大学计算机科学学院) 通讯作者:Shanliang Yang(山东理工大学计算机科学学院,yangshanliang@sdut.edu.cn) 作者列表:Yujian Sun(山东理工大学计算机科学学院),Bingtian Qiao(福州大学莫纳什大学联合国际学院),Yiwen Wang(福州大学莫纳什大学联合国际学院),Shanliang Yang(山东理工大学计算机科学学院) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 房间脉冲响应 论文列表

ICASSP 2026 - 房间脉冲响应 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 RIR-Former: Coordinate-Guided Transformer for Continuous Rec 7.0分 前25% 📋 论文详情 🥇 RIR-Former: Coordinate-Guided Transformer for Continuous Reconstruction of Room Impulse Responses ✅ 7.0/10 | 前25% | #房间脉冲响应 | #Transformer | #麦克风阵列 #空间音频 👥 作者与机构 第一作者:Shaoheng Xu (The Australian National University) 和 Chunyi Sun (The Australian National University)(论文中注明共同第一作者) 通讯作者:未说明 作者列表:Shaoheng Xu (The Australian National University), Chunyi Sun (The Australian National University), Jihui (Aimee) Zhang (The University of Queensland & The Australian National University), Prasanga Samarasinghe (The Australian National University), Thushara Abhayapala (The Australian National University) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 房间脉冲响应去噪 论文列表

ICASSP 2026 - 房间脉冲响应去噪 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Full Band Denoising of Room Impulse Response in the Wavelet 7.5分 前25% 📋 论文详情 🥇 Full Band Denoising of Room Impulse Response in the Wavelet Domain with Dictionary Learning ✅ 7.5/10 | 前25% | #房间脉冲响应去噪 | #小波变换 #字典学习 | #小波变换 #字典学习 👥 作者与机构 第一作者:Théophile Dupré(Trinnov Audio, Neuilly-Plaisance, France) 通讯作者:未说明 作者列表:Théophile Dupré(Trinnov Audio)、Romain Couderc(Trinnov Audio)、Miguel Moleron(Trinnov Audio)、Axel Coulon(Trinnov Audio)、Rémy Bruno(Trinnov Audio)、Arnaud Laborie(Trinnov Audio) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 数据集 论文列表

ICASSP 2026 - 数据集 共 3 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 HiFi-HARP: A High-Fidelity 7th-Order Ambisonic Room Impulse 7.5分 前25% 🥈 Representation-Based Data Quality Audits for Audio 7.5分 前25% 🥉 AMBISONIC-DML: A Benchmark Dataset for Dynamic Higher-Order 7.5分 前25% 📋 论文详情 🥇 HiFi-HARP: A High-Fidelity 7th-Order Ambisonic Room Impulse Response Dataset ✅ 7.5/10 | 前25% | #数据集 | #混合仿真 | #麦克风阵列 #空间音频 👥 作者与机构 ...

2026-04-29

ICASSP 2026 - 数据集对齐 论文列表

ICASSP 2026 - 数据集对齐 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Structure-Aware Diffusion Schrödinger Bridge 7.7分 前50% 📋 论文详情 🥇 Structure-Aware Diffusion Schrödinger Bridge ✅ 7.7/10 | 前50% | #数据集对齐 | #扩散模型 | #领域适应 👥 作者与机构 第一作者:未说明 通讯作者:未说明 作者列表:Dawnlicity Charls (新南威尔士大学电气工程与电信学院)、Tharmakulasingam Sirojan (新南威尔士大学电气工程与电信学院)、Vidhyasaharan Sethu (新南威尔士大学电气工程与电信学院)、Beena Ahmed (新南威尔士大学电气工程与电信学院) 💡 毒舌点评 亮点:巧妙地将Gromov-Wasserstein距离的核心思想(保持相对结构)转化为一个可直接加入扩散模型训练的正则化损失项,用最小的“补丁”解决了Schrödinger Bridge在数据对齐中破坏数据拓扑的实际痛点。短板:整篇论文的实验说服力严重依赖“在合成数据上效果好”这一环,若没有在如MRI-CT转换、跨域图像翻译等真实且公认的挑战性任务上展示其“结构保持”带来的下游性能提升(如分类准确率),这篇工作更像一个“技术上可行、但尚未证明实用价值”的实验性探索。 🔗 开源详情 代码:论文中未提及本工作(SDSB)的代码仓库链接。 模型权重:未提及公开模型权重。 数据集:使用了合成数据集,未提及是否公开具体生成脚本或数据文件。 Demo:未提供在线演示。 复现材料:论文提及了基于DSBM [8]的代码库进行实现,并给出了关键超参数(λ=100,内/外层迭代次数,网络结构等),但未提供完整的训练配置文件或详细步骤。论文中未提及开源计划。 论文中引用的开源项目:明确引用并基于 [8] Diffusion Schrödinger Bridge Matching 的代码库进行实验。 📌 核心摘要 ...

2026-04-29

ICASSP 2026 - 槽填充 论文列表

ICASSP 2026 - 槽填充 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Slot Filling as a Reasoning Task for Speechllms 6.5分 前25% 📋 论文详情 🥇 Slot Filling as a Reasoning Task for Speechllms ✅ 6.5/10 | 前25% | #槽填充 | #思维链 | #语音理解 #语音大模型 👥 作者与机构 第一作者:Kadri Hacioglu(Uniphore) 通讯作者:未说明 作者列表:Kadri Hacioglu (Uniphore), Manjunath K. E. (Uniphore), Andreas Stolcke (Uniphore) 💡 毒舌点评 论文亮点在于清晰地指出了推理优化型LLM(如DeepSeek R1蒸馏版)在直接应用于语音槽填充时“水土不服”的现象,并提出了通过混合训练来兼顾直接与推理模式的务实解决方案。然而,其主要短板在于实验局限于有限的几个开源模型和单一的脚本对话数据集,未能充分验证该方法在更多样化语音场景(如自然对话、噪声环境)下的普适性,且完全缺失代码和数据开源,削弱了结论的说服力和影响力。 🔗 开源详情 代码:论文中未提及代码链接。 模型权重:未提及是否公开微调后的模型权重。 数据集:使用的DefinedAI客服对话数据集未提及是否公开及获取方式。构建的推理数据集也未开源。 Demo:未提及。 复现材料:给出了部分训练细节(如LoRA设置、批量大小、学习率、硬件),但未提供完整的训练配置、数据预处理脚本、评估脚本或附录中的详细超参数表。 论文中引用的开源项目:主要依赖了开源的预训练模型,如Whisper, Llama系列, Qwen系列, Phi系列等。 📌 核心摘要 ...

2026-04-29

ICASSP 2026 - 模型评估 论文列表

ICASSP 2026 - 模型评估 共 16 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Do Bias Benchmarks Generalise? Evidence from Voice-Based Eva 8.0分 前25% 🥈 The Curious Case of Visual Grounding: Different Effects for 8.0分 前25% 🥉 A Text-To-Text Alignment Algorithm for Better Evaluation of 7.5分 前25% 4. Perceptual Quality Assessment for Stylized Talking Heads 7.5分 前50% 5. Leveraging Multiple Speech Enhancers for Non-Intrusive Intel 7.5分 前25% 6. RHO-PERFECT: Correlation Ceiling for Subjective Evaluation D 7.5分 前25% 7. When Voice Matters: A Controlled Study of Audio LLM Behavior 7.0分 前25% 8. Evaluating Bias in Spoken Dialogue LLMs for Real-World Decis 7.0分 前25% 9. Evaluating Compositional Structure in Audio Representations 7.0分 前50% 10. Auditory Illusion Benchmark for Large Audio Language Models 7.0分 前50% 11. When Silence Matters: The Impact of Irrelevant Audio on Text 7.0分 前50% 12. Investigating Modality Contribution in Audio LLMs for Music 6.5分 前50% 13. Sparse Autoencoders Make Audio Foundation Models More Explai 6.5分 前50% 14. Towards Evaluating Generative Audio: Insights from Neural Au 6.5分 前50% 15. Z-Scores: A Metric for Linguistically Assessing Disfluency R 6.5分 前50% 16. Can Hierarchical Cross-Modal Fusion Predict Human Perception 6.0分 前25% 📋 论文详情 🥇 Do Bias Benchmarks Generalise? Evidence from Voice-Based Evaluation of Gender Bias in Speechllms 🔥 8.0/10 | 前25% | #模型评估 | #基准测试 | #语音大模型 #数据集 ...

2026-04-29

ICASSP 2026 - 歌唱旋律提取 论文列表

ICASSP 2026 - 歌唱旋律提取 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 A Hybrid Convolution-Mamba Network with Tone-Octave Contrast 7.5分 前25% 📋 论文详情 🥇 A Hybrid Convolution-Mamba Network with Tone-Octave Contrastive Learning for Stratified Semi-Supervised Singing Melody Extraction ✅ 7.5/10 | 前25% | #歌唱旋律提取 | #对比学习 | #音乐信息检索 #状态空间模型 👥 作者与机构 第一作者:康杰东(Kangjie Dong, 东华大学计算机科学与技术学院) 通讯作者:于帅(Shuai Yu, 大连理工大学信息与通信工程学院), 李威(Wei Li, 复旦大学计算机科学与技术学院) 作者列表:康杰东(东华大学计算机科学与技术学院), Shicheng Ding(美国塔博学院), 于帅(大连理工大学信息与通信工程学院, 通讯作者), 李威(复旦大学计算机科学与技术学院, 通讯作者) 💡 毒舌点评 ...

2026-04-29