Icassp-2026

ICASSP 2026 - 音频场景分类论文列表

ICASSP 2026 - 音频场景分类共 1 篇论文 ← 返回 ICASSP 2026 总览排名论文评分分档 🥇 DDSC: Dynamic Dual-Signal Curriculum for Data-Efficient Acou 7.0分前25% 📋 论文详情 🥇 DDSC: Dynamic Dual-Signal Curriculum for Data-Efficient Acoustic Scene Classification Under Domain Shift ✅ 7.0/10 | 前25% | #音频场景分类 | #课程学习 | #领域适应 #低资源 👥 作者与机构第一作者：Peihong Zhang（School of Advanced Technology, Xi’an Jiaotong-Liverpool University, Suzhou, China）通讯作者：未说明（论文中未明确标注通讯作者）作者列表：Peihong Zhang（School of Advanced Technology, Xi’an Jiaotong-Liverpool University, Suzhou, China）、Yuxuan Liu（同上）、Rui Sang（同上）、Zhixin Li（同上）、Yiqiang Cai（同上）、Yizhou Tan（同上）、Shengchen Li（同上） 💡 毒舌点评 ...

ICASSP 2026 - 音频场景理解论文列表

ICASSP 2026 - 音频场景理解共 3 篇论文 ← 返回 ICASSP 2026 总览排名论文评分分档 🥇 Lightweight and Generalizable Acoustic Scene Representations 8.0分前25% 🥈 From Contrast to Commonality: Audio Commonality Captioning f 7.5分前25% 🥉 Class-Aware Permutation-Invariant Signal-to-Distortion Ratio 7.5分前25% 📋 论文详情 🥇 Lightweight and Generalizable Acoustic Scene Representations Via Contrastive Fine-Tuning and Distillation 🔥 8.0/10 | 前25% | #音频场景理解 | #对比学习 | #知识蒸馏 #少样本学习 👥 作者与机构第一作者：Kuang Yuan（卡内基梅隆大学，实习期间于Meta Reality Labs完成）通讯作者：未说明作者列表：Kuang Yuan（卡内基梅隆大学，Meta Reality Labs）、Yang Gao（Meta Reality Labs）、Xilin Li（Meta Reality Labs）、Xinhao Mei（Meta Reality Labs）、Syavosh Zadissa（Meta Reality Labs）、Tarun Pruthi（Meta Reality Labs）、Saeed Bagheri Sereshki（Meta Reality Labs） 💡 毒舌点评 ...

ICASSP 2026 - 音频增强论文列表

ICASSP 2026 - 音频增强共 3 篇论文 ← 返回 ICASSP 2026 总览排名论文评分分档 🥇 MixGAN-based Non-blind Bandwidth Extension for Audio Codec 8.0分前25% 🥈 SAGA-SR: Semantically and Acoustically Guided Audio Super-Re 7.5分前25% 🥉 Subspace Hybrid Adaptive Filtering for Phonocardiogram Signa 7.0分前50% 📋 论文详情 🥇 MixGAN-based Non-blind Bandwidth Extension for Audio Codec 🔥 8.0/10 | 前25% | #音频增强 | #生成对抗网络 | #音频编解码器 #非盲 👥 作者与机构第一作者：Hao Guo（华为中央媒体技术研究院，清华大学深圳国际研究生院）通讯作者：Wenbo Ding（清华大学深圳国际研究生院，邮箱：ding.wenbo@sz.tsinghua.edu.cn）作者列表：Hao Guo（华为中央媒体技术研究院，清华大学深圳国际研究生院）、BingYin Xia（华为中央媒体技术研究院）、Xiao-Ping Zhang（清华大学深圳国际研究生院）、Wenbo Ding（清华大学深圳国际研究生院） 💡 毒舌点评 ...

ICASSP 2026 - 音频大模型论文列表

ICASSP 2026 - 音频大模型共 1 篇论文 ← 返回 ICASSP 2026 总览排名论文评分分档 🥇 AR&D: A Framework for Retrieving and Describing Concepts for 6.5分前50% 📋 论文详情 🥇 AR&D: A Framework for Retrieving and Describing Concepts for Interpreting AudioLLMs ✅ 6.5/10 | 前50% | #音频大模型 | #自监督学习 | #模型评估 👥 作者与机构第一作者：Townim Faisal（澳大利亚机器学习研究所，阿德莱德大学；杜比实验室）通讯作者：未说明（论文中未明确标注通讯作者）作者列表： Townim Faisal（澳大利亚机器学习研究所，阿德莱德大学；杜比实验室） Ta Duc Huy（澳大利亚机器学习研究所，阿德莱德大学；杜比实验室） Siqi Pan（杜比实验室） Jeremy Stoddard（杜比实验室） Zhibin Liao（澳大利亚机器学习研究所，阿德莱德大学；计算机与数学科学学院） 💡 毒舌点评 ...

ICASSP 2026 - 音频字幕生成论文列表

ICASSP 2026 - 音频字幕生成共 1 篇论文 ← 返回 ICASSP 2026 总览排名论文评分分档 🥇 Diverse and Few-Step Audio Captioning via Flow Matching 6.5分前50% 📋 论文详情 🥇 Diverse and Few-Step Audio Captioning via Flow Matching ✅ 6.5/10 | 前50% | #音频字幕生成 | #流匹配 | #音频生成 #高效生成 👥 作者与机构第一作者：未说明（论文仅列出作者姓名，未明确标注第一作者）通讯作者：未说明作者列表：Naoaki Fujita（Panasonic Holdings Corporation, Osaka, Japan）、Hiroki Nakamura（Panasonic Holdings Corporation, Osaka, Japan）、Kosuke Itakura（Panasonic Holdings Corporation, Osaka, Japan） 💡 毒舌点评 ...

ICASSP 2026 - 音频安全论文列表

ICASSP 2026 - 音频安全共 11 篇论文 ← 返回 ICASSP 2026 总览排名论文评分分档 🥇 HVAC-EAR: Eavesdropping Human Speech Using HVAC Systems 8.5分前25% 🥈 RoCo: Robust Code for Fast and Effective Proactive Defense a 7.5分前25% 🥉 Membership Inference Attack against Music Diffusion Models v 7.5分前25% 4. A Feature-Optimized Audio Watermarking Algorithm with Adapti 7.5分前25% 5. Co-Initialization of Control Filter and Secondary Path via M 7.5分前25% 6. LenslessMic: Audio Encryption and Authentication via Lensles 7.5分前25% 7. Bloodroot: When Watermarking Turns Poisonous for Stealthy Ba 7.5分前25% 8. Emotional Damage: Investigating Safety Vulnerabilities of La 7.5分前25% 9. Audio-Text Jailbreak Attack on Large Audio-Language Models: 7.0分前25% 10. PRoADS: Provably Secure And Robust Audio Diffusion Steganogr 6.5分前50% 11. Linguard: Authenticating Speech Recordings Using Speech Reco 6.5分前50% 📋 论文详情 🥇 HVAC-EAR: Eavesdropping Human Speech Using HVAC Systems 🔥 8.5/10 | 前25% | #音频安全 | #时频分析 | #端到端 #工业应用 ...

ICASSP 2026 - 音频描述论文列表

ICASSP 2026 - 音频描述共 1 篇论文 ← 返回 ICASSP 2026 总览排名论文评分分档 🥇 LAMB: LLM-Based Audio Captioning with Modality Gap Bridging 7.0分前25% 📋 论文详情 🥇 LAMB: LLM-Based Audio Captioning with Modality Gap Bridging Via Cauchy-Schwarz Divergence ✅ 7.0/10 | 前25% | #音频描述 | #跨模态对齐 | #大语言模型 #音频场景理解 👥 作者与机构请基于当前提供的论文内容尽量完整提取作者与机构信息，要求：明确标注第一作者（如论文可判断），否则写“未说明” 明确标注通讯作者（如论文可判断），否则写“未说明” 列出能确认的作者姓名及其所属机构（大学、实验室、公司）机构信息尽量具体到实验室或部门；如果文本里没有，就写到能确认的层级禁止猜测机构信息；无法确认时明确写“未说明” 输出格式示例：第一作者：张三（清华大学计算机系）通讯作者：李四（Google DeepMind）作者列表：张三（清华大学计算机系）、李四（Google DeepMind）、王五（未说明）第一作者：Hyeongkeun Lee（韩国科学技术院， KAIST）通讯作者：未说明 ...

ICASSP 2026 - 音频效果估计论文列表

ICASSP 2026 - 音频效果估计共 1 篇论文 ← 返回 ICASSP 2026 总览排名论文评分分档 🥇 Audio Effect Estimation with DNN-Based Prediction and Search 7.0分前25% 📋 论文详情 🥇 Audio Effect Estimation with DNN-Based Prediction and Search Algorithm ✅ 7.0/10 | 前25% | #音频效果估计 | #深度神经网络 #优化算法 | #音乐信息检索 #深度神经网络 👥 作者与机构第一作者：Youichi Okita（关西学院大学理工学研究科）通讯作者：Haruhiro Katayose（关西学院大学工学部）作者列表：Youichi Okita（关西学院大学理工学研究科）、Haruhiro Katayose（关西学院大学工学部） 💡 毒舌点评这篇论文的亮点在于它优雅地模拟了人类音频工程师“先猜后调”的工作流程，将数据驱动的预测与基于信号相似度的搜索有机结合，实验证明这种“两阶段法”确实优于纯预测方法。短板在于其研究的问题场景（吉他效果链）相对垂直窄众，虽然方法论扎实，但能否推广到更复杂、更多样的现实音频处理场景（如流行音乐、混音工程）还有待验证，且未与该领域所有可能的最新方法进行对比。 🔗 开源详情代码：论文中未提及代码仓库链接。模型权重：未提及公开的模型权重。数据集：论文中提及使用了公开的吉他数据集（IDMT-SMT-Guitar， GuitarSet， EGDB， Guitar-TECHS），但用于生成湿信号的效果参数和生成脚本未提及是否公开。 Demo：提供了一个在线演示网站：https://okitayouichi.github.io/afx-pred-sch-demo/ 复现材料：论文提供了较为详细的训练超参数、网络架构描述和损失函数公式，但缺乏硬件配置、训练时长、以及完整的配置文件或检查点信息。论文中引用的开源项目：使用了pedalboard库（由Spotify开源）来生成数据，使用了Optuna框架来进行搜索算法实现。 📌 核心摘要 ...

ICASSP 2026 - 音频无损编码论文列表

ICASSP 2026 - 音频无损编码共 1 篇论文 ← 返回 ICASSP 2026 总览排名论文评分分档 🥇 LLAC: Learned Lossless Audio Codec 7.5分前25% 📋 论文详情 🥇 LLAC: Learned Lossless Audio Codec ✅ 7.5/10 | 前25% | #音频无损编码 | #生成模型 | #模型评估 👥 作者与机构第一作者：Khanh Quoc Dinh (Samsung Research, Korea) 通讯作者：未说明作者列表：Khanh Quoc Dinh (Samsung Research, Korea)， Liang Wen (Samsung R&D Institute China-Beijing, China)， Lizhong Wang (Samsung R&D Institute China-Beijing, China)， Kwang Pyo Choi (Samsung Research, Korea) 💡 毒舌点评 ...

ICASSP 2026 - 音频检索 #音频分类论文列表

ICASSP 2026 - 音频检索 #音频分类共 1 篇论文 ← 返回 ICASSP 2026 总览排名论文评分分档 🥇 Hashing-Baseline: Rethinking Hashing in the Age of Pretraine 8.0分前25% 📋 论文详情 🥇 Hashing-Baseline: Rethinking Hashing in the Age of Pretrained Models 🔥 8.0/10 | 前25% | #音频检索 #音频分类 | #预训练 | #音频检索 #图像检索 👥 作者与机构第一作者：未说明（论文作者列表顺序为并列贡献）通讯作者：未说明作者列表：Ilyass Moummad（INRIA, LIRMM, Université de Montpellier, France），Kawtar Zaher（INRIA, LIRMM, Université de Montpellier, France；Institut National de l’Audiovisuel, France），Lukas Rauch（University of Kassel, Germany），Alexis Joly（INRIA, LIRMM, Université de Montpellier, France） 💡 毒舌点评 ...