ICASSP 2026 - 零样本关键词检测 论文列表

ICASSP 2026 - 零样本关键词检测 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Malefa: Multi-Granularity Learning and Effective False Alarm 7.5分 前25% 📋 论文详情 🥇 Malefa: Multi-Granularity Learning and Effective False Alarm Suppression for Zero-Shot Keyword Spotting ✅ 7.5/10 | 前25% | #零样本关键词检测 | #对比学习 #多任务学习 | #对比学习 #多任务学习 👥 作者与机构 第一作者:Lo-Ya Li(台湾师范大学,标记为*) 通讯作者:未明确说明(根据贡献描述和标记,Berlin Chen(*)和Jeih-Weih Hung(†)可能为主要指导者) 作者列表:Lo-Ya Li(台湾师范大学),Tien-Hong Lo(台湾师范大学),Jeih-Weih Hung†(暨南国际大学),Shih-Chieh Huang¶(瑞昱半导体),Berlin Chen*(台湾师范大学) 💡 毒舌点评 这篇论文的亮点在于它没有盲目追求模型规模,而是用轻量级架构(0.7M参数)通过更精细的学习目标(音素级对齐+误报惩罚)在核心指标(特别是误报率)上实现了数量级的改进,这对实际部署极具吸引力。短板是其创新主要是现有技术(CTC、对比学习、注意力机制)的工程化组合,在模型架构原理上缺乏颠覆性,且实验仅限于特定的英文数据集,其泛化能力(如跨语言、复杂声学场景)有待进一步证明。 🔗 开源详情 ...

2026-04-29 · 更新于 2026-05-22 · 1 min · 105 words

ICASSP 2026 - 音乐信息检索 论文列表

ICASSP 2026 - 音乐信息检索 共 26 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Noise-to-Notes: Diffusion-Based Generation and Refinement fo 8.0分 前10% 🥈 Leveraging Diffusion U-Net Features for Predominant Instrume 8.0分 前25% 🥉 Subsequence SDTW: Differentiable Alignment with Flexible Bou 8.0分 前25% 4. A Unsupervised Domain Adaptation Framework For Semi-Supervis 8.0分 前25% 5. Evaluating High-Resolution Piano Sustain Pedal Depth Estimat 8.0分 前25% 6. Improving Active Learning for Melody Estimation by Disentang 7.5分 前25% 7. Temporal Distillation for Music Representation Learning 7.5分 前25% 8. Constructing Composite Features for Interpretable Music-Tagg 7.5分 前25% 9. Audio-to-Score Jazz Solo Transcription with the Rhythm Perce 7.5分 前25% 10. Benchmarking Music Autotagging with MGPHot Expert Annotation 7.5分 前25% 11. BeatMamba: Bidirectional Selective State-Space Modeling for 7.5分 前25% 12. Spectrogram Event Based Feature Representation for Generaliz 7.5分 前25% 13. BACHI: Boundary-Aware Symbolic Chord Recognition Through Mas 7.5分 前25% 14. An Event-Based Sequence Modeling Approach to Recognizing Non 7.5分 前25% 15. Off-The-Grid Multi-Pitch Estimation Using Optimal Transport 7.5分 前25% 16. RMODGDF: A Robust STFT-Derived Feature for Musical Instrumen 7.0分 前50% 17. SAUNA: Song-Level Audio & User-Listening Data Neural Alignme 7.0分 前25% 18. Timbre-Based Pretraining with Pseudo-Labels for Multi-Instru 7.0分 前25% 19. Towards Blind Data Cleaning: A Case Study in Music Source Se 7.0分 前50% 20. Do Foundational Audio Encoders Understand Music Structure? 7.0分 前25% 21. Sing What You Fit: A Perception-Based Dataset and Benchmark 7.0分 前25% 22. Single-Step Controllable Music Bandwidth extension with Flow 7.0分 前25% 23. Leveraging Whisper Embeddings For Audio-Based Lyrics Matchin 7.0分 前50% 24. Enhancing Automatic Drum Transcription with Online Dynamic F 7.0分 前25% 25. ALMA-Chor: Leveraging Audio-Lyric Alignment with Mamba for C 7.0分 前25% 26. Vioptt: Violin Technique-Aware Transcription from Synthetic 6.5分 前50% 📋 论文详情 🥇 Noise-to-Notes: Diffusion-Based Generation and Refinement for Automatic Drum Transcription 🔥 8.0/10 | 前10% | #音乐信息检索 | #扩散模型 | #生成模型 #鲁棒性 ...

2026-04-29 · 更新于 2026-05-22 · 17 min · 3478 words

ICASSP 2026 - 音乐分离 论文列表

ICASSP 2026 - 音乐分离 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Separate this, and all of these Things Around It: Music Sour 7.0分 前25% 📋 论文详情 🥇 Separate this, and all of these Things Around It: Music Source Separation Via Hyperellipsoidal Queries ✅ 7.0/10 | 前25% | #音乐分离 | #音频检索 | #零样本 #少样本 👥 作者与机构 第一作者:Karn N. Watcharasupat(佐治亚理工学院音乐信息学组) 通讯作者:未说明 作者列表:Karn N. Watcharasupat(佐治亚理工学院音乐信息学组)、Alexander Lerch(佐治亚理工学院音乐信息学组) 💡 毒舌点评 ...

2026-04-29 · 更新于 2026-05-22 · 1 min · 99 words

ICASSP 2026 - 音乐分类 论文列表

ICASSP 2026 - 音乐分类 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Adversarial Rivalry Learning for Music Classification 6.5分 前25% 📋 论文详情 🥇 Adversarial Rivalry Learning for Music Classification ✅ 6.5/10 | 前25% | #音乐分类 | #对抗学习 | #音乐信息检索 #注意力机制 👥 作者与机构 第一作者:Yi-Xing Lin(中央研究院 资讯科学研究所) 通讯作者:未说明 作者列表:Yi-Xing Lin(中央研究院 资讯科学研究所)、Wen-Li Wei(中央研究院 资讯科学研究所)、Jen-Chun Lin(中央研究院 资讯科学研究所) 💡 毒舌点评 本文巧妙地将复杂的“反事实推理”优化问题,转化为两个注意力分支之间更直观的“对抗赛跑”,有效简化了超参调优,是LCA方法的一次有价值的工程化精简。然而,论文仅在几个标准音乐数据集上进行了验证,未能在更具挑战性的多模态或跨领域任务中展示其通用性,且完全未开源代码,使得这一“简单有效”的范式难以被社区快速接纳和验证。 🔗 开源详情 代码:论文中未提及代码链接。 模型权重:未提及公开权重。 数据集:使用了公开数据集(Artist20, EMOPIA, FMA, GTZAN),但未说明是否提供处理后的版本或获取指南。 Demo:未提及在线演示。 复现材料:论文给出了算法伪代码(Algorithm 1)和部分训练超参数(如学习率、早停步数),但未提供完整的训练配置、环境依赖、检查点或附录的详细说明。核心复现材料(代码)缺失。 引用的开源项目:论文提到了作为骨干模型的MERT,以及用于对比的genreMERT、Short-chunk ResNet、M2D、AST-Fusion等模型,但未明确说明是否依赖或整合了这些模型的开源实现。 📌 核心摘要 ...

2026-04-29 · 更新于 2026-05-22 · 1 min · 181 words

ICASSP 2026 - 音乐推荐 论文列表

ICASSP 2026 - 音乐推荐 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 MusiCRS: Benchmarking Audio-Centric Conversational Recommend 7.5分 前25% 📋 论文详情 🥇 MusiCRS: Benchmarking Audio-Centric Conversational Recommendation ✅ 7.5/10 | 前25% | #音乐推荐 | #多模态模型 | #基准测试 #音频检索 👥 作者与机构 第一作者:未说明(作者列表无顺序指示) 通讯作者:未说明 作者列表:Rohan Surana(University of California, San Diego, USA)、Amit Namburi(University of California, San Diego, USA)、Gagan Mundada(University of California, San Diego, USA)、Abhay Lal(University of California, San Diego, USA)、Zachary Novack(University of California, San Diego, USA)、Julian McAuley(University of California, San Diego, USA)、Junda Wu(University of California, San Diego, USA) 💡 毒舌点评 ...

2026-04-29 · 更新于 2026-05-22 · 1 min · 167 words

ICASSP 2026 - 音乐检索 论文列表

ICASSP 2026 - 音乐检索 共 3 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Controllable Embedding Transformation for Mood-Guided Music 7.5分 前25% 🥈 HarmoNet: Music Grounding by Short Video via Harmonic Resamp 7.0分 前25% 🥉 Hierarchical Tokenization of Multimodal Music Data for Gener 7.0分 前25% 📋 论文详情 🥇 Controllable Embedding Transformation for Mood-Guided Music Retrieval ✅ 7.5/10 | 前25% | #音乐检索 | #对比学习 | #音乐理解 #嵌入变换 👥 作者与机构 ...

2026-04-29 · 更新于 2026-05-22 · 2 min · 355 words

ICASSP 2026 - 音乐混合 论文列表

ICASSP 2026 - 音乐混合 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Ailive Mixer: A Deep Learning Based Zero Latency Automatic M 7.0分 前25% 📋 论文详情 🥇 Ailive Mixer: A Deep Learning Based Zero Latency Automatic Music Mixer for Live Music Performances ✅ 7.0/10 | 前25% | #音乐混合 | #深度学习 | #实时处理 #串音消除 👥 作者与机构 第一作者:Devansh Zurale(Shure Incorporated) 通讯作者:未说明 作者列表:Devansh Zurale(Shure Incorporated)、Iris Lorente(Shure Incorporated)、Michael Lester(Shure Incorporated)、Alex Mitchell(Shure Incorporated) 💡 毒舌点评 ...

2026-04-29 · 更新于 2026-05-22 · 1 min · 100 words

ICASSP 2026 - 音乐源分离 论文列表

ICASSP 2026 - 音乐源分离 共 2 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Dissecting Performance Degradation in Audio Source Separatio 7.5分 前25% 🥈 Bleed No More: Generative Interference Reduction for Musical 7.0分 前25% 📋 论文详情 🥇 Dissecting Performance Degradation in Audio Source Separation under Sampling Frequency Mismatch ✅ 7.5/10 | 前25% | #音乐源分离 | #信号处理 | #鲁棒性 #数据增强 👥 作者与机构 第一作者:Kanami Imamura (东京大学,日本产业技术综合研究所(AIST)) 通讯作者:未说明 作者列表:Kanami Imamura (东京大学,AIST)、Tomohiko Nakamura (AIST)、Kohei Yatabe (东京农工大学)、Hiroshi Saruwatari (东京大学) 💡 毒舌点评 ...

2026-04-29 · 更新于 2026-05-22 · 2 min · 242 words

ICASSP 2026 - 音乐源提取 论文列表

ICASSP 2026 - 音乐源提取 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 MC-MRX: Reference- and Midi-Guided Music Source Extraction w 7.0分 前25% 📋 论文详情 🥇 MC-MRX: Reference- and Midi-Guided Music Source Extraction with Contrastive Learning ✅ 7.0/10 | 前25% | #音乐源提取 | #对比学习 | #多任务学习 #音频引导 👥 作者与机构 第一作者:Xueyan Chen(University of Science and Technology Beijing, China) 通讯作者:Xinyuan Qian(University of Science and Technology Beijing, China) 作者列表:Xueyan Chen(University of Science and Technology Beijing, China)、Zexu Pan(Tongyi Lab, Alibaba Group, Singapore)、Ziyang Jiang(University of Science and Technology Beijing, China)、Jiadong Wang(Technical University of Munich, Germany)、Kainan Chen(Eigenspace GmbH, Germany)、Xinyuan Qian(University of Science and Technology Beijing, China) 💡 毒舌点评 ...

2026-04-29 · 更新于 2026-05-22 · 1 min · 134 words

ICASSP 2026 - 音乐理解 论文列表

ICASSP 2026 - 音乐理解 共 11 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Toward Robust And Efficient Beat Tracking Via Beat-Aware Att 8.5分 前25% 🥈 The Muse Benchmark: Probing Music Perception and Auditory Re 8.5分 前25% 🥉 Towards Effective Negation Modeling in Joint Audio-Text Mode 7.5分 前25% 4. Joint Estimation of Piano Dynamics and Metrical Structure wi 7.5分 前25% 5. Beat and Downbeat Detection: A Reformulated Approach 7.5分 前25% 6. TinyMU: A Compact Audio-Language Model for Music Understandi 7.5分 前25% 7. MIDI-LLaMA: An Instruction-Following Multimodal LLM for Symb 7.5分 前10% 8. Interpretable Music Harmonic Analysis Through Multilinear Mi 7.5分 前25% 9. Exploring How Audio Effects Alter Emotion with Foundation Mo 7.0分 前50% 10. A Bayesian Approach to Singing Skill Evaluation Using Semito 7.0分 前25% 11. Rethinking Music Captioning with Music Metadata LLMS 7.0分 前25% 📋 论文详情 🥇 Toward Robust And Efficient Beat Tracking Via Beat-Aware Attention 🔥 8.5/10 | 前25% | #音乐理解 | #注意力机制 | #端到端 #鲁棒性 ...

2026-04-29 · 更新于 2026-05-22 · 7 min · 1392 words