ICASSP 2026 - 音乐检索 论文列表

ICASSP 2026 - 音乐检索 共 3 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Controllable Embedding Transformation for Mood-Guided Music 7.5分 前25% 🥈 HarmoNet: Music Grounding by Short Video via Harmonic Resamp 7.0分 前25% 🥉 Hierarchical Tokenization of Multimodal Music Data for Gener 7.0分 前25% 📋 论文详情 🥇 Controllable Embedding Transformation for Mood-Guided Music Retrieval ✅ 7.5/10 | 前25% | #音乐检索 | #对比学习 | #音乐理解 #嵌入变换 👥 作者与机构 ...

2026-04-29

ICASSP 2026 - 音乐混合 论文列表

ICASSP 2026 - 音乐混合 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Ailive Mixer: A Deep Learning Based Zero Latency Automatic M 7.0分 前25% 📋 论文详情 🥇 Ailive Mixer: A Deep Learning Based Zero Latency Automatic Music Mixer for Live Music Performances ✅ 7.0/10 | 前25% | #音乐混合 | #深度学习 | #实时处理 #串音消除 👥 作者与机构 第一作者:Devansh Zurale(Shure Incorporated) 通讯作者:未说明 作者列表:Devansh Zurale(Shure Incorporated)、Iris Lorente(Shure Incorporated)、Michael Lester(Shure Incorporated)、Alex Mitchell(Shure Incorporated) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 音乐源分离 论文列表

ICASSP 2026 - 音乐源分离 共 2 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Dissecting Performance Degradation in Audio Source Separatio 7.5分 前25% 🥈 Bleed No More: Generative Interference Reduction for Musical 7.0分 前25% 📋 论文详情 🥇 Dissecting Performance Degradation in Audio Source Separation under Sampling Frequency Mismatch ✅ 7.5/10 | 前25% | #音乐源分离 | #信号处理 | #鲁棒性 #数据增强 👥 作者与机构 第一作者:Kanami Imamura (东京大学,日本产业技术综合研究所(AIST)) 通讯作者:未说明 作者列表:Kanami Imamura (东京大学,AIST)、Tomohiko Nakamura (AIST)、Kohei Yatabe (东京农工大学)、Hiroshi Saruwatari (东京大学) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 音乐源提取 论文列表

ICASSP 2026 - 音乐源提取 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 MC-MRX: Reference- and Midi-Guided Music Source Extraction w 7.0分 前25% 📋 论文详情 🥇 MC-MRX: Reference- and Midi-Guided Music Source Extraction with Contrastive Learning ✅ 7.0/10 | 前25% | #音乐源提取 | #对比学习 | #多任务学习 #音频引导 👥 作者与机构 第一作者:Xueyan Chen(University of Science and Technology Beijing, China) 通讯作者:Xinyuan Qian(University of Science and Technology Beijing, China) 作者列表:Xueyan Chen(University of Science and Technology Beijing, China)、Zexu Pan(Tongyi Lab, Alibaba Group, Singapore)、Ziyang Jiang(University of Science and Technology Beijing, China)、Jiadong Wang(Technical University of Munich, Germany)、Kainan Chen(Eigenspace GmbH, Germany)、Xinyuan Qian(University of Science and Technology Beijing, China) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 音乐理解 论文列表

ICASSP 2026 - 音乐理解 共 11 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Toward Robust And Efficient Beat Tracking Via Beat-Aware Att 8.5分 前25% 🥈 The Muse Benchmark: Probing Music Perception and Auditory Re 8.5分 前25% 🥉 Towards Effective Negation Modeling in Joint Audio-Text Mode 7.5分 前25% 4. Joint Estimation of Piano Dynamics and Metrical Structure wi 7.5分 前25% 5. Beat and Downbeat Detection: A Reformulated Approach 7.5分 前25% 6. TinyMU: A Compact Audio-Language Model for Music Understandi 7.5分 前25% 7. MIDI-LLaMA: An Instruction-Following Multimodal LLM for Symb 7.5分 前10% 8. Interpretable Music Harmonic Analysis Through Multilinear Mi 7.5分 前25% 9. Exploring How Audio Effects Alter Emotion with Foundation Mo 7.0分 前50% 10. A Bayesian Approach to Singing Skill Evaluation Using Semito 7.0分 前25% 11. Rethinking Music Captioning with Music Metadata LLMS 7.0分 前25% 📋 论文详情 🥇 Toward Robust And Efficient Beat Tracking Via Beat-Aware Attention 🔥 8.5/10 | 前25% | #音乐理解 | #注意力机制 | #端到端 #鲁棒性 ...

2026-04-29

ICASSP 2026 - 音乐生成 论文列表

ICASSP 2026 - 音乐生成 共 31 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 MuseTok: Symbolic Music Tokenization for Generation and Sema 8.5分 前25% 🥈 Time-Shifted Token Scheduling for Symbolic Music Generation 8.5分 前25% 🥉 Low-Resource Guidance for Controllable Latent Audio Diffusio 8.5分 前25% 4. A Generative-First Neural Audio Autoencoder 8.5分 前25% 5. Virtual Consistency for Audio Editing 8.0分 前25% 6. AnyAccomp: Generalizable Accompaniment Generation Via Quanti 8.0分 前25% 7. Stemphonic: All-At-Once Flexible Multi-Stem Music Generation 7.7分 前25% 8. MR-FlowDPO: Multi-Reward Direct Preference Optimization for 7.5分 前25% 9. Via Score to Performance: Efficient Human-Controllable Long 7.5分 前25% 10. Automatic Music Mixing Using a Generative Model of Effect Em 7.5分 前25% 11. Sing2Song: An Accompaniment Generation System Based on Solo 7.5分 前25% 12. Differentiable Pulsetable Synthesis for Wind Instrument Mode 7.5分 前25% 13. Compression meets Sampling: LZ78-SPA for Efficient Symbolic 7.5分 前25% 14. Break-the-Beat! Controllable MIDI-to-Drum audio synthesis 7.5分 前25% 15. Text2midi-InferAlign: Improving Symbolic Music Generation wi 7.5分 前25% 16. Diffusion Timbre Transfer via Mutual Information Guided Inpa 7.5分 前25% 17. D3PIA: A Discrete Denoising Diffusion Model for Piano Accomp 7.5分 前25% 18. Evaluating Disentangled Representations for Controllable Mus 7.5分 前25% 19. Aligning Language Models for Lyric-to-Melody Generation with 7.5分 前25% 20. FUSEMOS: Perceptual Evaluation of Text-to-Music Generation w 7.5分 前25% 21. Fine-Tuning Bigvgan-V2 for Robust Musical Tuning Preservatio 7.5分 前25% 22. Visual Keys to Symphonies: Latent Diffusion for Multi-Scene 7.5分 前25% 23. VMSP: Video-to-Music Generation with Two-Stage Alignment and 7.0分 前25% 24. Etude: Piano Cover Generation with a Three-Stage Approach — 7.0分 前25% 25. Towards Multi-View Hierarchical Video-to-Piano Generation wi 7.0分 前25% 26. ViTex: Visual Texture Control for Multi-Track Symbolic Music 7.0分 前50% 27. Instrument Generation Through Distributional Flow Matching a 7.0分 前25% 28. When Noise Lowers the Loss: Rethinking Likelihood-Based Eval 7.0分 前25% 29. Symphony Rendering: Midi and Composer-Conditioned Auto Orche 7.0分 前50% 30. Pianoroll-Event: A Novel Score Representation for Symbolic M 6.5分 前25% 31. Melos: Sentence-To-Section Training with Multi-Task Learning 6.5分 前50% 📋 论文详情 🥇 MuseTok: Symbolic Music Tokenization for Generation and Semantic Understanding 🔥 8.5/10 | 前25% | #音乐生成 | #预训练 | #音乐理解 #数据集 ...

2026-04-29

ICASSP 2026 - 音乐转录 论文列表

ICASSP 2026 - 音乐转录 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 A Distribution Matching Approach to Neural Piano Transcripti 7.0分 前25% 📋 论文详情 🥇 A Distribution Matching Approach to Neural Piano Transcription with Optimal Transport ✅ 7.0/10 | 前25% | #音乐转录 | #最优传输 | #注意力机制 #循环神经网络 👥 作者与机构 第一作者:Weixing Wei(京都大学信息学研究生院) 通讯作者:未说明 作者列表:Weixing Wei(京都大学信息学研究生院)、Raynaldi Lalang(京都大学工程研究生院)、Dichucheng Li(独立研究者)、Kazuyoshi Yoshii(京都大学工程研究生院) 💡 毒舌点评 亮点是跳出了传统BCE损失“对齐即全对,错一位全错”的思维定式,用OT损失来容忍合理的时间偏差,理论上更优雅且实验效果显著。短板在于论文对OT损失计算复杂度的讨论几乎空白,且将钢琴转录中复杂的踏板问题简单归因于offset不准,未来提升路径仍需更扎实的论证。 🔗 开源详情 代码:论文在“Repo:”处提供了一个GitHub仓库链接(https://github.com/WX-Wei/AMT-optimal-transport),但论文正文中未描述该仓库的具体内容(如是否包含完整代码、模型权重、训练脚本等),因此其实际开放性和完整性未知。 模型权重:未提及。 数据集:MAESTRO为公开数据集,但论文中未说明如何获取或处理的具体细节。 Demo:未提及。 复现材料:论文中提到了一些关键训练细节(数据集分割、CQT参数、优化器),但缺少batch size、具体epoch数、硬件信息等关键复现参数。 论文中引用的开源项目:提到了mir_eval库用于评估。 📌 核心摘要 ...

2026-04-29

ICASSP 2026 - 音视频 论文列表

ICASSP 2026 - 音视频 共 6 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Uncertainty-Aware 3D Emotional Talking Face Synthesis with E 8.0分 前25% 🥈 RAP: Real-Time Audio-Driven Portrait Animation with Video Di 7.0分 前25% 🥉 Attentive AV-Fusionnet: Audio-Visual Quality Prediction with 7.0分 前25% 4. Look, Listen and Segment: Towards Weakly Supervised Audio-Vi 7.0分 前25% 5. Teacher-Guided Pseudo Supervision and Cross-Modal Alignment 7.0分 前25% 6. AVO-65: A Large-Scale Hierarchical Audio-Visual Object Datas 7.0分 前50% 📋 论文详情 🥇 Uncertainty-Aware 3D Emotional Talking Face Synthesis with Emotion Prior Distillation 🔥 8.0/10 | 前25% | #音视频 | #生成模型 | #不确定性估计 #多模态模型 ...

2026-04-29

ICASSP 2026 - 音视频实例分割 论文列表

ICASSP 2026 - 音视频实例分割 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Learning What to Hear: Boosting Sound-Source Association for 7.5分 前25% 📋 论文详情 🥇 Learning What to Hear: Boosting Sound-Source Association for Robust Audiovisual Instance Segmentation ✅ 7.5/10 | 前25% | #音视频实例分割 | #查询学习 | #多模态模型 #注意力机制 👥 作者与机构 第一作者:Jinbae Seo(Yonsei University) 通讯作者:Jiyoung Lee(School of AI and Software, Ewha Womans University),Kwanghoon Sohn(Yonsei University, Korea Institute of Science and Technology (KIST)) 作者列表:Jinbae Seo(Yonsei University)、Hyeongjun Kwon(Yonsei University)、Kwonyoung Kim(Yonsei University)、Jiyoung Lee(Ewha Womans University)、Kwanghoon Sohn(Yonsei University & KIST) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 音频事件检测 论文列表

ICASSP 2026 - 音频事件检测 共 21 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Shared Representation Learning for Reference-Guided Targeted 8.5分 前25% 🥈 Temporally Heterogeneous Graph Contrastive Learning for Mult 8.5分 前25% 🥉 More Than a Shortcut: A Hyperbolic Approach to Early-Exit Ne 8.0分 前25% 4. HAVT-IVD: Heterogeneity-Aware Cross-Modal Network for Audio- 8.0分 前25% 5. DBFT-SD: Weakly Supervised Multimodal Detection of Sensitive 8.0分 前25% 6. Event Classification by Physics-Informed Inpainting for Dist 8.0分 前25% 7. USVexplorer: Robust Detection of Ultrasonic Vocalizations wi 8.0分 前25% 8. Improving Anomalous Sound Detection with Attribute-Aware Rep 8.0分 前10% 9. Toward Faithful Explanations in Acoustic Anomaly Detection 7.5分 前25% 10. Task-Oriented Sound Privacy Preservation for Sound Event Det 7.5分 前25% 11. A Task-Aware Dual-Level Self-Supervised Learning Method for 7.5分 前25% 12. Triad: Tri-Head with Auxiliary Duplicating Permutation Invar 7.5分 前25% 13. Hierarchical Activity Recognition and Captioning from Long-F 7.5分 前25% 14. Refgen: Reference-Guided Synthetic Data Generation for Anoma 7.5分 前25% 15. Tldiffgan: A Latent Diffusion-Gan Framework with Temporal In 7.5分 前25% 16. SONAR: Self-Distilled Continual Pre-Training for Domain Adap 7.0分 前25% 17. Improving Audio Event Recognition with Consistency Regulariz 7.0分 前25% 18. SELD-MOHA: A Fine-Tuning Method with the Mixture of Heteroge 7.0分 前25% 19. Influence-Aware Curation and Active Selection for Industrial 7.0分 前50% 20. Phase-Space Signal Processing of Acoustic Data for Advanced 7.0分 前50% 21. Fine-Tuning Large Audio-Language Models with Lora for Precis 6.5分 前50% 📋 论文详情 🥇 Shared Representation Learning for Reference-Guided Targeted Sound Detection 🔥 8.5/10 | 前25% | #音频事件检测 | #多任务学习 | #预训练 #音频检索 ...

2026-04-29