ICASSP 2026 - 医疗AI 论文列表

ICASSP 2026 - 医疗AI 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 SpeechCT-CLIP: Distilling Text-Image Knowledge to Speech for 7.5分 前25% 📋 论文详情 🥇 SpeechCT-CLIP: Distilling Text-Image Knowledge to Speech for Voice-Native Multimodal CT Analysis ✅ 7.5/10 | 前25% | #医疗AI | #知识蒸馏 | #多模态模型 #对比学习 👥 作者与机构 第一作者:Lukas Buess(弗里德里希-亚历山大大学埃尔朗根-纽伦堡分校,模式识别实验室) 通讯作者:Lukas Buess (Lukas.Buess@fau.de)(弗里德里希-亚历山大大学埃尔朗根-纽伦堡分校,模式识别实验室) 作者列表:Lukas Buess(弗里德里希-亚历山大大学埃尔朗根-纽伦堡分校,模式识别实验室),Jan Geier(弗里德里希-亚历山大大学埃尔朗根-纽伦堡分校,模式识别实验室),David Bani-Harouni(慕尼黑工业大学,计算机辅助医疗程序组),Chantal Pellegrini(慕尼黑工业大学,计算机辅助医疗程序组),Matthias Keicher(慕尼黑工业大学,计算机辅助医疗程序组),Paula Andrea Perez-Toro(弗里德里希-亚历山大大学埃尔朗根-纽伦堡分校,模式识别实验室),Nassir Navab(慕尼黑工业大学,计算机辅助医疗程序组),Andreas Maier(弗里德里希-亚历山大大学埃尔朗根-纽伦堡分校,模式识别实验室),Tomas Arias-Vergara(弗里德里希-亚历山大大学埃尔朗根-纽伦堡分校,模式识别实验室) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 听觉注意力解码 论文列表

ICASSP 2026 - 听觉注意力解码 共 2 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Multi-Scale Physiologically-Motivated Alignment for Auditory 7.5分 前25% 🥈 FD-ARL: Feature Disentanglement with Adversarial-Reconstruct 7.5分 前10% 📋 论文详情 🥇 Multi-Scale Physiologically-Motivated Alignment for Auditory Attention Decoding ✅ 7.5/10 | 前25% | #听觉注意力解码 | #对比学习 | #生物声学 #自监督学习 👥 作者与机构 第一作者:Yuxuan Ma(华东师范大学计算机科学与技术学院, 丹麦技术大学) 通讯作者:Jun Xue(武汉大学网络空间安全学院); Jinqiu Sang(华东师范大学计算机科学与技术学院) 作者列表: Yuxuan Ma†(华东师范大学计算机科学与技术学院, 丹麦技术大学) Xiaoke Yang†(安徽大学计算机科学与技术学院) Tongxi Chen(丹麦技术大学) Jun Xue*(武汉大学网络空间安全学院) Jinqiu Sang*(华东师范大学计算机科学与技术学院) (注:†表示共同第一作者,*表示通讯作者) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 听觉注意解码 论文列表

ICASSP 2026 - 听觉注意解码 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Efficient Solutions for Mitigating Initialization Bias in Un 8.5分 前25% 📋 论文详情 🥇 Efficient Solutions for Mitigating Initialization Bias in Unsupervised Self-Adaptive Auditory Attention Decoding 🔥 8.5/10 | 前25% | #听觉注意解码 | #自监督学习 | #脑电图 #信号处理 👥 作者与机构 第一作者:Yuanyuan Yao (KU Leuven, Department of Electrical Engineering (ESAT), STADIUS Center for Dynamical Systems, Signal Processing and Data Analytics) 通讯作者:未说明 作者列表:Yuanyuan Yao (KU Leuven, ESAT-STADIUS), Simon Geirnaert (KU Leuven, ESAT-STADIUS; KU Leuven, Department of Neurosciences, ExpORL), Tinne Tuytelaars (KU Leuven, ESAT-PSI), Alexander Bertrand (KU Leuven, ESAT-STADIUS) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 噪声控制 论文列表

ICASSP 2026 - 噪声控制 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 A Noval Monte Carlo Gradient Method Based on Meta-Learning f 6.5分 前50% 📋 论文详情 🥇 A Noval Monte Carlo Gradient Method Based on Meta-Learning for Effective Step-Size Selection in Active Noise Control ✅ 6.5/10 | 前50% | #噪声控制 | #元学习 | #信号处理 #自适应滤波器 👥 作者与机构 第一作者:Luyuan Li(西北工业大学 智能声学与沉浸式通信中心) 通讯作者:未明确说明(根据惯例,可能为通讯单位NTU的Woon-seng Gan,但论文中未明确标注) 作者列表:Luyuan Li(西北工业大学)、Jisheng Bai(西安邮电大学 通信与信息工程学院)、Xiruo Su(浙江大学 网络多媒体技术浙江省重点实验室)、Xiaoyi Shen(中国科学院声学研究所 声学与海洋信息国家重点实验室)、Dongyuan Shi(西北工业大学)、Woon-seng Gan(南洋理工大学 电气与电子工程学院) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 回声消除 论文列表

ICASSP 2026 - 回声消除 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Maximum Likelihood Measurement Noise Estimation for Block-Ti 7.0分 前50% 📋 论文详情 🥇 Maximum Likelihood Measurement Noise Estimation for Block-Time Domain Kalman Filters ✅ 7.0/10 | 前50% | #回声消除 | #信号处理 #卡尔曼滤波器 | #信号处理 #卡尔曼滤波器 👥 作者与机构 第一作者:Till Hardenbicker (RWTH Aachen University, Institute of Communication Systems) 通讯作者:Till Hardenbicker (邮箱: hardenbicker@iks.rwth-aachen.de) 作者列表:Till Hardenbicker (RWTH Aachen University, Institute of Communication Systems)、Jan Schneider (RWTH Aachen University, Institute of Communication Systems,推测同单位)、Peter Jax (RWTH Aachen University, Institute of Communication Systems,推测同单位) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 基准测试 论文列表

ICASSP 2026 - 基准测试 共 5 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 StyleBench: Evaluating Speech Language Models on Conversatio 8.5分 前25% 🥈 LongSpeech: A Scalable Benchmark for Transcription, Translat 7.8分 前25% 🥉 Savgbench: Benchmarking Spatially Aligned Audio-Video Genera 7.5分 前50% 4. Streamingbench: Assessing the Gap for MLLMs to Achieve Strea 7.5分 前25% 5. Can Large Audio Language Models Understand Audio Well? Speec 7.0分 前25% 📋 论文详情 🥇 StyleBench: Evaluating Speech Language Models on Conversational Speaking Style Control 🔥 8.5/10 | 前25% | #基准测试 | #模型评估 | #语音大模型 #语音情感识别 ...

2026-04-29

ICASSP 2026 - 基频估计 论文列表

ICASSP 2026 - 基频估计 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Robust and Lightweight F0 Estimation Through Mid-Level Fusio 8.0分 前25% 📋 论文详情 🥇 Robust and Lightweight F0 Estimation Through Mid-Level Fusion of DSP-Informed Features 🔥 8.0/10 | 前25% | #基频估计 | #信号处理 | #模型融合 #鲁棒性 👥 作者与机构 第一作者:Sebastian Strahl(International Audio Laboratories Erlangen) 通讯作者:未明确说明(论文未明确标注通讯作者,但通常由资深作者Meinard Müller负责) 作者列表:Sebastian Strahl(International Audio Laboratories Erlangen)、Meinard Müller(International Audio Laboratories Erlangen) 机构信息:International Audio Laboratories Erlangen(由Friedrich-Alexander-Universität Erlangen-Nürnberg (FAU) 与 Fraunhofer Institute for Integrated Circuits IIS 联合设立) 💡 毒舌点评 ...

2026-04-29

ICASSP 2026 - 声场估计 论文列表

ICASSP 2026 - 声场估计 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Group-Sparse Gaussian Process Regression for Inhomogeneous S 7.5分 前25% 📋 论文详情 🥇 Group-Sparse Gaussian Process Regression for Inhomogeneous Sound Field Estimation ✅ 7.5/10 | 前25% | #声场估计 | #高斯过程回归 | #麦克风阵列 #稀疏优化 👥 作者与机构 第一作者:Ryo Matsuda(京都大学工学部) 通讯作者:Makoto Otani(京都大学工学部) 作者列表:Ryo Matsuda(京都大学工学部)、Makoto Otani(京都大学工学部) 💡 毒舌点评 这篇论文在传统声场估计框架下做出了扎实的改进,亮点在于巧妙地将群稀疏约束引入高斯过程回归核权重优化,摆脱了对先验声源位置的依赖,并在仿真中取得了显著的性能提升。然而,其短板在于实验部分过于理想化(无回声、二维平面),缺乏对实际复杂声学环境(如混响、三维空间)的验证,且未提供任何开源代码,这使得其提出的方法在实际应用中的鲁棒性和可复现性存疑。 🔗 开源详情 代码:论文中未提及代码链接或开源仓库。 模型权重:未提及。 数据集:实验为数值仿真生成,未提供生成代码或具体数据。 Demo:未提供在线演示。 复现材料:论文给出了部分实验设置(如麦克风数量、区域大小、频率范围、噪声模型、部分超参数范围),但关键训练细节(如优化器停止准则、ν_tr的具体计算公式、ζ的最终取值)不充分,难以完全复现。 论文中引用的开源项目:论文引用的文献中,[18] (Koyama & Daudet, 2019) 的算法被用于基线实现,但未说明是否使用其开源代码。论文本身未明确列出依赖的开源工具。 结论:论文中未提及开源计划。 ...

2026-04-29

ICASSP 2026 - 声学建模 论文列表

ICASSP 2026 - 声学建模 共 1 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Solving the Helmholtz Equation Via Physics-Informed Neural N 6.5分 前50% 📋 论文详情 🥇 Solving the Helmholtz Equation Via Physics-Informed Neural Networks with an Adaptive Weighting Strategy ✅ 6.5/10 | 前50% | #声学建模 | #物理信息神经网络 | #自适应学习 👥 作者与机构 第一作者:Yanan Guo(国防科技大学气象与海洋学院) 通讯作者:未说明 作者列表:Yanan Guo(国防科技大学气象与海洋学院),Junqiang Song(国防科技大学气象与海洋学院),Xiaoqun Cao(国防科技大学气象与海洋学院),Hongze Leng(国防科技大学气象与海洋学院) 💡 毒舌点评 论文的核心动机——解决PINN训练中多损失项收敛速率不平衡的问题——是真实且重要的,提出的“逆残差衰减率”权重机制在理论上具有吸引力。然而,其验证过程显得过于“温室化”,仅用两个低维、规则、解析解已知的“玩具问题”就宣称方法有效,缺乏对高频波、复杂几何或实际噪声数据等更具挑战性场景的拷问,大大削弱了其声称的普适性和鲁棒性,读起来更像一个初步的概念验证而非完整的解决方案。 🔗 开源详情 代码:论文中未提及代码链接。 模型权重:未提及。 数据集:未提及(论文使用自构造的合成数据)。 Demo:未提及。 复现材料:论文描述了网络架构(层数、神经元数、激活函数)、优化器(Adam)、学习率(三维为0.001)、训练步数(三维为20k)。但核心的自适应参数(如β_w, β_s, ε)的具体值、损失函数中γ^R/γ^B的取值、采样策略等细节未充分提供。 论文中引用的开源项目:未提及依赖的特定开源工具或模型。 论文中未提及开源计划。 📌 核心摘要 ...

2026-04-29

ICASSP 2026 - 声源定位 论文列表

ICASSP 2026 - 声源定位 共 15 篇论文 ← 返回 ICASSP 2026 总览 排名 论文 评分 分档 🥇 Bridging the Measurement–Simulation Gap in Room Acoustics wi 8.5分 前25% 🥈 DSRMS-TransUnet: A Decentralized Non-Shifted Transunet for S 8.0分 前10% 🥉 FUN-SSL: Full-Band Layer Followed by U-Net With Narrow-Band 8.0分 前25% 4. Atomic Norm Minimization Revisited: Progressive Atom Identif 7.5分 前25% 5. Physics-Informed Neural Networks for Ocean Acoustic Field Re 7.5分 前25% 6. Theory and Application of Circular Relative Harmonic Coeffic 7.5分 前25% 7. Sequential and Simultaneous Optimization of Microphone Array 7.5分 前25% 8. Spiking Attention Network: A Hybrid Neuromorphic Approach to 7.0分 前25% 9. SIRUP: A Diffusion-Based Virtual Upmixer of Steering Vectors 7.0分 前25% 10. Phase-Retrieval-Based Physics-Informed Neural Networks For A 7.0分 前50% 11. Microphone-Less Measurement of Three-Dimensional Radiating I 7.0分 前25% 12. Improving Binaural Distance Estimation in Reverberant Rooms 7.0分 前25% 13. A Unified SVD-Modal Solution for Sparse Sound Field Reconstr 6.5分 前25% 14. An Envelope Separation Aided Multi-Task Learning Model for B 6.5分 前25% 15. Adaptive Spectral Weighting in Sagittal-Plane Sound Localiza 6.5分 前25% 📋 论文详情 🥇 Bridging the Measurement–Simulation Gap in Room Acoustics with Real2sim Diffusion 🔥 8.5/10 | 前25% | #声源定位 | #扩散模型 | #麦克风阵列 #信号处理 ...

2026-04-29