Adaptive Spectral Weighting in Sagittal-Plane Sound Localization: A Reliability-Driven Approach

📄 Adaptive Spectral Weighting in Sagittal-Plane Sound Localization: A Reliability-Driven Approach #声源定位 #贝叶斯推理 #信号处理 #空间音频 #模型评估 ✅ 6.5/10 | 前25% | #声源定位 | #贝叶斯推理 | #信号处理 #空间音频 学术质量 5.5/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度 中 👥 作者与机构 第一作者:Yunda Chen 通讯作者:Nengheng Zheng (nhzheng@szu.edu.cn) 作者列表:Yunda Chen, Hui Zeng, Nengheng Zheng*(深圳大学,电子信息工程学院) 💡 毒舌点评 这篇论文的亮点在于它承认并试图建模听觉感知中“动态权重调整”这一人性化但常被忽视的特性,提出的自适应加权方案在理论上更具生物合理性。但短板也明显:其验证场景主要是基于降质的合成听觉条件(如声码器处理),这更像是证明模型在特定退化下的鲁棒性,而非证明自适应机制在自然复杂环境下的普适优越性,因此结论的外推性有待商榷。 📌 核心摘要 解决什么问题:现有矢状面(上下方向)声源定位模型多采用固定的频谱加权方案,忽略了人类听觉系统会根据输入信号的可靠性动态调整不同频段贡献的这一事实,尤其是在感知线索退化的条件下。 方法核心是什么:提出了一种基于贝叶斯推理的计算模型。核心创新是引入了一种自适应频谱加权方案,该方案能根据主导频谱凹陷区域(6-9kHz)的可靠性(用频谱互相关ρ衡量)动态调整权重。模型参数对每位听众进行了个体化校准。 与已有方法相比新在哪里:将动态、依赖于信号可靠性的频谱加权机制整合到贝叶斯定位框架中。与四种来自先前研究的固定加权方案(Flat, NR, DT, SV_GL)进行系统比较。 主要实验结果如何: 对于宽带噪声刺激(高感知置信度),在组水平上没有发现某一种加权方案具有稳定优势(保护超出概率PXP均接近随机水平)。 对于经声码器降质的点击序列刺激(模拟不同频谱分辨率,降低感知置信度),组水平PXP同样未显示明确偏好(SV_GL最高为0.281,但贝叶斯模型选择风险BOR为0.68,说明模型间差异不显著)。 关键发现(图4):在单个低置信度被试(NH12)的例子中,自适应加权方案的预测结果最接近人类实际反应。随着频谱线索减少,人类反应分布趋近于模型的双峰先验分布,该趋势也被模型捕获。 论文未提供所有被试的详细定量对比表格,PXP值见图3。 实际意义是什么:揭示了在感知线索不足时,空间先验知识在人类定位行为中的关键作用,并证明了在计算模型中模拟自适应加权对预测退化条件下听觉行为的重要性。对未来设计适应性更强的助听算法或虚拟声学系统有参考价值。 主要局限性是什么:模型验证局限于使用HRTF和特定的降质处理(声码器)模拟的条件。自适应方案的优势仅在低置信度个体案例中直观显现,未能在整体统计上得到确凿的、优于其他方案的结论。模型参数的个体化校准增加了应用复杂度。 🏗️ 模型架构 图1. 所提出的矢状面定位模型结构 (根据论文图1描述) 该模型是一个端到端的贝叶斯计算模型,流程如下: ...

2026-04-29