A Data-Driven Framework for Personal Sound Zone Control Addressing Loudspeaker Nonlinearities
📄 A Data-Driven Framework for Personal Sound Zone Control Addressing Loudspeaker Nonlinearities #空间音频 #信号处理 #麦克风阵列 #深度学习 ✅ 7.5/10 | 前25% | #空间音频 | #信号处理 | #麦克风阵列 #深度学习 学术质量 7.0/7 | 选题价值 1.5/2 | 复现加成 0.0 | 置信度 高 👥 作者与机构 第一作者:Lei Zhou (重庆邮电大学通信与信息工程学院) 通讯作者:Liming Shi (重庆邮电大学通信与信息工程学院) 作者列表:Lei Zhou(重庆邮电大学通信与信息工程学院),Chen Gong(重庆邮电大学通信与信息工程学院),Chen Huang(重庆邮电大学通信与信息工程学院),Hongqing Liu(重庆邮电大学通信与信息工程学院),Lu Gan(Brunel University伦敦校区工程、设计与物理科学学院),Liming Shi(重庆邮电大学通信与信息工程学院) 💡 毒舌点评 亮点:论文针对一个实际且被长期忽略的问题(小型扬声器的非线性破坏了传统线性控制理论),提出了一个“用魔法打败魔法”的优雅框架——先用深度学习精确建模非线性,再用这个模型去训练一个能补偿非线性的控制器,逻辑闭环非常漂亮。 短板:虽然物理实验验证了有效性,但核心控制器(如WaveNet+VNN)的计算开销巨大(MACs达33G),对于论文标题中暗示的“移动和边缘设备”场景,其落地可行性存疑,更像一个原理验证原型。 标题:A Data-Driven Framework for Personal Sound Zone Control Addressing Loudspeaker Nonlinearities 摘要:论文针对个人声区控制系统性能受小型扬声器非线性严重制约的问题,提出一个两阶段、数据驱动的框架。第一阶段,训练一个高保真非线性前向模型以精确捕获从数字输入到声压的真实声学过程。第二阶段,将该预训练模型作为可微模拟器,优化一个控制网络。该框架为传统线性方法提供了一个统一视角,同时实现了更强的端到端非线性控制。在物理微型扬声器阵列上的实验表明,性能最佳的非线性控制器相比基线方法,在语音信号(200–4000 Hz)上实现了平均5.33 dB的声对比度(AC)提升。 ...