Leveraging Multiple Speech Enhancers for Non-Intrusive Intelligibility Prediction for Hearing-Impaired Listeners
📄 Leveraging Multiple Speech Enhancers for Non-Intrusive Intelligibility Prediction for Hearing-Impaired Listeners #模型评估 #语音增强 #数据增强 #预训练 #鲁棒性 ✅ 7.5/10 | 前25% | #模型评估 | #数据增强 | #语音增强 #预训练 学术质量 7.5/7 | 选题价值 1.5/2 | 复现加成 0.3 | 置信度 高 👥 作者与机构 第一作者:Boxuan Cao, Linkai Li (共同贡献,论文中标记为“*”) 通讯作者:Haoshuai Zhou, Shan Xiang Wang (论文中标记为“†”) 作者列表: Boxuan Cao (Orka Labs Inc., China) Linkai Li (Orka Labs Inc., China; Stanford University, Electrical Engineering, United States) Hanlin Yu (University of British Columbia, Electrical Engineering, Canada) Changgeng Mo (Orka Labs Inc., China) Haoshuai Zhou (Orka Labs Inc., China) Shan Xiang Wang (Orka Labs Inc., China; Stanford University, Electrical Engineering, United States) 💡 毒舌点评 论文巧妙地将“语音增强”这个预处理步骤变成了可懂度预测模型的一部分,通过“让模型比较增强前后差异”来模拟侵入式方法中“比较干净和嘈杂信号”的过程,这个思路既实用又有点小聪明。然而,论文对跨数据集泛化失败的根本原因(如听者特征差异、录音条件差异)只是简单描述,提出的“2-clips”增强策略虽然有效,但对其为何有效的机制解释略显单薄,更像是一个实用技巧的报告,而非深入的原理探究。 ...