DBHN-Net: Dual-Branch Hybrid Neural Network For Low-Complexity Monaural Speech Enhancement
📄 DBHN-Net: Dual-Branch Hybrid Neural Network For Low-Complexity Monaural Speech Enhancement #语音增强 5.4/10 | 创新 1.3/2 | 严谨 1/1.5 | 实验 0.8/1.5 | 清晰 0.7/1 | 影响 0.5/1.5 | 开源 0/1.5 | 复现 0.5/0.5 | 工程 0.6/1.5 📝 5.4/10 | 前25% | #语音增强 | #语音增强 | arxiv 👥 作者与机构 论文通讯作者为Enrui Liu和Xuelong Li。作者及机构如下: Cunhang Fan, Enrui Liu, Jian Zhou, Zhao Lv:安徽大学计算机科学与技术学院(州电信息获取与保护技术国家重点实验室)。 Jing Zhou, Jian Kang, Jie Li:中国电信人工智能科技(北京)有限公司。 Andong Li:中国科学院大学声学研究所。 Xuelong Li:中国电信人工智能研究院(TeleAI)。 💡 毒舌点评 这篇论文的核心思想——用ANN分支的性能来“拯救”SNN分支因脉冲二值化导致的信息损失,同时借助SNN降低功耗——逻辑清晰且实用价值明确。实验对比了众多基线,数据集选择和指标评估都较为全面,工作量扎实。然而,作为一篇目标顶会的论文,其严谨性存在明显短板。最令人诟病的是技术细节描述的粗糙和部分公式的明显错误,例如TF-Cross Attention Fusion模块的最终输出公式(37)存在笔误,将FCA函数重复相加,这不应出现在投稿版本中。论文在阐述设计动机时,对ANN与SNN各自瓶颈的理论剖析深度不足,更像是一种“组合式创新”而非“机理式创新”。实验部分虽然广泛,但缺失了模型参数量这一关键对比指标,使得其“低复杂度”的宣称不完整。总体而言,这是一项有效且具有工程吸引力的应用研究,但若以顶会的理论深度和写作严谨性标准衡量,尚显不足。 ...