Multi-Task Learning For Speech Quality Assessment Using ASR-Derived Entropy Features
📄 Multi-Task Learning For Speech Quality Assessment Using ASR-Derived Entropy Features #语音质量评估 #多任务学习 #预训练 #语音增强 #鲁棒性 ✅ 7.5/10 | 前25% | #语音质量评估 | #多任务学习 | #预训练 #语音增强 学术质量 6.0/7 | 选题价值 1.5/2 | 复现加成 0.3 | 置信度 高 👥 作者与机构 第一作者:Tri Dung Do(Viettel AI, Viettel Group; University of Engineering and Technology – Vietnam National University, Hanoi) 通讯作者:Van Hai Do(Thuyloi University) 作者列表:Tri Dung Do(Viettel AI, Viettel Group; University of Engineering and Technology – Vietnam National University, Hanoi), Bao Thang Ta(Viettel AI, Viettel Group; Hanoi University of Science and Technology), Van Hai Do(Viettel AI, Viettel Group; Thuyloi University) 💡 毒舌点评 亮点在于将ASR模型输出的不确定性(熵)作为一个新颖且可量化信号,与语音质量评估任务进行关联,并通过多任务学习框架显式地利用这一信号,思路巧妙。短板是,尽管在NISQA数据集上取得了改进,但论文未与更多当前先进的无参考评估方法(如基于自监督模型或特定Transformer架构的方法)进行直接、充分的对比,说服力稍显不足;另外,对熵特征的物理意义及其与具体失真类型关系的分析深度有限。 ...