Enhancing Acoustic-to-Articulatory Inversion with Multi-Target Pretraining for Low-Resource Settings
📄 Enhancing Acoustic-to-Articulatory Inversion with Multi-Target Pretraining for Low-Resource Settings #语音交互 #预训练 #多任务学习 #低资源 #迁移学习 #Transformer 7/10 | 创新 1/2 | 严谨 1/1.5 | 实验 1/1.5 | 清晰 0.8/1 | 影响 0.8/1.5 | 开源 1/1.5 | 复现 0.3/0.5 | 工程 1.1/1.5 ✅ 7/10 | 前50% | #语音交互 | #预训练 | #多任务学习 #低资源 | arxiv 👥 作者与机构 第一作者:Jesuraj Bandekar(印度科学学院电气工程系) 通讯作者:Prasanta Kumar Ghosh(印度科学学院电气工程系) 作者列表:Jesuraj Bandekar、Prasanta Kumar Ghosh(均来自印度科学学院电气工程系) 资助信息:本研究由印度科技部(Department of Science and Technology, DST)资助。 💡 毒舌点评 本文用一套组合式多任务预训练给低资源 AAI 打了针强心剂,用廉价的 MFCC 就敢叫板重量级 SSL 特征,工程实用性看似不错。但方法只是将已知预训练目标拼盘,却未深究多目标间的互补与冗余;消融止于最终性能的罗列,没有一丝表征层面的分析。仅抱紧 TERA 和单一数据集,就敢声称“高效替代”,说服力在审稿人看来仍需更多证据。 ...