Vioptt: Violin Technique-Aware Transcription from Synthetic Data Augmentation
📄 Vioptt: Violin Technique-Aware Transcription from Synthetic Data Augmentation #音乐信息检索 #小提琴转录 #数据增强 #多任务学习 #领域适应 ✅ 6.5/10 | 前50% | #音乐信息检索 | #数据增强 | #小提琴转录 #多任务学习 学术质量 6.5/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Ting-Kang Wang (Sony Computer Science Laboratories, Inc., 国立台湾大学研究所) 通讯作者:未明确标注。从邮箱和贡献标注看,Ting-Kang Wang和Yueh-Po Peng可能共同负责。 作者列表: Ting-Kang Wang(Sony Computer Science Laboratories, Inc.;国立台湾大学研究所;中央研究院信息研究所) Yueh-Po Peng(伽玛之星原创内容中心;中央研究院信息研究所) Li Su(中央研究院信息研究所) Vincent K.M. Cheung(Sony Computer Science Laboratories, Inc.) 注:所有作者均标注了隶属于Sony CSL或台湾相关机构,且论文说明工作是在Sony CSL实习期间完成。 💡 毒舌点评 亮点:通过VST虚拟乐器(DAWDreamer + Synchron Solo Violin)自动合成带技巧标注的大规模数据集(MOSA-VPT),巧妙地绕开了需要专家标注的瓶颈,并证明了合成数据训练的模型能有效泛化到真实录音。短板:核心的“转录模块”基本是钢琴转录模型的直接移植,创新有限;整体模型架构(CRNN + 简单特征融合)相对传统,未探索更前沿的序列建模或注意力机制,限制了性能上限。 ...