APEX: Large-scale Multi-task Aesthetic-Informed Popularity Prediction for AI-Generated Music

📄 APEX: Large-scale Multi-task Aesthetic-Informed Popularity Prediction for AI-Generated Music #音乐评估 #多任务学习 #自监督学习 #预训练模型 ✅ 7.5/10 | 前25% | #音乐评估 | #多任务学习 | #自监督学习 #预训练模型 | arxiv 学术质量 7.0/7 | 选题价值 2.0/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Jaavid Aktar Husain(AMAAI Lab, Singapore University of Technology and Design) 通讯作者:Dorien Herremans(AMAAI Lab, Singapore University of Technology and Design) 作者列表:Jaavid Aktar Husain(AMAAI Lab, Singapore University of Technology and Design)、Dorien Herremans(AMAAI Lab, Singapore University of Technology and Design) 💡 毒舌点评 这篇论文为AI生成音乐这个“野蛮生长”的领域提供了一个扎实的多任务学习基线,首次将“好听”(美学)和“流行”(数据)放在一起建模,且跨模型的泛化实验证明了学到的美学特征具有普适性。但令人遗憾的是,联合学习“流行度”这个主任务本身并未带来显著提升,似乎美学和流行在特征上互补但并不互促,这削弱了“多任务学习能提升主任务”这一核心动机的说服力。 ...

2026-05-07 · 更新于 2026-05-19 · 3 min · 485 words

Time vs. Layer: Locating Predictive Cues for Dysarthric Speech Descriptors in Wav2vec 2.0

📄 Time vs. Layer: Locating Predictive Cues for Dysarthric Speech Descriptors in Wav2vec 2.0 #语音质量评估 #注意力机制 #预训练模型 #病理语音 #数据集 ✅ 7.5/10 | 前50% | #语音质量评估 | #注意力机制 | #预训练模型 #病理语音 学术质量 6.0/7 | 选题价值 1.0/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Natalie Engert(Technische Hochschule Nürnberg Georg Simon Ohm, Germany) 通讯作者:未说明 作者列表:Natalie Engert(Technische Hochschule Nürnberg Georg Simon Ohm, Germany)、Dominik Wagner(Technische Hochschule Nürnberg Georg Simon Ohm, Germany)、Korbinian Riedhammer(Technische Hochschule Nürnberg Georg Simon Ohm, Germany)、Tobias Bocklet(Technische Hochschule Nürnberg Georg Simon Ohm, Germany) 💡 毒舌点评 亮点:研究设计非常系统,对“时间 vs. 层”这个核心问题的分析很到位,不仅给出了整体结论,还通过注意力权重可视化揭示了不同严重程度下层重要性的变化,这种临床视角下的可解释性分析是加分项。 短板:作为一篇发表在顶会的论文,方法上的创新显得有些“温和”,更像是对现有工具(Wav2vec 2.0 + ASP)的一次精心设计的应用研究,缺乏一个更强大的、统一的模型架构来同时建模时间与层信息(尽管结论中提到了这是未来工作)。 ...

2026-04-29 · 更新于 2026-05-19 · 2 min · 341 words