预训练模型

📄 APEX: Large-scale Multi-task Aesthetic-Informed Popularity Prediction for AI-Generated Music #音乐评估 #多任务学习 #自监督学习 #预训练模型 ✅ 7.5/10 | 前25% | #音乐评估 | #多任务学习 | #自监督学习 #预训练模型 | arxiv 学术质量 7.0/7 | 选题价值 2.0/2 | 复现加成 0.5 | 置信度高 👥 作者与机构第一作者：Jaavid Aktar Husain（AMAAI Lab, Singapore University of Technology and Design）通讯作者：Dorien Herremans（AMAAI Lab, Singapore University of Technology and Design）作者列表：Jaavid Aktar Husain（AMAAI Lab, Singapore University of Technology and Design）、Dorien Herremans（AMAAI Lab, Singapore University of Technology and Design） 💡 毒舌点评这篇论文为AI生成音乐这个“野蛮生长”的领域提供了一个扎实的多任务学习基线，首次将“好听”（美学）和“流行”（数据）放在一起建模，且跨模型的泛化实验证明了学到的美学特征具有普适性。但令人遗憾的是，联合学习“流行度”这个主任务本身并未带来显著提升，似乎美学和流行在特征上互补但并不互促，这削弱了“多任务学习能提升主任务”这一核心动机的说服力。 ...

📄 Time vs. Layer: Locating Predictive Cues for Dysarthric Speech Descriptors in Wav2vec 2.0 #语音质量评估 #注意力机制 #预训练模型 #病理语音 #数据集 ✅ 7.5/10 | 前50% | #语音质量评估 | #注意力机制 | #预训练模型 #病理语音学术质量 6.0/7 | 选题价值 1.0/2 | 复现加成 0.5 | 置信度高 👥 作者与机构第一作者：Natalie Engert（Technische Hochschule Nürnberg Georg Simon Ohm, Germany）通讯作者：未说明作者列表：Natalie Engert（Technische Hochschule Nürnberg Georg Simon Ohm, Germany）、Dominik Wagner（Technische Hochschule Nürnberg Georg Simon Ohm, Germany）、Korbinian Riedhammer（Technische Hochschule Nürnberg Georg Simon Ohm, Germany）、Tobias Bocklet（Technische Hochschule Nürnberg Georg Simon Ohm, Germany） 💡 毒舌点评亮点：研究设计非常系统，对“时间 vs. 层”这个核心问题的分析很到位，不仅给出了整体结论，还通过注意力权重可视化揭示了不同严重程度下层重要性的变化，这种临床视角下的可解释性分析是加分项。短板：作为一篇发表在顶会的论文，方法上的创新显得有些“温和”，更像是对现有工具（Wav2vec 2.0 + ASP）的一次精心设计的应用研究，缺乏一个更强大的、统一的模型架构来同时建模时间与层信息（尽管结论中提到了这是未来工作）。 ...