OceanPile: A Large-Scale Multimodal Ocean Corpus for Foundation Models
📄 OceanPile: A Large-Scale Multimodal Ocean Corpus for Foundation Models #数据集 #多模态模型 #海洋科学 #知识图谱 #基准测试 ✅ 7.0/10 | 前25% | #数据集 | #知识图谱 | #多模态模型 #海洋科学 | arxiv 学术质量 5.0/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Yida Xue (徐一达) (浙江大学计算机科学与技术学院, 软件技术学院) 通讯作者:Ningyu Zhang (张宁钰) (浙江大学计算机科学与技术学院), Guozhou Zheng (郑国舟) (舟山海洋研究中心) 作者列表:Yida Xue (浙江大学计算机科学与技术学院, 软件技术学院)、Ningyu Zhang (浙江大学计算机科学与技术学院)、Tingwei Wu (浙江大学计算机科学与技术学院, 软件技术学院)、Zhe Ma (浙江大学计算机科学与技术学院)、Daxiong Ji (软件技术学院)、Zhao Wang (软件技术学院)、Guozhou Zheng (舟山海洋研究中心)、Huajun Chen (浙江大学计算机科学与技术学院, 海洋感知国家重点实验室) 💡 毒舌点评 论文构建了一个非常全面且质量控制严格的海洋领域多模态数据集,从教科书到实地采集数据无所不包,是海洋AI领域一项扎实的基础工程。然而,实验部分仅展示了在开源小模型上微调的性能提升,缺乏更大规模模型预训练或与更多SOTA模型的直接比较,使得“基础模型”这一宏大目标的论证稍显薄弱。 ...