arXiv ID:
2512.16106
arXiv 提交日期: 2025-12-18
ModelTables:面向AI模型的大规模结构化表格语料库 / ModelTables: A Corpus of Tables about Models
1️⃣ 一句话总结
本文提出了ModelTables,这是首个专门用于描述AI模型的大规模结构化表格基准数据集,它通过整合Hugging Face模型卡、GitHub代码库和学术论文,构建了一个包含超过6万个模型和9万个表格的语料库,并引入了一套基于开发者行为的多源真实相关性标注,为模型理解、表格搜索和知识发现等任务提供了高质量的数据基础和评估标准。