arXiv ID:
2604.18584
arXiv 提交日期: 2026-04-20
MathNet:一个用于数学推理与检索的全球多模态基准 / MathNet: a Global Multimodal Benchmark for Mathematical Reasoning and Retrieval
1️⃣ 一句话总结
这篇论文推出了一个名为MathNet的大型、高质量、多语言和多模态的奥林匹克数学竞赛数据集及评测基准,用于全面评估AI模型在数学问题求解、数学感知检索以及检索增强解题方面的能力,结果显示当前最先进的AI模型在这些任务上仍面临巨大挑战。