arXiv ID:
2605.13171
arXiv 提交日期: 2026-05-13
形式化猜想:一个用于数学可验证发现的开放且不断发展的基准 / Formal Conjectures: An Open and Evolving Benchmark for Verified Discovery in Mathematics
1️⃣ 一句话总结
该论文提出了一个名为“形式化猜想”(Formal Conjectures)的、持续更新的数学基准测试集,包含2615个用Lean 4语言形式化的数学问题,其中既有未解决的开放猜想(用于检验AI的推理发现能力),也有已解决的难题(用于验证证明的自动形式化能力),并通过社区协作和AI生成的证明来确保问题表述的准确性,从而为推动自动化推理系统在高等数学中的应用提供了一个标准化测试平台。