arXiv ID:
2605.25931
arXiv 提交日期: 2026-05-25
探索再求解:面向ARC-AGI-3认知智能体的速度与深度权衡 / Explore Before You Solve: The Speed--Depth Trade-off in Epistemic Agents for ARC-AGI-3
1️⃣ 一句话总结
本文揭示ARC-AGI-3公开测试集存在严重漏洞:大部分题目无需智能推理,仅凭简单试探步骤即可通过;为解决此问题,作者提出一个分三阶段(探索/验证/规划)的认知智能体AERA,并通过速度与探索深度的权衡理论,证明高效智能体必须优先进行信息探索,才能在真正的智能测试中取得好成绩。