arXiv ID:
2604.24697
arXiv 提交日期: 2026-04-27
当前智能体能否弥合从发现到应用的鸿沟?以《我的世界》为案例的研究 / Can Current Agents Close the Discovery-to-Application Gap? A Case Study in Minecraft
1️⃣ 一句话总结
本文通过在《我的世界》游戏中设计一系列需要自主发现规律并应用来点亮指定红石灯的任务,评测了GPT-5.2等前沿AI模型,发现它们仅能达到约26%的成功率,且模型的主要瓶颈正从“如何正确解决问题”转向“如何提出正确的问题”,即识别知识缺口的能力成为新的关键挑战。