arXiv ID:
2601.16206
LLM-in-Sandbox:通过代码沙箱解锁大语言模型的通用智能 / LLM-in-Sandbox Elicits General Agentic Intelligence
1️⃣ 一句话总结
本文提出了LLM-in-Sandbox框架,让大语言模型在代码沙箱(虚拟计算机)中自主探索,无需额外训练即可激发其在数学、物理、化学、生物医学等非代码领域的通用智能,并通过强化学习(LLM-in-Sandbox-RL)进一步提升模型能力。