🤖 系统
11-30 17:48
📄 论文总结
阿里阿德涅:一个用于探索和扩展视觉语言模型推理边界的可控框架 / Ariadne: A Controllable Framework for Probing and Extending VLM Reasoning Boundaries
1️⃣ 一句话总结
这篇论文提出了一个名为Ariadne的可控框架,通过使用合成迷宫进行强化学习训练,成功扩展了视觉语言模型在视觉主导的空间推理任务上的能力边界,并显著提升了模型在真实世界导航任务中的零样本泛化性能。