arXiv ID:
2606.03603
世界模型遇上语言模型:论具体推理与抽象推理的互补性 / World Models Meet Language Models: On the Complementarity of Concrete and Abstract Reasoning
1️⃣ 一句话总结
本文提出了一种结合世界模型(用于生成具体视觉预测)与多模态大语言模型(用于抽象推理)的框架,通过自训练方法让模型自主判断何时启用视觉模拟并验证其结果,显著提升了在空间推理和开放域物理预测任务上的准确性和鲁棒性。