arXiv ID:
2604.26934
arXiv 提交日期: 2026-04-29
World2VLM:将世界模型的空间想象能力蒸馏到视觉语言模型中,用于动态空间推理 / World2VLM: Distilling World Model Imagination into VLMs for Dynamic Spatial Reasoning
1️⃣ 一句话总结
本文提出一种新训练框架World2VLM,通过让生成式世界模型在训练时“教”视觉语言模型如何预测视角变化后的场景,使后者在不增加运算负担的情况下,提升了动态空间推理能力。