arXiv ID:
2604.11751
arXiv 提交日期: 2026-04-13
用于语义可泛化规划的接地世界模型 / Grounded World Model for Semantically Generalizable Planning
1️⃣ 一句话总结
这篇论文提出了一种名为GWM的新方法,它通过将视觉、语言和动作信息对齐到一个统一的表示空间中,让机器人能够直接根据自然语言指令来预测和规划动作,从而在遇到从未见过的物体或环境描述时,依然能很好地完成任务。