arXiv ID:
2605.18556
arXiv 提交日期: 2026-05-18
Key-Gram:面向具身操作的可扩展世界知识 / Key-Gram: Extensible World Knowledge for Embodied Manipulation
1️⃣ 一句话总结
本文提出了一个名为Key-Gram的框架,将语言指令中的世界知识(如物体属性和规则)与视觉推理过程分离,通过一个可扩展的外部记忆模块来存储和快速检索这些知识,从而显著提升了机器人在复杂操作任务中的理解能力和泛化性能。