arXiv ID:
2606.24884
arXiv 提交日期: 2026-06-23
Insight:通过可操控的视觉-语言-动作模型实现自主技能获取 / InSight: Self-Guided Skill Acquisition via Steerable VLAs
1️⃣ 一句话总结
该论文提出了一种名为InSight的方法,通过让视觉-语言-动作模型在基本动作层面变得可操控,使其能自主从演示数据中分解、学习缺失的新技能,并不断更新自身知识,从而无需额外人工演示即可执行从未见过的长期任务。