arXiv ID:
2607.01212
arXiv 提交日期: 2026-07-01
家具VLA:利用视觉-语言-动作模型学习长期双手机器人家具组装 / FurnitureVLA: Learning Long-Horizon Bimanual Furniture Assembly with Vision-Language-Action Model
1️⃣ 一句话总结
本文首次系统研究了真实尺寸家具的双手机器人组装问题,提出了一种结合视觉、语言和动作的模型FurnitureVLA,通过引入进度信号和语义子任务划分,显著提升了多步骤复杂组装任务的成功率,并在真实机器人平台上验证了其有效性。