arXiv ID:
2601.16207
IVRA:通过基于提示的无训练引导改进机器人动作策略中的视觉-标记关系 / IVRA: Improving Visual-Token Relations for Robot Action Policy with Training-Free Hint-Based Guidance
1️⃣ 一句话总结
这篇论文提出了一种名为IVRA的轻量级、无需额外训练的方法,它通过巧妙利用视觉模型中已有的空间关联信息来增强机器人对视觉场景的几何理解,从而在多种机器人操作任务上稳定提升了动作策略的准确性。