arXiv ID:
2606.05031
MetaPoint:解锁智能体视觉生成中的精确空间控制 / MetaPoint: Unlocking Precise Spatial Control in Agentic Visual Generation
1️⃣ 一句话总结
本文提出MetaPoint方法,通过将连续二维坐标表示为一个特殊标记,在不改变模型架构的前提下,实现了对图像中物体位置和边框的像素级精确控制,从而为智能体视觉生成和交互式编辑提供了简单、可扩展的空间控制基础。