arXiv ID:
2603.02681
arXiv 提交日期: 2026-03-03
VisionCreator:一个具备理解、思考、规划和创造能力的原生视觉生成智能体模型 / VisionCreator: A Native Visual-Generation Agentic Model with Understanding, Thinking, Planning and Creation
1️⃣ 一句话总结
这篇论文提出了一个名为VisionCreator的新型智能体模型,它通过一个端到端的可学习框架,将理解、思考、规划和创造能力融为一体,能够自主完成复杂的视觉内容创作任务,并且在多项测试中表现优于更大的闭源模型。