arXiv ID:
2511.23469
arXiv 提交日期: 2025-11-28
视觉生成调优 / Visual Generation Tuning
1️⃣ 一句话总结
这项研究提出了一种名为VGT的新方法,能够高效地激发现有视觉语言模型的视觉生成潜力,使其在图像重建和生成任务上取得优异表现,为构建下一代统一的多模态基础模型开辟了新途径。