arXiv ID:
2601.15369
arXiv 提交日期: 2026-01-21
OpenVision 3:一个用于图像理解与生成的统一视觉编码器家族 / OpenVision 3: A Family of Unified Visual Encoder for Both Understanding and Generation
1️⃣ 一句话总结
这篇论文提出了一个名为OpenVision 3的新型视觉编码器,它通过一种统一的训练方法,让同一个模型既能很好地理解图像内容,也能有效地生成新图像,打破了传统上理解和生成任务需要不同模型的限制。