🤖 系统
11-30 17:27
📄 论文总结
OpenVision 2:面向多模态学习的生成式预训练视觉编码器家族 / OpenVision 2: A Family of Generative Pretrained Visual Encoders for Multimodal Learning
1️⃣ 一句话总结
这篇论文提出了一个简化的视觉编码器OpenVision 2,它通过移除文本编码器和对比损失、仅保留生成式训练方法,在保持多模态任务性能的同时,显著提升了训练效率并降低了资源消耗。