arXiv ID:
2603.09206
MM-Zero:从零数据出发的自进化多模型视觉语言模型 / MM-Zero: Self-Evolving Multi-Model Vision Language Models From Zero Data
1️⃣ 一句话总结
这篇论文提出了一个名为MM-Zero的新框架,它能让视觉语言模型在没有初始图像数据的情况下,通过让一个基础模型扮演提议者、编码者和解答者三个不同角色进行自我协作与进化,从而显著提升其在多模态推理任务上的表现。