arXiv ID:
2512.05145
无需人工标注的自改进视觉语言模型评判器 / Self-Improving VLM Judges Without Human Annotations
1️⃣ 一句话总结
这篇论文提出了一种无需人工标注、仅利用模型自身合成数据就能迭代训练视觉语言模型评判器的新方法,该方法在多个评测维度上超越了包括GPT-4o在内的更大模型,展示了让评判器与模型能力同步进化的潜力。