arXiv ID:
2512.06835
arXiv 提交日期: 2025-12-07
解耦以泛化:面向数据稀缺视觉语言推理的上下文优先自演化学习 / Decouple to Generalize: Context-First Self-Evolving Learning for Data-Scarce Vision-Language Reasoning
1️⃣ 一句话总结
这篇论文提出了一种名为DoGe的新方法,通过将学习过程解耦为‘思考者’和‘解决者’两个部分,并构建一个不断演化的课程学习流程,有效解决了视觉语言模型在数据稀缺的专业领域进行强化学习时容易出现的‘奖励作弊’问题,从而实现了更稳定、更泛化的模型自我进化。