arXiv ID:
2601.00501
arXiv 提交日期: 2026-01-01
CPPO:用于视觉语言策略优化的对比感知方法 / CPPO: Contrastive Perception for Vision Language Policy Optimization
1️⃣ 一句话总结
这篇论文提出了一种名为CPPO的新方法,它通过分析模型在图像扰动下的输出变化来自动识别视觉感知信息,并引入对比损失来优化多模态模型的训练,从而在不需要额外模型或复杂标注的情况下,更高效地提升视觉语言模型的综合推理能力。