arXiv ID:
2512.21218
arXiv 提交日期: 2025-12-24
潜在隐式视觉推理 / Latent Implicit Visual Reasoning
1️⃣ 一句话总结
这项研究提出了一种无需人工标注监督的方法,让大型多模态模型能够自动发现并利用视觉推理标记,从而在多种以视觉为核心的任务上实现更优的泛化性能和推理能力。