arXiv ID:
2603.17024
arXiv 提交日期: 2026-03-17
HopChain:用于提升视觉语言推理泛化能力的多跳数据合成框架 / HopChain: Multi-Hop Data Synthesis for Generalizable Vision-Language Reasoning
1️⃣ 一句话总结
这篇论文提出了一个名为HopChain的框架,通过自动合成需要多步逻辑推理的视觉语言数据来训练模型,有效提升了视觉语言模型在复杂、长链条推理任务上的泛化能力。