arXiv ID:
2509.01656
arXiv 提交日期: 2025-09-01
基于工具增强的视觉感知强化学习 / Reinforced Visual Perception with Tools
1️⃣ 一句话总结
本研究提出一种基于强化学习的视觉工具增强方法,通过训练多模态大模型自主调用四种视觉工具,在多个视觉推理基准测试中显著超越传统监督学习方法,有效提升了模型的视觉感知与推理能力。