🤖 系统
11-30 17:28
📄 论文总结
基于工具增强的视觉感知强化学习 / Reinforced Visual Perception with Tools
1️⃣ 一句话总结
本研究提出一种基于强化学习的视觉工具增强方法,通过训练多模态大模型自主调用四种视觉工具,在多个视觉推理基准测试中显著超越传统监督学习方法,有效提升了模型的视觉感知与推理能力。
请先 登录 后再提交论文
基于工具增强的视觉感知强化学习 / Reinforced Visual Perception with Tools
本研究提出一种基于强化学习的视觉工具增强方法,通过训练多模态大模型自主调用四种视觉工具,在多个视觉推理基准测试中显著超越传统监督学习方法,有效提升了模型的视觉感知与推理能力。
Visual-CoG:基于阶段感知强化学习与引导链的文生图生成方法 / Visual-CoG: Stage-Aware Reinforcement Learning with Chain of Guidance for Text-to-Image Generation
本文提出了一种名为Visual-CoG的新方法,通过分阶段奖励机制强化文生图模型对复杂文本的理解能力,显著提升了多属性和模糊提示下的图像生成质量。