arXiv ID:
2606.02031
arXiv 提交日期: 2026-06-01
OpenWebRL:揭秘面向视觉网页代理的在线多轮强化学习 / OpenWebRL: Demystifying Online Multi-turn Reinforcement Learning for Visual Web Agents
1️⃣ 一句话总结
本文提出并开源了一个名为OpenWebRL的完整框架,首次系统地将在线多轮强化学习应用于训练视觉网页代理,并证明仅用少量初始数据和任务,即可训练出在真实网站上性能超越多数开源模型、与闭源顶级系统媲美的低成本代理。