arXiv ID:
2601.02439
WebGym:通过真实任务扩展视觉网络智能体的训练环境 / WebGym: Scaling Training Environments for Visual Web Agents with Realistic Tasks
1️⃣ 一句话总结
这篇论文提出了一个名为WebGym的大规模开源训练环境,它包含近30万个基于真实网站的任务,通过高效的异步采样系统和强化学习方法,成功训练出一个视觉语言模型,使其在从未见过的网站任务上表现大幅超越GPT-4o等顶级闭源模型。