🤖 系统
11-30 17:52
📄 论文总结
基于人类演示的计算机使用智能体基础构建 / Grounding Computer Use Agents on Human Demonstrations
1️⃣ 一句话总结
这篇论文通过构建一个高质量的大规模桌面操作数据集GroundCUA,并训练出高效的GroundNext模型,显著提升了计算机使用智能体将语言指令准确对应到屏幕元素的能力,同时大幅减少了所需训练数据量。
请先 登录 后再提交论文
基于人类演示的计算机使用智能体基础构建 / Grounding Computer Use Agents on Human Demonstrations
这篇论文通过构建一个高质量的大规模桌面操作数据集GroundCUA,并训练出高效的GroundNext模型,显著提升了计算机使用智能体将语言指令准确对应到屏幕元素的能力,同时大幅减少了所需训练数据量。