🤖 系统
11-30 17:43
📄 论文总结
搜索自我博弈:无监督推动智能体能力前沿 / Search Self-play: Pushing the Frontier of Agent Capability without Supervision
1️⃣ 一句话总结
这篇论文提出了一种名为‘搜索自我博弈’的无监督训练方法,让大型语言模型同时扮演任务提出者和问题解决者两个角色,通过相互竞争与合作来共同提升搜索能力,无需人工标注即可显著提高智能体在各种任务上的表现。