arXiv ID:
2509.06733
arXiv 提交日期: 2025-09-08
深度研究系统的强化学习基础:一项综述 / Reinforcement Learning Foundations for Deep Research Systems: A Survey
1️⃣ 一句话总结
这篇论文是第一篇专门探讨强化学习如何为能够自主执行复杂多步骤任务的深度研究系统提供核心训练方法的综述,强调了强化学习在减少人为偏见、优化长期决策和多目标权衡方面的独特优势。