arXiv ID:
2602.03647
arXiv 提交日期: 2026-02-03
Search-R2:通过执行者-精炼者协作增强搜索集成推理 / Search-R2: Enhancing Search-Integrated Reasoning via Actor-Refiner Collaboration
1️⃣ 一句话总结
这篇论文提出了一个名为Search-R2的新框架,它通过让‘执行者’生成初步推理步骤、‘元精炼者’诊断并修复错误步骤的协作方式,结合精细化的奖励设计,有效解决了智能体在搜索式推理中因奖励稀疏导致的低效问题,从而在多种问答任务上取得了更高的准确率。