arXiv ID:
2601.04888
arXiv 提交日期: 2026-01-08
SmartSearch:面向搜索代理的、基于过程奖励引导的查询优化框架 / SmartSearch: Process Reward-Guided Query Refinement for Search Agents
1️⃣ 一句话总结
这篇论文提出了一个名为SmartSearch的新框架,它通过引入过程奖励来精细评估和优化大型语言模型搜索代理在推理过程中产生的中间搜索查询质量,从而显著提升了搜索的准确性和效率。