arXiv ID:
2601.15808
arXiv 提交日期: 2026-01-22
验证的推理时扩展:通过测试时准则引导的验证实现自演化的深度研究智能体 / Inference-Time Scaling of Verification: Self-Evolving Deep Research Agents via Test-Time Rubric-Guided Verification
1️⃣ 一句话总结
这篇论文提出了一种新方法,让深度研究智能体在推理时通过一套自动生成的准则来验证和迭代改进自己的答案,从而无需额外训练就能自我提升,显著提高了复杂任务上的表现。