arXiv ID:
2603.09203
arXiv 提交日期: 2026-03-10
评估即行动:检索增强智能体的自评估过程奖励 / Evaluate-as-Action: Self-Evaluated Process Rewards for Retrieval-Augmented Agents
1️⃣ 一句话总结
这篇论文提出了一种名为EvalAct的新方法,通过让AI在每一步检索信息后立即进行自我评估打分,并结合一种新的训练算法来优化中间推理步骤,从而显著提升了检索增强智能体在复杂多步问答任务中的准确性和可靠性。