arXiv ID:
2603.08706
arXiv 提交日期: 2026-03-09
自主批判性训练 / Agentic Critical Training
1️⃣ 一句话总结
这篇论文提出了一种名为‘自主批判性训练’的新方法,它通过让大型语言模型学习自主判断不同行动方案的优劣,而不是简单模仿专家行为,从而显著提升了AI代理的决策能力和泛化性能。