arXiv ID:
2601.20209
arXiv 提交日期: 2026-01-28
Spark:通过关键状态动态分支实现面向长周期智能体学习的策略感知探索 / Spark: Strategic Policy-Aware Exploration via Dynamic Branching for Long-Horizon Agentic Learning
1️⃣ 一句话总结
这篇论文提出了一种名为Spark的新方法,它通过让智能体在关键决策点进行动态分支探索,从而用更少的训练样本高效学习复杂的长周期任务,并实现更好的泛化能力。