← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
顶级标签: agents llm
详细标签: web agents context summarization reinforcement learning long-context reasoning benchmark evaluation 或 搜索:

📄 论文总结

ReSum:通过周期性上下文摘要实现无限网络探索的新范式

ReSum: A New Paradigm for Unlimited Web Exploration via Periodic Context Summarization


1️⃣ 一句话总结

ReSum是一种通过周期性总结对话历史来压缩上下文的新范式,结合专用摘要工具ReSumTool-30B和强化学习算法ReSum-GRPO,有效解决了大语言模型在长轨迹网络探索中的上下文窗口限制问题,并在多个基准测试中显著优于ReAct等现有方法。


2️⃣ 论文创新点

1. ReSum推理范式

2. ReSumTool-30B专用摘要模型

3. ReSum-GRPO强化学习算法


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF