← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
顶级标签: agents llm
详细标签: memory-augmented agents case-based reasoning online adaptation soft q-learning tool coordination 或 搜索:

📄 论文总结


1️⃣ 一句话总结

AgentFly 提出了一种无需微调底层大语言模型(LLM)的代理学习范式,通过记忆增强的在线强化学习案例推理(CBR)实现持续自适应,在多个基准测试中显著提升了长时程任务和动态环境中的性能。


2️⃣ 论文创新点

1. 无需微调LLM的持续学习框架

2. Memory-augmented Markov Decision Process (M-MDP)

3. 参数化与非参数化记忆的融合

4. 规划-执行与工具协调机制


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF