arXiv ID:
2512.20092
arXiv 提交日期: 2025-12-23
Memory-T1:基于强化学习的多会话智能体时序推理框架 / Memory-T1: Reinforcement Learning for Temporal Reasoning in Multi-session Agents
1️⃣ 一句话总结
这篇论文提出了一个名为Memory-T1的强化学习框架,它通过训练智能体从冗长嘈杂的多轮对话历史中,智能筛选出与时间相关的关键信息,从而显著提升了模型在时序推理任务上的准确性和鲁棒性。