arXiv最新AI论文速览速学

🔍

标签: #long-horizon reasoning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: Towards Long-horizon Agentic Multimodal Search 04-18

arXiv ID: 2604.12890

arXiv 提交日期: 2026-04-14

agents multi-modal model training multimodal search long-horizon reasoning file-based representation data synthesis visual grounding

迈向长视野的自主多模态搜索 / Towards Long-horizon Agentic Multimodal Search

1️⃣ 一句话总结

这篇论文提出了一种名为LMM-Searcher的新框架，通过将视觉信息存储在外部文件并用轻量级文本标识符来管理，解决了多模态智能体在长时间、多步骤搜索任务中信息混杂和计算成本高的问题，从而实现了更高效、更准确的长序列多模态搜索。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.01664

arXiv 提交日期: 2026-04-02

llm agents systems context management reinforcement learning long-horizon reasoning compression strategies budget constraints

ContextBudget：面向长程搜索智能体的预算感知上下文管理方法 / ContextBudget: Budget-Aware Context Management for Long-Horizon Search Agents

1️⃣ 一句话总结

这篇论文提出了一种名为BACM的智能方法，它能让基于大语言模型的智能体在有限的记忆容量下，像精打细算的管家一样，自动决定何时、如何压缩过去的对话历史，从而在长时间、多步骤的任务中更高效地利用有限资源，显著提升了任务完成效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.02280

arXiv 提交日期: 2026-04-02

agents systems natural language processing memory management forgetting mechanisms conversational agents long-horizon reasoning adaptive memory

面向自主AI智能体的新型记忆遗忘技术：平衡相关性与效率 / Novel Memory Forgetting Techniques for Autonomous AI Agents: Balancing Relevance and Efficiency

1️⃣ 一句话总结

这篇论文提出了一种自适应的、有预算的记忆遗忘框架，通过智能地选择性地遗忘不重要的旧记忆，让长期对话AI在保持推理能力的同时，避免因记忆无限增长而导致的性能下降和错误记忆问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.22281

arXiv 提交日期: 2026-03-23

multi-modal computer vision model training world models video prediction vision-language models hierarchical representation long-horizon reasoning

ThinkJEPA：利用大型视觉-语言推理模型增强潜在世界模型 / ThinkJEPA: Empowering Latent World Models with Large Vision-Language Reasoning Model

1️⃣ 一句话总结

这篇论文提出了一种名为ThinkJEPA的新框架，它巧妙地将擅长精细动作预测的潜在世界模型与擅长长时程语义推理的视觉语言模型结合起来，从而在预测未来世界状态（如手部操作轨迹）时，既能把握细节动作，又能理解长期意图，取得了比单独使用任一模型更好的效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02112

arXiv 提交日期: 2026-03-02

llm theory model training long-horizon reasoning recursive models context management boolean satisfiability autoregressive models

用于长程推理的递归模型 / Recursive Models for Long-Horizon Reasoning

1️⃣ 一句话总结

这篇论文提出了一种让AI模型通过递归调用自身来解决复杂长程问题的创新方法，理论上证明了该方法能突破现有模型处理长文本的限制，并在实验中成功训练了一个小模型，使其在复杂的逻辑推理任务上超越了更强大的主流大语言模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.09255

arXiv 提交日期: 2026-02-09

robotics agents multi-modal robot memory information retrieval long-horizon reasoning multimodal memory task-conditioned retrieval

STaR：面向长时程多模态机器人记忆的可扩展任务条件检索 / STaR: Scalable Task-Conditioned Retrieval for Long-Horizon Multimodal Robot Memory

1️⃣ 一句话总结

这篇论文提出了一个名为STaR的智能机器人记忆与推理框架，它通过构建一个通用的多模态长期记忆库，并结合一种基于信息瓶颈原理的可扩展检索算法，使机器人能够在复杂多变的环境中高效地根据任务指令检索关键记忆信息，从而进行精确的导航和决策，并在仿真与真实场景中验证了其优越性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.18157

arXiv 提交日期: 2026-01-26

agents multi-modal video egocentric video long-horizon reasoning entity scene graphs agentic framework video understanding

智能体驱动的超长视频理解 / Agentic Very Long Video Understanding

1️⃣ 一句话总结

这项研究提出了一种名为EGAgent的新框架，它利用实体场景图来帮助AI助手理解和推理持续数天甚至数周的个人穿戴设备拍摄的超长视频，从而在复杂的长时视频理解任务上取得了领先的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.08079

arXiv 提交日期: 2026-01-12

llm agents systems agent memory reasoning systems long-horizon reasoning tool-augmented agents context management

MemoBrain：作为推理代理大脑的执行记忆 / MemoBrain: Executive Memory as an Agentic Brain for Reasoning

1️⃣ 一句话总结

这篇论文提出了一个名为MemoBrain的执行记忆模型，它通过主动管理推理过程中的中间状态和逻辑关系，帮助使用工具的AI代理在复杂长程任务中保持逻辑连贯性，从而提升其推理能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.18470

arXiv 提交日期: 2025-12-20

agents benchmark model evaluation coding agents software evolution long-horizon reasoning multi-file tasks evaluation metric

SWE-EVO：在长周期软件演化场景中评估代码智能体 / SWE-EVO: Benchmarking Coding Agents in Long-Horizon Software Evolution Scenarios

1️⃣ 一句话总结

这篇论文提出了一个名为SWE-EVO的新基准测试，它模拟了需要跨多个文件进行多步骤修改的真实软件长期演化任务，并发现当前最先进的AI编程模型在此类复杂任务上的表现远低于处理单一、孤立问题的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.08276

arXiv 提交日期: 2025-10-09

agents model training reinforcement learning multi-turn agents dynamic context window long-horizon reasoning search agents reinforcement learning

超越轮次限制：利用动态上下文窗口训练深度搜索智能体 / Beyond Turn Limits: Training Deep Search Agents with Dynamic Context Window

1️⃣ 一句话总结

这篇论文提出了名为DeepMiner的新框架，通过生成高难度训练任务和动态管理上下文窗口，有效提升了多轮对话智能体在长序列交互中的深度推理能力，并在多个搜索任务基准测试中取得了显著性能突破。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.12890

1️⃣ 一句话总结

arXiv ID: 2604.01664

1️⃣ 一句话总结

arXiv ID: 2604.02280

1️⃣ 一句话总结

arXiv ID: 2603.22281

1️⃣ 一句话总结

arXiv ID: 2603.02112

1️⃣ 一句话总结

arXiv ID: 2602.09255

1️⃣ 一句话总结

arXiv ID: 2601.18157

1️⃣ 一句话总结

arXiv ID: 2601.08079

1️⃣ 一句话总结

arXiv ID: 2512.18470

1️⃣ 一句话总结

arXiv ID: 2510.08276

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.12890 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.01664 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.02280 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.22281 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02112 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.09255 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.18157 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.08079 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.18470 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.08276 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.12890

arXiv ID: 2604.01664

arXiv ID: 2604.02280

arXiv ID: 2603.22281

arXiv ID: 2603.02112

arXiv ID: 2602.09255

arXiv ID: 2601.18157

arXiv ID: 2601.08079

arXiv ID: 2512.18470

arXiv ID: 2510.08276