arXiv最新AI论文速览速学

🔍

标签: #planning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: Beyond APIs: Probing the Limits of MLLMs in Physical Tool Use 06-10

arXiv ID: 2606.10803

arXiv 提交日期: 2026-06-09

multi-modal evaluation robotics benchmark physical tool use embodied ai perception planning

超越API：探索多模态大语言模型在物理工具使用中的极限 / Beyond APIs: Probing the Limits of MLLMs in Physical Tool Use

1️⃣ 一句话总结

本文提出了首个专门评估多模态大语言模型在现实场景中识别和规划使用物理工具能力的基准测试PhysTool-Bench，结果发现当前最先进的模型在工具感知和功能常识推理上存在严重不足，仅能完成约五分之一的任务，揭示了具身人工智能发展的关键瓶颈。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28454

arXiv 提交日期: 2026-05-27

systems theory greedy best-first search memory efficiency heuristic search planning bloom filter

GONDOR救场：低内存下的满意规划 / GONDOR to the Rescue: Satisficing Planning with Low Memory

1️⃣ 一句话总结

本文提出了一种名为GONDOR的改进算法，它在传统贪心最佳优先搜索的基础上，通过定期压缩搜索树并保留关键状态，再在找到目标后利用这些关键状态重新搜索重建路径，从而在内存严格受限的设备（如边缘设备）上仍能有效地完成规划任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.17774

arXiv 提交日期: 2026-05-18

llm model training tool learning qlora parameter-efficient fine-tuning planning small language model

通过QLoRA微调将工具知识内化到小型语言模型中 / Internalizing Tool Knowledge in Small Language Models via QLoRA Fine-Tuning

1️⃣ 一句话总结

本研究通过QLoRA微调方法，让小型语言模型在无需输入完整工具描述的情况下，自主记住并运用工具知识，不仅将提示长度缩短82.6%，还提升了规划任务的表现，证明了将工具知识从提示文本转移到模型参数中的可行性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.15181

arXiv 提交日期: 2026-05-14

computer vision multi-modal agents image editing planning reward learning multi-step visual quality

从规划到像素：学习规划与编排以实现开放式图像编辑 / From Plans to Pixels: Learning to Plan and Orchestrate for Open-Ended Image Editing

1️⃣ 一句话总结

本文提出了一种让AI通过先制定分步计划、再逐步执行工具操作来应对复杂、模糊的长期图像编辑任务（如“让广告更素食友好”）的新方法，并通过视觉语言模型对每一步的结果进行奖励反馈，从而自我改进规划与执行能力，最终生成比单步或固定流程方法更连贯、可靠的编辑效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.12294

arXiv 提交日期: 2026-05-12

agents llm systems gui agent knowledge graph monte carlo tree search memory planning

可执行的智能体记忆：面向图形界面智能体的结构化知识图谱 / Executable Agentic Memory for GUI Agent

1️⃣ 一句话总结

本文提出了一种名为“可执行的智能体记忆”的方法，通过构建结构化的知识图谱，将图形界面智能体的操作规划从逐屏思考转变为快速检索和自动执行，从而在长期任务中大幅提升效率、降低成本，并在实际测试中取得了优于现有模型的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24039

arXiv 提交日期: 2026-04-27

agents llm systems embodied ai planning cache efficiency multi-agent

AgenticCache：面向具身AI智能体的缓存驱动异步规划框架 / AgenticCache: Cache-Driven Asynchronous Planning for Embodied AI Agents

1️⃣ 一句话总结

为解决具身AI智能体每次行动都需要调用大语言模型导致的高延迟和高成本问题，本文提出了一种名为AgenticCache的规划框架，它利用缓存已生成的行动序列来替代频繁的模型调用，并通过后台异步更新保证缓存内容的准确性，在多个标准测试中将任务成功率提升22%，同时将延迟和计算成本分别降低65%和50%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.25706

arXiv 提交日期: 2026-03-26

multi-modal model training aigc interleaved generation text-to-image planning visual consistency benchmark

万维编织者：通过解耦训练实现交错式多模态生成 / Wan-Weaver: Interleaved Multi-modal Generation via Decoupled Training

1️⃣ 一句话总结

这篇论文提出了一个名为Wan-Weaver的模型，它通过将复杂的图文交错生成任务分解为文本规划和视觉一致性建模两个独立步骤来训练，从而在没有真实交错数据的情况下，也能生成内容连贯、视觉一致的多模态混合内容。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.14691

arXiv 提交日期: 2026-02-16

agents systems benchmark goal recognition planning dataset generation multi-agent systems evaluation metric

通过多计划数据集生成消除目标识别中的规划器偏见 / Removing Planner Bias in Goal Recognition Through Multi-Plan Dataset Generation

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过为同一个目标生成多种不同的行动计划来构建数据集，从而消除现有目标识别评估中因依赖单一规划器而产生的系统性偏见，并引入了一个新指标来衡量识别模型在不同计划下的稳健性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04557

arXiv 提交日期: 2026-02-04

llm agents systems planning latent transitions embedding space next-state prediction generalization

基于显式潜在状态转移的文本规划 / Textual Planning with Explicit Latent Transitions

1️⃣ 一句话总结

这篇论文提出了一种名为EmbedPlan的新方法，它通过让模型在固定的文本语义向量空间中预测和检索下一个状态，从而绕过了传统大语言模型逐字生成和重复计算的瓶颈，实现了更快速、高效的文本规划，但其跨领域泛化能力仍有待提升。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03900

arXiv 提交日期: 2026-02-03

llm natural language processing model evaluation prompt engineering reasoning planning task decomposition benchmark

知识模型提示提升大语言模型在规划任务上的性能 / Knowledge Model Prompting Increases LLM Performance on Planning Tasks

1️⃣ 一句话总结

这篇论文提出了一种基于任务-方法-知识框架的提示方法，它能有效引导大语言模型进行结构化推理和任务分解，从而在复杂的符号规划任务上大幅提升其性能表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.10803

1️⃣ 一句话总结

arXiv ID: 2605.28454

1️⃣ 一句话总结

arXiv ID: 2605.17774

1️⃣ 一句话总结

arXiv ID: 2605.15181

1️⃣ 一句话总结

arXiv ID: 2605.12294

1️⃣ 一句话总结

arXiv ID: 2604.24039

1️⃣ 一句话总结

arXiv ID: 2603.25706

1️⃣ 一句话总结

arXiv ID: 2602.14691

1️⃣ 一句话总结

arXiv ID: 2602.04557

1️⃣ 一句话总结

arXiv ID: 2602.03900

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.10803 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28454 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.17774 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.15181 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.12294 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24039 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.25706 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.14691 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04557 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03900 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.10803

arXiv ID: 2605.28454

arXiv ID: 2605.17774

arXiv ID: 2605.15181

arXiv ID: 2605.12294

arXiv ID: 2604.24039

arXiv ID: 2603.25706

arXiv ID: 2602.14691

arXiv ID: 2602.04557

arXiv ID: 2602.03900