arXiv最新AI论文速览速学

🔍

标签: #agentic framework ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 119 72小时内新更新论文 72h更新 124 最新: EchoGuard: An Agentic Framework with Knowledge-Graph Memory for Detecting Manipulative Communication in Longitudinal Dialogue 03-06

arXiv ID: 2603.04815

arXiv 提交日期: 2026-03-05

llm agents systems knowledge graph manipulative communication agentic framework longitudinal dialogue memory architecture

EchoGuard：一种基于知识图谱记忆的智能体框架，用于检测纵向对话中的操控性沟通 / EchoGuard: An Agentic Framework with Knowledge-Graph Memory for Detecting Manipulative Communication in Longitudinal Dialogue

1️⃣ 一句话总结

这篇论文提出了一个名为EchoGuard的智能体框架，它利用知识图谱作为长期记忆来追踪和分析对话中的操控行为（如情感操控和煤气灯效应），并通过结构化的查询和提示帮助用户自主识别这些有害的沟通模式。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04496

arXiv 提交日期: 2026-02-04

llm agents model evaluation scientific reasoning agentic framework confidence control multi-agent reasoning reasoning benchmarks

ReThinker：通过引导反思与置信度控制进行科学推理 / ReThinker: Scientific Reasoning by Rethinking with Guided Reflection and Confidence Control

1️⃣ 一句话总结

这篇论文提出了一个名为ReThinker的智能推理框架，它能让大型语言模型像专家一样进行科学推理，核心创新在于通过动态评估自身回答的‘信心程度’来灵活调用工具和反思纠错，从而在多个高难度科学考试基准上取得了目前最好的成绩。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.01640

arXiv 提交日期: 2026-02-02

agents model evaluation benchmark embodied ai automatic evaluation benchmark curation agentic framework cost reduction

A2Eval：具身智能体的代理化与自动化评估框架 / A2Eval: Agentic and Automated Evaluation for Embodied Brain

1️⃣ 一句话总结

这篇论文提出了一个名为A2Eval的自动化评估框架，它通过两个协作的智能代理来自动生成平衡的测试集和执行评估，从而大幅降低了传统具身智能模型评估的成本和时间，同时纠正了排名偏差，使评估结果更可靠、更高效。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.18081

arXiv 提交日期: 2026-01-26

llm agents natural language processing academic rebuttal agentic framework retrieval-augmented generation planning scientific communication

DRPG（分解、检索、规划、生成）：一个用于学术反驳的智能体框架 / DRPG (Decompose, Retrieve, Plan, Generate): An Agentic Framework for Academic Rebuttal

1️⃣ 一句话总结

这篇论文提出了一个名为DRPG的四步智能体框架，它通过分解审稿意见、检索论文证据、规划反驳策略并生成回答，能够自动生成高质量且有针对性的学术论文反驳意见，其性能甚至超过了平均水平的人类作者。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.18157

arXiv 提交日期: 2026-01-26

agents multi-modal video egocentric video long-horizon reasoning entity scene graphs agentic framework video understanding

智能体驱动的超长视频理解 / Agentic Very Long Video Understanding

1️⃣ 一句话总结

这项研究提出了一种名为EGAgent的新框架，它利用实体场景图来帮助AI助手理解和推理持续数天甚至数周的个人穿戴设备拍摄的超长视频，从而在复杂的长时视频理解任务上取得了领先的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.17737

arXiv 提交日期: 2026-01-25

video generation agents natural language processing dialogue-to-video agentic framework cinematic script generation long-horizon coherence multimodal benchmark

剧本即一切：一种用于长时域对话到电影视频生成的智能体框架 / The Script is All You Need: An Agentic Framework for Long-Horizon Dialogue-to-Cinematic Video Generation

1️⃣ 一句话总结

这篇论文提出了一个由智能体驱动的端到端框架，能够将粗略的对话自动转化为精细的电影剧本，并以此指导视频生成模型，从而生成情节连贯的长篇叙事视频，解决了现有模型难以从高级概念（如对话）生成连贯长视频的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.09150

arXiv 提交日期: 2026-01-14

llm agents systems world generation agentic framework text-to-environment multi-agent system visual simulation

World Craft：通过文本创建可视化世界的智能体框架 / World Craft: Agentic Framework to Create Visualizable Worlds via Text

1️⃣ 一句话总结

这篇论文提出了一个名为World Craft的智能体框架，它能让普通用户仅通过文字描述，就能轻松创建出可运行、可交互的可视化虚拟世界，无需编程技能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.05163

arXiv 提交日期: 2026-01-08

llm agents natural language processing document question answering tool utilization data synthesis long-context understanding agentic framework

DocDancer：迈向基于文档的自主信息搜索智能体 / DocDancer: Towards Agentic Document-Grounded Information Seeking

1️⃣ 一句话总结

这篇论文提出了一个名为DocDancer的开源智能体，它通过创新的工具驱动框架和自动生成训练数据的方法，显著提升了从长文档中自主搜索和回答问题的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.20292

arXiv 提交日期: 2025-12-23

aigc natural language processing multi-modal presentation generation personalization paper-to-slides user preference agentic framework

SlideTailor：面向科研论文的个性化演示文稿幻灯片生成 / SlideTailor: Personalized Presentation Slide Generation for Scientific Papers

1️⃣ 一句话总结

这篇论文提出了一个名为SlideTailor的智能框架，它能够根据用户提供的一篇论文及其对应的幻灯片示例和一个视觉模板，自动学习并生成符合该用户独特内容和视觉风格偏好的、可编辑的演示文稿幻灯片，从而解决了现有幻灯片生成方法无法满足个性化需求的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.14442

arXiv 提交日期: 2025-12-16

agents computer vision multi-modal affordance reasoning zero-shot vision-language models embodied ai agentic framework

A4-Agent：一种用于零样本可供性推理的智能体框架 / A4-Agent: An Agentic Framework for Zero-Shot Affordance Reasoning

1️⃣ 一句话总结

这篇论文提出了一个名为A4-Agent的零样本智能体框架，它通过协调三个预训练基础模型（分别负责想象交互过程、推理交互对象部件和精确定位交互区域），无需额外训练就能在多种物体和环境上实现比有监督方法更好的交互区域预测，解决了现有模型泛化能力差的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.04815

1️⃣ 一句话总结

arXiv ID: 2602.04496

1️⃣ 一句话总结

arXiv ID: 2602.01640

1️⃣ 一句话总结

arXiv ID: 2601.18081

1️⃣ 一句话总结

arXiv ID: 2601.18157

1️⃣ 一句话总结

arXiv ID: 2601.17737

1️⃣ 一句话总结

arXiv ID: 2601.09150

1️⃣ 一句话总结

arXiv ID: 2601.05163

1️⃣ 一句话总结

arXiv ID: 2512.20292

1️⃣ 一句话总结

arXiv ID: 2512.14442

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.04815 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04496 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.01640 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.18081 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.18157 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.17737 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.09150 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.05163 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.20292 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.14442 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.04815

arXiv ID: 2602.04496

arXiv ID: 2602.01640

arXiv ID: 2601.18081

arXiv ID: 2601.18157

arXiv ID: 2601.17737

arXiv ID: 2601.09150

arXiv ID: 2601.05163

arXiv ID: 2512.20292

arXiv ID: 2512.14442