arXiv最新AI论文速览速学

🔍

标签: #multi-hop reasoning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: LLMs+Graphs: Toward Graph-Native, Synergistic AI Systems 06-11

arXiv ID: 2606.11560

arXiv 提交日期: 2026-06-10

llm systems graph-native ai knowledge graphs graph neural networks multi-hop reasoning ai agents

大语言模型与图：迈向图原生的协同人工智能系统 / LLMs+Graphs: Toward Graph-Native, Synergistic AI Systems

1️⃣ 一句话总结

本文系统阐述了如何将大语言模型与图计算、知识图谱和图神经网络深度融合，构建更强大、更可信的下一代图原生人工智能系统，以解决大模型在结构化推理和多步推理方面的局限。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.09338

arXiv 提交日期: 2026-06-08

llm natural language processing model evaluation multi-hop reasoning compositional knowledge pretraining exposure implicit reasoning data augmentation

多跳知识组合受限于预训练中的暴露程度 / Multi-Hop Knowledge Composition is Bound by Pretraining Exposure

1️⃣ 一句话总结

研究发现，大型语言模型在执行隐式多跳推理时（例如，结合“出生时间”和“好友关系”回答“好友的出生时间”）会失败，即使它能准确回答每个单跳问题，原因在于预训练期间模型必须直接接触过组合多个事实的上下文，否则即使单跳知识完整，也无法自主组合出新答案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.05749

arXiv 提交日期: 2026-06-04

multi-modal agents llm document qa multimodal retrieval memory-augmented multi-hop reasoning iterative refinement

MARDoc：面向多模态长文档问答的忆感知精炼智能体框架 / MARDoc: A Memory-Aware Refinement Agent Framework for Multimodal Long Document QA

1️⃣ 一句话总结

本文提出了一种名为MARDoc的多智能体框架，通过将文档问答任务分解为检索、精炼和反思三个专业化角色，并利用结构化记忆代替杂乱的历史记录，有效解决了长文档中证据分散、推理易受干扰的问题，从而显著提升了复杂多步问答的准确性和可靠性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.05245

arXiv 提交日期: 2026-05-04

natural language processing llm systems retrieval-augmented generation multi-hop reasoning evidence selection token efficiency question answering

AdaGATE：面向多跳检索增强生成的自适应缺口感知令牌高效证据整合方法 / AdaGATE: Adaptive Gap-Aware Token-Efficient Evidence Assembly for Multi-Hop Retrieval-Augmented Generation

1️⃣ 一句话总结

本文提出了一种无需训练的智能证据筛选方法AdaGATE，它通过自动识别和填补信息缺口、生成精准子问题，并智能权衡证据的覆盖度、新颖性和相关性，以更少的输入文本显著提升了多跳问答在复杂检索场景下的准确性和稳健性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.02819

arXiv 提交日期: 2026-05-04

llm knowledge graph model evaluation process reward model monte carlo tree search multi-hop reasoning risk-sensitive reasoning question answering

SCPRM：一种用于知识图谱问答的架构感知累积过程奖励模型 / SCPRM: A Schema-aware Cumulative Process Reward Model for Knowledge Graph Question Answering

1️⃣ 一句话总结

本文提出了一种名为SCPRM的新模型，它在知识图谱问答中通过结合当前推理步骤与目标之间的架构距离来评估推理路径的正确性，从而解决了传统过程奖励模型因容错效应而误判有缺陷推理路径的问题，并在医学、法律等高风险领域取得了更准确和稳健的推理效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.25122

arXiv 提交日期: 2026-04-28

multi-modal benchmark llm visual question answering multi-hop reasoning mllm evaluation knowledge base retrieval-augmented

M³-VQA：面向多模态、多实体、多跳视觉问答的基准数据集 / M$^3$-VQA: A Benchmark for Multimodal, Multi-Entity, Multi-Hop Visual Question Answering

1️⃣ 一句话总结

该论文提出了一个名为M³-VQA的新型视觉问答基准，专门设计用于测试多模态大模型在同时处理多个实体、结合文本与图像信息，并进行多步推理方面的能力，实验发现现有模型在没有外部知识时表现很差，但提供精确证据后性能显著提升，同时结构化推理比简单搜索更有效。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.12487

arXiv 提交日期: 2026-04-14

llm agents natural language processing knowledge graph reasoning reinforcement learning multi-hop reasoning knowledge base question answering end-to-end training

KG-Reasoner：一个用于端到端多跳知识图谱推理的强化学习模型 / KG-Reasoner: A Reinforced Model for End-to-End Multi-Hop Knowledge Graph Reasoning

1️⃣ 一句话总结

这篇论文提出了一个名为KG-Reasoner的端到端框架，它通过强化学习训练大语言模型，使其能够像人一样在知识图谱中进行动态、连贯的多步推理，从而有效解决了复杂查询的推理难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15594

arXiv 提交日期: 2026-03-16

llm agents data search agents training data synthesis multi-hop reasoning open-source benchmark evaluation

OpenSeeker：通过完全开源训练数据，让前沿搜索智能体技术大众化 / OpenSeeker: Democratizing Frontier Search Agents by Fully Open-Sourcing Training Data

1️⃣ 一句话总结

这篇论文提出了一个名为OpenSeeker的完全开源搜索智能体，它通过创新的数据合成方法，仅用少量数据就达到了行业顶尖的搜索性能，旨在打破大公司垄断，推动该领域研究的开放与协作。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.09203

arXiv 提交日期: 2026-03-10

agents llm model evaluation retrieval-augmented generation multi-hop reasoning process reward reinforcement learning question answering

评估即行动：检索增强智能体的自评估过程奖励 / Evaluate-as-Action: Self-Evaluated Process Rewards for Retrieval-Augmented Agents

1️⃣ 一句话总结

这篇论文提出了一种名为EvalAct的新方法，通过让AI在每一步检索信息后立即进行自我评估打分，并结合一种新的训练算法来优化中间推理步骤，从而显著提升了检索增强智能体在复杂多步问答任务中的准确性和可靠性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.23286

arXiv 提交日期: 2026-02-26

natural language processing benchmark data question answering table-text reasoning multi-hop reasoning benchmark generation sql-to-text

SPARTA：一种面向文本与表格的、可扩展且原理化的树状多跳问答基准测试 / SPARTA: Scalable and Principled Benchmark of Tree-Structured Multi-hop QA over Text and Tables

1️⃣ 一句话总结

这篇论文提出了一个名为SPARTA的自动化框架，它能高效生成大规模、高质量的跨文本和表格的多跳复杂问答数据集，用于更真实地评估模型在需要聚合、分组和深层推理等高级操作上的能力，并揭示了当前先进模型在此类任务上的显著不足。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.11560

1️⃣ 一句话总结

arXiv ID: 2606.09338

1️⃣ 一句话总结

arXiv ID: 2606.05749

1️⃣ 一句话总结

arXiv ID: 2605.05245

1️⃣ 一句话总结

arXiv ID: 2605.02819

1️⃣ 一句话总结

arXiv ID: 2604.25122

1️⃣ 一句话总结

arXiv ID: 2604.12487

1️⃣ 一句话总结

arXiv ID: 2603.15594

1️⃣ 一句话总结

arXiv ID: 2603.09203

1️⃣ 一句话总结

arXiv ID: 2602.23286

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.11560 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.09338 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.05749 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.05245 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.02819 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.25122 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.12487 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15594 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.09203 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.23286 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.11560

arXiv ID: 2606.09338

arXiv ID: 2606.05749

arXiv ID: 2605.05245

arXiv ID: 2605.02819

arXiv ID: 2604.25122

arXiv ID: 2604.12487

arXiv ID: 2603.15594

arXiv ID: 2603.09203

arXiv ID: 2602.23286