arXiv最新AI论文速览速学

🔍

标签: #retrieval-augmented generation ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: Mitigating Visual Hallucinations in Multimodal Systems through Retrieval-Augmented Reliability-Aware Inference 06-22

arXiv ID: 2605.25658

arXiv 提交日期: 2026-05-25

llm systems model training solver generation expensive optimization retrieval-augmented generation self-refinement llm-as-a-judge

AutoSG：仅从任务提示出发、由大语言模型驱动的昂贵优化问题求解器自动生成方法 / AutoSG: LLM-Driven Solver Generation Solely from Task Prompts for Expensive Optimization

1️⃣ 一句话总结

本文提出一种名为AutoSG的自动化框架，它能直接将用户用自然语言描述的任务要求转化为专用于昂贵优化问题的高效求解器，通过引用已验证文献来避免幻觉、一次性的自优化来保留已有优秀结构，以及利用无需真实算例的大语言模型评分机制快速比较不同求解器的优劣，从而在多个实际任务上超越人工设计的顶尖方法和现有自动生成方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.20729

arXiv 提交日期: 2026-05-20

llm multi-agents benchmark retrieval-augmented generation conversational retrieval evaluation framework dialogue synthesis

MTR-Suite：一个用于评估和合成对话检索基准的框架 / MTR-Suite: A Framework for Evaluating and Synthesizing Conversational Retrieval Benchmarks

1️⃣ 一句话总结

本文提出了MTR-Suite框架，通过大语言模型驱动的自动审计工具和低成本的对话生成系统，解决了现有对话检索基准中人工标注昂贵、自动化数据不自然的问题，并构建了一个更具区分力的通用基准测试集。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.21807

arXiv 提交日期: 2026-05-20

medical llm benchmark clinical question answering retrieval-augmented generation off-guideline reasoning evidence-based medicine free-form evaluation

当病例罕见时：面向脱离指南的临床问答的检索基准 / When Cases Get Rare: A Retrieval Benchmark for Off-Guideline Clinical Question Answering

1️⃣ 一句话总结

该论文提出了一个名为OGCaReBench的新型基准测试，专门评估大语言模型在面对罕见、不遵循常规指南的临床问题时，通过检索真实医学文献来提供准确答案的能力，实验表明即使最强模型直接回答也仅有56%正确率，而结合文档检索后准确率可提升至82%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.19366

arXiv 提交日期: 2026-05-19

machine learning llm deep learning flood prediction weather forecasting retrieval-augmented generation uncertainty quantification

面向环境科学问题的精准、高效且可解释的深度学习方法 / Accurate, Efficient, and Explainable Deep Learning Approaches for Environmental Science Problems

1️⃣ 一句话总结

这篇论文针对环境科学中的三大难题——洪水预测、全球天气预报和科学问答，分别设计了三种深度学习模型，在保证高精度的同时显著提升了计算效率，并且其预测结果还能被人类理解，为环保决策提供了实用工具。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.17902

arXiv 提交日期: 2026-05-18

llm machine learning systems retrieval-augmented generation degradation modeling model selection remaining useful life knowledge conditioning

LAST-RAG：基于文献锚定的随机轨迹检索增强生成方法用于知识约束的退化模型选择 / LAST-RAG: Literature-Anchored Stochastic Trajectory Retrieval-Augmented Generation for Knowledge-Conditioned Degradation Model Selection

1️⃣ 一句话总结

本文提出了一种名为LAST-RAG的新方法，通过结合观测数据与领域文献知识，智能选择最合适的随机过程模型来预测设备剩余使用寿命，解决了传统单纯依赖数据拟合在数据不足时可能选错模型的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.18271

arXiv 提交日期: 2026-05-18

llm agents systems retrieval-augmented generation preference alignment on-device memory efficiency personal ai

从容量到价值：面向设备端RAG的偏好对齐记忆构建 / From Volume to Value: Preference-Aligned Memory Construction for On-Device RAG

1️⃣ 一句话总结

本文提出了一种名为EPIC的高效方法，通过在设备端（如手机）上只存储与用户个人偏好最相关的信息，并让检索过程聚焦于这些偏好，从而在极低内存占用（低于1MB）下大幅提升AI助手理解用户意图、遵循偏好的准确率（提升20%），同时将响应速度提升33倍以上。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.15184

arXiv 提交日期: 2026-05-14

llm agents systems retrieval-augmented generation tool calling agent harness grep vs vector search

只需 Grep 就够了？智能体如何通过执行框架重塑搜索能力 / Is Grep All You Need? How Agent Harnesses Reshape Agentic Search

1️⃣ 一句话总结

本文通过实验发现，在智能体搜索系统中，简单的关键词搜索（grep）在准确性上往往优于复杂的向量检索，但最终效果更取决于智能体执行框架和工具调用方式的设计，而非单纯的检索算法本身。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.14473

arXiv 提交日期: 2026-05-14

llm systems retrieval-augmented generation knowledge conflict context compliance belief decomposition adversarial stress test

检索增强生成何时能察觉检索错误？——知识冲突下的上下文合规性诊断 / Does RAG Know When Retrieval Is Wrong? Diagnosing Context Compliance under Knowledge Conflict

1️⃣ 一句话总结

本文提出一种名为“上下文驱动分解”的推理时探测方法，能够揭示检索增强生成模型在检索结果与自身知识冲突时，是否盲目遵循错误上下文，并通过实验证明该方法能显著提升模型在对抗性测试中的准确率与鲁棒性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.14192

arXiv 提交日期: 2026-05-13

llm machine learning natural language processing retrieval-augmented generation circuit tracing attribution graphs error detection reasoning analysis

检索增强生成为何失败：基于图的视角 / Why Retrieval-Augmented Generation Fails: A Graph Perspective

1️⃣ 一句话总结

本文通过构建归因图来可视化检索增强生成（RAG）过程中信息在模型内部的流动路径，发现正确回答通常依赖更深、更分散的结构化证据链，而失败案例中证据流动浅层且集中；基于此，作者提出了一个利用图拓扑特征检测错误并改进模型推理的新方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.12988

arXiv 提交日期: 2026-05-13

llm education retrieval-augmented generation intelligent tutoring system algorithmic reasoning scaffolding simulation evaluation

面向人工智能教育的算法追踪与问题解决：检索增强式智能辅导系统 / Retrieval-Augmented Tutoring for Algorithm Tracing and Problem-Solving in AI Education

1️⃣ 一句话总结

本文提出了一种名为KITE的检索增强生成智能辅导系统，通过结合课程资料的检索和分步引导策略，帮助学生在学习算法时理解执行过程、纠正推理错误并提升问题解决能力，实验证明其能够提供准确且教育上有效的反馈。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.25658

1️⃣ 一句话总结

arXiv ID: 2605.20729

1️⃣ 一句话总结

arXiv ID: 2605.21807

1️⃣ 一句话总结

arXiv ID: 2605.19366

1️⃣ 一句话总结

arXiv ID: 2605.17902

1️⃣ 一句话总结

arXiv ID: 2605.18271

1️⃣ 一句话总结

arXiv ID: 2605.15184

1️⃣ 一句话总结

arXiv ID: 2605.14473

1️⃣ 一句话总结

arXiv ID: 2605.14192

1️⃣ 一句话总结

arXiv ID: 2605.12988

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.25658 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.20729 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.21807 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.19366 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.17902 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.18271 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.15184 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.14473 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.14192 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.12988 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.25658

arXiv ID: 2605.20729

arXiv ID: 2605.21807

arXiv ID: 2605.19366

arXiv ID: 2605.17902

arXiv ID: 2605.18271

arXiv ID: 2605.15184

arXiv ID: 2605.14473

arXiv ID: 2605.14192

arXiv ID: 2605.12988