arXiv最新AI论文速览速学

🔍

标签: #retrieval-augmented generation ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: Mitigating Visual Hallucinations in Multimodal Systems through Retrieval-Augmented Reliability-Aware Inference 06-22

arXiv ID: 2606.15782

arXiv 提交日期: 2026-06-14

multi-modal llm visual hallucination reliability estimation retrieval-augmented generation uncertainty quantification decision gating

通过检索增强的可靠性感知推理缓解多模态系统中的视觉幻觉 / Mitigating Visual Hallucinations in Multimodal Systems through Retrieval-Augmented Reliability-Aware Inference

1️⃣ 一句话总结

本文提出了一种新的框架，通过在外部图像数据库中检索相似视觉证据，并结合多个可靠性指标（如相似度、类别一致性、不确定性）来评估预测的可信度，从而在视觉信息模糊或矛盾时，让多模态AI系统选择“谨慎回答”或“拒绝回答”，而不是盲目给出错误答案；实验表明，该方法在不重新训练模型的情况下，将错误答案率从14.16%降至11.12%，提升了系统的可信度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.10572

arXiv 提交日期: 2026-06-09

llm multi-modal model training latent memory question answering retrieval-augmented generation token efficiency compression

每项多模态证据仅用一个token：面向资源受限问答的隐式记忆 / One Token per Multimodal Evidence: Latent Memory for Resource-Constrained QA

1️⃣ 一句话总结

本文提出了一种名为“隐式记忆”的新方法，将每个文本或图像证据压缩成一个高维的“隐式token”，从而大幅降低大模型在问答任务中需要处理的数据量，在节省3到10倍计算资源的同时，仍能保持甚至提升答案的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.05875

arXiv 提交日期: 2026-06-04

llm systems model serving cache fusion retrieval-augmented generation kv cache query-aware selection prefill acceleration

QCFuse：通过压缩视图实现查询感知缓存融合以高效支持RAG服务 / QCFuse: Query-Aware Cache Fusion via Compressed View for Efficient RAG Serving

1️⃣ 一句话总结

本文提出一种名为QCFuse的高效方法，通过压缩视图技术让系统在复用已计算好的缓存时，能快速识别出哪些检索内容与当前用户的查询最相关，从而大幅减少重复计算，提升AI助手的响应速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.04755

arXiv 提交日期: 2026-06-03

systems llm agents retrieval-augmented generation scientific collaboration operations support local models open-source

Archi：CMS实验中的智能体化运维系统 / Archi: Agentic Operations at the CMS Experiment

1️⃣ 一句话总结

本文介绍了一个名为Archi的开源框架，它能够整合来自多个来源的文档、历史数据和实时监控信息，并通过可配置的AI智能体为CMS实验的运维团队提供智能问答与决策支持，在保护数据隐私的前提下，有效解决了实际运维中的复杂问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.03728

arXiv 提交日期: 2026-06-02

llm natural language processing retrieval-augmented generation legal question answering citation quality re-ranking attribution

基于归因视角的重排序：提升法律问答中的引文质量 / Re-Ranking Through an Attribution Lens for Citation Quality in Legal QA

1️⃣ 一句话总结

该论文发现传统基于语义相似度的检索在法律问答中并不能有效找到被引用的重要段落，于是提出用轻量级模型学习段落归因分数来重新排序，从而显著提升模型生成答案的引文准确性和与专家答案的一致性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.29602

arXiv 提交日期: 2026-05-28

multi-modal model training systems retrieval-augmented generation cognitive reasoning geometric reasoning knowledge graphs optimal transport

CogniVerse：借助认知反思与几何推理革新多模态检索增强生成 / CogniVerse: Revolutionizing Multi-Modal Retrieval-Augmented Generation with Cognitive Reflection and Geometric Reasoning

1️⃣ 一句话总结

本文提出了一种名为CogniVerse的新型多模态检索增强生成框架，通过模仿人类认知过程中的反思、几何空间对齐和分层生成策略，有效解决了现有方法中检索噪音大、跨模态信息错位以及生成内容不连贯等关键问题，在准确性和一致性上显著超越了现有技术。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.30029

arXiv 提交日期: 2026-05-28

systems benchmark retrieval-augmented generation hyperparameter optimization architecture search evaluation

RAISE：将RAG设计视为一个架构搜索问题 / RAISE: RAG Design as an Architecture Search Problem

1️⃣ 一句话总结

本文指出当前检索增强生成（RAG）系统的众多设计参数（如查询改写、分块策略、检索深度、重排序与上下文压缩）通常靠经验设定，缺乏系统性和可复现性，因此将其形式化为一个架构搜索问题，并提出了一个名为RAISE的综合框架与基准，通过统一搜索空间和预算、集成13种搜索算法并在7个文本与多模态数据集上测试，揭示了最优参数高度依赖于具体任务，不存在通用的最佳策略。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28074

arXiv 提交日期: 2026-05-27

llm security systems retrieval-augmented generation adversarial attack data poisoning security evaluation

静默检索：通过语义保持的对抗性数据投毒劫持检索增强生成系统 / SilentRetrieval: Hijacking Retrieval-Augmented Generation via Semantically-Preserving Adversarial Data Poisoning

1️⃣ 一句话总结

这篇论文提出了一种名为SilentRetrieval的两阶段攻击方法，通过注入看似正常但精心设计的文档来劫持检索增强生成（RAG）系统，使模型在回答问题时被诱导输出错误信息，实验证明该攻击在多种标准数据集和模型上成功率很高，且难以被常规防御完全阻止。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.27294

arXiv 提交日期: 2026-05-26

llm model evaluation retrieval-augmented generation reader model semantic competition context length matched-control protocol

在RAG阅读理解中区分语义竞争与上下文长度的影响 / Separating Semantic Competition from Context Length in RAG Reading

1️⃣ 一句话总结

本文提出一种新的实验方法，通过在保持上下文长度不变的情况下替换干扰文档，证明检索增强生成（RAG）系统的错误不仅由长上下文引起，更来自语义相似的干扰文档的竞争，并在两个小模型上验证了该方法能显著提升回答准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.27164

arXiv 提交日期: 2026-05-26

llm data multi-modal retrieval-augmented generation knowledge graph semantic retrieval symbolic reasoning benchmark

用符号查询还是语义检索？面向半结构化问答的数据集与方法 / Query Symbolically or Retrieve Semantically? A Dataset and Method for Semi-Structured Question Answering

1️⃣ 一句话总结

本文提出DualGraph框架，通过同时构建文本知识图谱用于语义检索和符号知识图谱用于精确查询，解决了半结构化文档中既需要语义理解又需要结构化操作的问答难题，并发布了来自电商网站的新基准数据集SpecsQA，实验证明该方法优于现有各类基线模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.15782

1️⃣ 一句话总结

arXiv ID: 2606.10572

1️⃣ 一句话总结

arXiv ID: 2606.05875

1️⃣ 一句话总结

arXiv ID: 2606.04755

1️⃣ 一句话总结

arXiv ID: 2606.03728

1️⃣ 一句话总结

arXiv ID: 2605.29602

1️⃣ 一句话总结

arXiv ID: 2605.30029

1️⃣ 一句话总结

arXiv ID: 2605.28074

1️⃣ 一句话总结

arXiv ID: 2605.27294

1️⃣ 一句话总结

arXiv ID: 2605.27164

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.15782 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.10572 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.05875 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.04755 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.03728 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.29602 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.30029 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28074 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.27294 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.27164 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.15782

arXiv ID: 2606.10572

arXiv ID: 2606.05875

arXiv ID: 2606.04755

arXiv ID: 2606.03728

arXiv ID: 2605.29602

arXiv ID: 2605.30029

arXiv ID: 2605.28074

arXiv ID: 2605.27294

arXiv ID: 2605.27164