arXiv最新AI论文速览速学

🔍

标签: #hallucination reduction ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: TIAR: Trajectory-Informed Advantage Reweighting for LLM Abstention Learning 05-31

arXiv ID: 2605.25850

arXiv 提交日期: 2026-05-25

llm model training model evaluation abstention learning reinforcement learning hallucination reduction advantage reweighting benchmark

基于轨迹信息优势重加权的LLM拒答学习 / TIAR: Trajectory-Informed Advantage Reweighting for LLM Abstention Learning

1️⃣ 一句话总结

本文提出了一种名为TIAR的新方法，利用模型生成回答过程中的多条候选轨迹作为置信度信号，动态调整奖励权重，从而更好地训练大语言模型学会在不确定时主动拒答，以有效减少幻觉现象。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.12650

arXiv 提交日期: 2026-05-12

medical multi-modal model training diffusion models reward finetuning clinical alignment medical image synthesis hallucination reduction

CRAFT：面向医学图像合成的临床对齐奖励微调方法 / CRAFT: Clinical Reward-Aligned Finetuning for Medical Image Synthesis

1️⃣ 一句话总结

本文提出了一种名为CRAFT的微调框架，通过引入临床对齐评分（CAS）和多模态大模型的知识，在奖励优化的引导下显著减少了医学图像生成中的幻觉和不合理现象，并提升了生成图像在病理相关标准上的对齐程度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.02452

arXiv 提交日期: 2026-05-04

llm systems multi-modal graphs knowledge grounding reasoning enhancement structured data hallucination reduction

观点：图如何帮助大型语言模型？ / Position: How can Graphs Help Large Language Models?

1️⃣ 一句话总结

本文从知识更新、推理增强和结构化数据理解三个角度，系统阐述了图技术如何帮助大型语言模型减少幻觉、提升推理能力并扩展应用场景，并展望了基于图的稀疏架构和人脑启发式记忆系统等未来方向。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.25737

arXiv 提交日期: 2026-04-28

llm agents natural language processing multi-agent code editing benchmark hallucination reduction iterative refinement

SAFEdit：多智能体分解能否解决指令式代码编辑的可靠性挑战？ / SAFEdit: Does Multi-Agent Decomposition Resolve the Reliability Challenges of Instructed Code Editing?

1️⃣ 一句话总结

本研究提出SAFEdit，一个由规划、编辑和验证三个专门智能体协作的多智能体框架，通过将代码编辑任务分解为不同角色并引入结构化错误诊断机制，显著提升了指令式代码编辑的可靠性，在EditBench基准上将成功率从低于60%提升至68.6%，并有效减少了代码编辑中的指令幻觉问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.07914

arXiv 提交日期: 2026-04-09

multi-modal model training model evaluation vision-language models hallucination reduction latent intervention generation behavior controlled steering

缓解大型视觉语言模型中的纠缠引导以降低幻觉 / Mitigating Entangled Steering in Large Vision-Language Models for Hallucination Reduction

1️⃣ 一句话总结

本文提出了一种名为MESA的即插即用框架，通过有选择性地干预模型内部信号来减少AI看图说话时产生的‘幻觉’（即文本与图像内容不符），同时避免了现有方法导致的输出变短或语言风格改变等问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.04838

arXiv 提交日期: 2026-04-06

multi-modal model evaluation natural language processing vision-language models visual question answering prompt engineering image degradation hallucination reduction

细节越少，答案越好：面向视觉问答的降质驱动提示框架 / Less Detail, Better Answers: Degradation-Driven Prompting for VQA

1️⃣ 一句话总结

这篇论文提出了一种名为‘降质驱动提示’的新方法，通过有策略地降低输入图像的清晰度并添加结构性提示，帮助视觉语言模型忽略干扰性细节，专注于核心结构信息，从而在复杂的视觉问答任务中取得更准确的结果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.04869

arXiv 提交日期: 2026-04-06

llm model training systems prompt optimization declarative learning dspy framework automated prompting hallucination reduction

基于DSPy声明式学习优化大语言模型提示工程 / Optimizing LLM Prompt Engineering with DSPy Based Declarative Learning

1️⃣ 一句话总结

这篇论文提出了一种名为DSPy的声明式框架，通过自动化和可学习的模块化方法，系统性地优化大语言模型的提示设计，从而显著提升了模型输出的准确性、可靠性并减少了幻觉现象，避免了传统手动试错方法的局限性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.23085

arXiv 提交日期: 2026-03-24

medical multi-modal model evaluation causal reasoning vision-language models medical diagnosis hallucination reduction self-reflection

MedCausalX：基于自适应的因果推理与自我反思构建可信赖的医疗视觉语言模型 / MedCausalX: Adaptive Causal Reasoning with Self-Reflection for Trustworthy Medical Vision-Language Models

1️⃣ 一句话总结

这篇论文提出了一个名为MedCausalX的新框架，它通过引入专门的因果推理链、自适应反思机制和纠错学习，让医疗AI在分析医学图像和文本时能像医生一样进行深度因果分析，从而显著减少误判和幻觉，提升诊断的可靠性和准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.14419

arXiv 提交日期: 2026-02-16

llm theory natural language processing transformer analysis hallucination reduction frequency decomposition embedding compression semantic consistency

WavePhaseNet：一种基于离散傅里叶变换构建语义概念层次结构的方法 / WavePhaseNet: A DFT-Based Method for Constructing Semantic Conceptual Hierarchy Structures (SCHS)

1️⃣ 一句话总结

这篇论文提出了一种名为WavePhaseNet的新方法，它利用离散傅里叶变换将大语言模型中的语义信息分解为不同频率成分，从而构建清晰的语义层次结构，理论上证明了模型‘幻觉’是其固有结构缺陷，并通过降维和数学上的同调一致性控制，在保留核心语义的同时有效抑制了幻觉，实现了更严谨的推理。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.14374

arXiv 提交日期: 2026-02-16

llm natural language processing systems differential privacy retrieval-augmented generation privacy-preserving ai question answering hallucination reduction

差分隐私检索增强生成 / Differentially Private Retrieval-Augmented Generation

1️⃣ 一句话总结

这篇论文提出了一种名为DP-KSA的新算法，通过差分隐私技术保护检索增强生成（RAG）系统中的敏感数据，在确保用户隐私的同时，有效减少了大型语言模型在专业任务中产生错误信息的风险。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.25850

1️⃣ 一句话总结

arXiv ID: 2605.12650

1️⃣ 一句话总结

arXiv ID: 2605.02452

1️⃣ 一句话总结

arXiv ID: 2604.25737

1️⃣ 一句话总结

arXiv ID: 2604.07914

1️⃣ 一句话总结

arXiv ID: 2604.04838

1️⃣ 一句话总结

arXiv ID: 2604.04869

1️⃣ 一句话总结

arXiv ID: 2603.23085

1️⃣ 一句话总结

arXiv ID: 2602.14419

1️⃣ 一句话总结

arXiv ID: 2602.14374

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.25850 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.12650 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.02452 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.25737 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.07914 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.04838 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.04869 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.23085 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.14419 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.14374 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.25850

arXiv ID: 2605.12650

arXiv ID: 2605.02452

arXiv ID: 2604.25737

arXiv ID: 2604.07914

arXiv ID: 2604.04838

arXiv ID: 2604.04869

arXiv ID: 2603.23085

arXiv ID: 2602.14419

arXiv ID: 2602.14374