arXiv最新AI论文速览速学

🔍

标签: #visual hallucination ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 43 72小时内新更新论文 72h更新 136 最新: Mitigating Visual Hallucinations in Multimodal Systems through Retrieval-Augmented Reliability-Aware Inference 06-22

arXiv ID: 2606.15782

arXiv 提交日期: 2026-06-14

multi-modal llm visual hallucination reliability estimation retrieval-augmented generation uncertainty quantification decision gating

通过检索增强的可靠性感知推理缓解多模态系统中的视觉幻觉 / Mitigating Visual Hallucinations in Multimodal Systems through Retrieval-Augmented Reliability-Aware Inference

1️⃣ 一句话总结

本文提出了一种新的框架，通过在外部图像数据库中检索相似视觉证据，并结合多个可靠性指标（如相似度、类别一致性、不确定性）来评估预测的可信度，从而在视觉信息模糊或矛盾时，让多模态AI系统选择“谨慎回答”或“拒绝回答”，而不是盲目给出错误答案；实验表明，该方法在不重新训练模型的情况下，将错误答案率从14.16%降至11.12%，提升了系统的可信度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.16284

arXiv 提交日期: 2026-03-17

llm multi-modal model evaluation visual hallucination feature steering causal attribution layerwise sparsity vision-language models

先定位后稀疏化：一种用于缓解视觉幻觉的归因引导稀疏策略 / Locate-then-Sparsify: Attribution Guided Sparse Strategy for Visual Hallucination Mitigation

1️⃣ 一句话总结

这篇论文提出了一种名为LTS-FS的即插即用框架，它通过量化大视觉语言模型中每一层与幻觉问题的关联程度，从而有针对性地调整这些层的特征，在有效减少模型幻觉的同时，不影响其完成其他一般任务的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21497

arXiv 提交日期: 2026-02-25

llm multi-modal model evaluation multimodal reasoning visual hallucination chain-of-thought training-free benchmark

看见它，说出它，搞定它：一种用于大型视觉语言模型视觉基础多模态推理的免训练迭代框架 / See It, Say It, Sorted: An Iterative Training-Free Framework for Visually-Grounded Multimodal Reasoning in LVLMs

1️⃣ 一句话总结

这篇论文提出了一种无需额外训练、即插即用的轻量级方法，通过让大型视觉语言模型在推理的每一步都严格依据图像证据来生成回答，有效解决了多模态推理中视觉幻觉传播导致答案错误的问题，显著提升了多个基准测试的准确率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.15782

1️⃣ 一句话总结

arXiv ID: 2603.16284

1️⃣ 一句话总结

arXiv ID: 2602.21497

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.15782 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.16284 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21497 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.15782

arXiv ID: 2603.16284

arXiv ID: 2602.21497