← 返回列表

菜单

🤖 系统
📄 Abstract - Mitigating Object Hallucination in Large Vision-Language Models via Visual Token Cognitive Uncertainty
正在获取摘要...
详细标签: object hallucination visual uncertainty adversarial attacks attention masking vision-language models 或 搜索:

📄 论文总结

基于视觉标记认知不确定性缓解大型视觉语言模型物体幻觉 / Mitigating Object Hallucination in Large Vision-Language Models via Visual Token Cognitive Uncertainty


1️⃣ 一句话总结

本研究提出了一种通过识别和掩码视觉编码器中高认知不确定性的视觉标记来有效减少大型视觉语言模型中物体幻觉的方法。


2️⃣ 论文创新点

1. 视觉标记不确定性分析

2. 基于对抗攻击的不确定性视觉标记识别

3. 视觉编码器干预方法

4. 不确定性掩码的自注意力干预


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF