arXiv ID:
2603.15557
谎言的剖析:一个用于追踪视觉语言模型幻觉的多阶段诊断框架 / Anatomy of a Lie: A Multi-Stage Diagnostic Framework for Tracing Hallucinations in Vision-Language Models
1️⃣ 一句话总结
这篇论文提出了一种新方法,将视觉语言模型产生幻觉(即生成看似合理但事实错误的描述)的过程,看作是其内部“计算认知”的动态病理轨迹,并通过一个可解释的“认知状态空间”来检测和归因这些错误,从而让模型的推理过程更透明、可诊断。