🤖 系统
11-30 17:32
📄 论文总结
Dr.V:一种通过细粒度时空定位诊断视频幻觉的分层感知-时序-认知框架 / Dr.V: A Hierarchical Perception-Temporal-Cognition Framework to Diagnose Video Hallucination by Fine-grained Spatial-Temporal Grounding
1️⃣ 一句话总结
本文提出了一个名为Dr.V的分层框架,通过结合细粒度的时空定位和认知推理,有效检测和诊断大型视频模型在理解视频时产生的幻觉问题,并提供了包含丰富标注的基准数据集和诊断工具,以提高模型的可靠性和可解释性。