🤖 系统
12-06 15:13
通过自增强对比对齐缓解多模态大语言模型中的物体与动作幻觉 / Mitigating Object and Action Hallucinations in Multimodal LLMs via Self-Augmented Contrastive Alignment
1️⃣ 一句话总结
这篇论文提出了一个名为SANTA的自增强对比对齐框架,通过识别并利用模型自身可能产生的错误描述来构建对比样本,从而有效减少多模态大模型在视频描述任务中凭空捏造物体和动作的幻觉问题。