arXiv ID:
2512.08923
arXiv 提交日期: 2025-12-09
相同内容,不同答案:多模态大语言模型中的跨模态不一致性 / Same Content, Different Answers: Cross-Modal Inconsistency in MLLMs
1️⃣ 一句话总结
这篇论文通过创建新的评测基准,揭示了当前多模态大模型在处理图像、文字等不同形式但语义相同的信息时,会给出不一致的答案,并发现这种不一致性与模型内部视觉和文本表征的差异有关。