arXiv ID:
2605.28779
arXiv 提交日期: 2026-05-27
视觉语言因果推理中的抽象鸿沟 / The Abstraction Gap in Vision-Language Causal Reasoning
1️⃣ 一句话总结
本文发现当前的视觉语言模型虽然能流利地生成因果解释,但在真正进行因果推理时表现很差,并提出了一个‘抽象鸿沟’指标来量化这种语言流畅度与因果推理能力之间的差距,实验表明多数模型存在显著鸿沟且难以通过微调弥补,但某些模型结构设计有可能缩小这一差距。