arXiv ID:
2604.21346
arXiv 提交日期: 2026-04-23
符号化锚定揭示抽象视觉推理中的表征瓶颈 / Symbolic Grounding Reveals Representational Bottlenecks in Abstract Visual Reasoning
1️⃣ 一句话总结
该研究通过对比视觉-语言模型直接处理图像与大型语言模型处理从图像中提取的符号化输入,发现抽象视觉推理的主要瓶颈不在于模型自身的推理能力,而在于如何将视觉信息转化为有效的符号表征。