arXiv ID:
2602.04355
arXiv 提交日期: 2026-02-04
视觉能替代文本在工作记忆中发挥作用吗?来自视觉语言模型空间n-back任务的证据 / Can Vision Replace Text in Working Memory? Evidence from Spatial n-Back in Vision-Language Models
1️⃣ 一句话总结
这篇论文通过一个空间记忆测试发现,视觉语言模型在处理文本信息时的工作记忆表现比处理视觉图像时更准确可靠,揭示了模型在多模态工作记忆中存在计算差异。