arXiv ID:
2603.03002
arXiv 提交日期: 2026-03-03
SpatialText:一个用于评估大语言模型空间理解能力的纯文本认知基准 / SpatialText: A Pure-Text Cognitive Benchmark for Spatial Understanding in Large Language Models
1️⃣ 一句话总结
这篇论文提出了一个名为SpatialText的纯文本基准测试,通过分析大语言模型在空间推理任务中的系统性错误,发现它们主要依赖语言关联而非构建真正的内部空间心理模型,从而揭示了当前模型在空间认知上的根本局限。