arXiv ID:
2606.01995
arXiv 提交日期: 2026-06-01
CARTE:一个用于评估语言模型对法国区域知识掌握程度的基准测试 / CARTE: A Benchmark for Mapping Language Model Knowledge Across France
1️⃣ 一句话总结
本文提出了一个名为CARTE的基准测试,包含2431道选择题,专门用于评估大型语言模型对法国13个行政区域在文化、语言、经济等14个领域的细粒度知识,结果发现模型在区域间表现差异显著且对国内地域变化的鲁棒性不足。