arXiv ID:
2602.22638
arXiv 提交日期: 2026-02-26
MobilityBench:一个用于评估现实世界移动场景中路线规划智能体的基准 / MobilityBench: A Benchmark for Evaluating Route-Planning Agents in Real-World Mobility Scenarios
1️⃣ 一句话总结
这篇论文提出了一个名为MobilityBench的标准化测试平台,专门用来评估基于大语言模型的路线规划助手在真实世界出行场景中的表现,发现现有模型在满足个性化偏好方面仍有很大提升空间。