arXiv ID:
2604.13888
arXiv 提交日期: 2026-04-15
GeoAgentBench:用于空间分析中工具增强型智能体的动态执行基准 / GeoAgentBench: A Dynamic Execution Benchmark for Tool-Augmented Agents in Spatial Analysis
1️⃣ 一句话总结
这篇论文提出了一个名为GeoAgentBench的动态评估基准和一个名为‘计划与反应’的新型智能体架构,专门用于测试和提升大型语言模型在复杂地理空间分析任务中的实际执行与纠错能力。