arXiv ID:
2606.11678
人工智能能否像城市规划师一样推理?大型语言模型与专业判断的基准测试 / Can AI Reason Like an Urban Planner? Benchmarking Large Language Models Against Professional Judgment
1️⃣ 一句话总结
本研究提出了一个名为UPBench的评估框架,通过四个知识支柱和五个认知层次来测试大型语言模型在城市规划领域的推理能力,结果发现这些模型虽然擅长分析性任务,但在需要具体法规知识、价值判断和复杂情境处理的规划任务上表现不佳,因此建议在实际工作中应根据任务类型有选择地使用AI辅助。