arXiv ID:
2604.18566
arXiv 提交日期: 2026-04-20
系统动力学AI助手基准测试:云端与本地大语言模型在因果回路图提取与讨论上的比较 / Benchmarking System Dynamics AI Assistants: Cloud Versus Local LLMs on CLD Extraction and Discussion
1️⃣ 一句话总结
本文系统比较了云端和本地大语言模型在系统动力学任务中的表现,发现云端模型总体更优,本地模型在中低端任务上可与之匹敌,但在处理长上下文时存在明显短板,同时后端选择(如GGUF或MLX)对性能的影响大于模型量化级别。