arXiv ID:
2606.29733
arXiv 提交日期: 2026-06-29
本地私有化部署的开源大模型在文本到SQL任务上表现如何?——基于BIRD基准的跨模型家族、参数量与技术方案前沿探索 / How Far Do On-Prem Open LLMs Get on Text-to-SQL? A Cross-Family Size x Technique Frontier on BIRD
1️⃣ 一句话总结
本文通过系统对比三代开源大模型家族(Qwen2.5-Coder、CodeLlama、Llama-3.x)在BIRD基准上的文本转SQL性能,发现模型代际比参数量更关键、自我修正几乎不增加成本且有效、模式链接和自一致性收益有限,为企业在本地部署场景下选择经济高效的SQL生成方案提供了可复现的参考。