arXiv ID:
2603.03683
arXiv 提交日期: 2026-03-04
CONCUR:用于评估大语言模型并发代码生成能力的基准 / CONCUR: Benchmarking LLMs for Concurrent Code Generation
1️⃣ 一句话总结
这篇论文提出了一个名为CONCUR的新基准测试,专门用于评估大语言模型生成复杂且易出错的并发代码的能力,填补了现有基准只关注顺序代码的空白。