arXiv ID:
2603.04177
arXiv 提交日期: 2026-03-04
CodeTaste:大语言模型能生成人类水平的代码重构吗? / CodeTaste: Can LLMs Generate Human-Level Code Refactorings?
1️⃣ 一句话总结
这篇论文通过构建一个名为CodeTaste的基准测试,评估了大语言模型在代码重构任务上的表现,发现模型在详细指令下能可靠执行重构,但在自主发现并选择与人类开发者一致的重构方案方面仍有明显差距。