arXiv ID:
2603.10072
arXiv 提交日期: 2026-03-10
大语言模型为何失败:自动化安全补丁生成的失败分析与部分成功度量 / Why LLMs Fail: A Failure Analysis and Partial Success Measurement for Automated Security Patch Generation
1️⃣ 一句话总结
这项研究发现,虽然大语言模型能生成语法正确的代码,但在修复软件安全漏洞时,超过一半的补丁在安全性和功能上都存在缺陷,主要是因为模型未能真正理解漏洞的本质,因此生成的补丁在部署前必须经过严格验证。