arXiv ID:
2606.03489
arXiv 提交日期: 2026-06-02
从错误中学习:用于安全代码大模型的树状自对弈方法 / Learn from Your Mistakes: Tree-like Self-Play for Secure Code LLMs
1️⃣ 一句话总结
本文提出了一种名为树状自对弈(TSP)的新方法,通过让代码生成模型在类似下棋的自我对战中探索安全与不安全的代码路径,从而精确修正生成过程中的微小安全错误,使模型不仅显著提升了生成代码的安全性,还能将学到的安全逻辑跨语言(如从C/C++推广到Python、Go)泛化应用。