📄 论文总结
CTF-DOJO:首个专为网络安全代理训练设计的大规模可执行运行时环境
CTF-DOJO: The First Large-Scale Executable Runtime Environment for Training Network Security Agents
1️⃣ 一句话总结
本文提出了CTF-DOJO,首个专为训练大型语言模型网络安全代理设计的大规模可执行运行时环境,通过自动化工具CTF-FORGE快速构建Docker化CTF挑战,仅使用486条高质量训练轨迹就在多个基准测试中实现了最先进的性能。
2️⃣ 论文创新点
1. CTF-DOJO可执行环境
- 创新点是什么:首个专为LLM网络安全代理训练设计的大规模可执行运行时环境,包含658个Docker容器化的多样化CTF挑战
- 与已有方法的区别/改进:解决了传统方法缺乏可扩展和通用执行环境的问题,提供可验证的反馈循环
- 为什么有意义:为训练高性能ML代理提供了关键基础设施,减少对昂贵专有系统的依赖
2. CTF-FORGE自动化流水线
- 创新点是什么:自动化流水线,能够快速将公开CTF工具转换为即用型执行环境,成功率超过98%
- 与已有方法的区别/改进:消除了传统需要数周专家配置的时间,实现分钟级环境创建
- 为什么有意义:大幅降低了CTF环境搭建的技术门槛和时间成本,使大规模代理训练成为可能
3. 多教师模型轨迹组合
- 创新点是什么:使用Qwen3-Coder和DeepSeek-V3-0324两个教师模型收集轨迹,利用其互补优势增强训练数据多样性
- 与已有方法的区别/改进:相比单一教师模型,组合使用覆盖更多独特挑战(274个),提升下游智能体性能
- 为什么有意义:证实教师多样性能够丰富训练数据,产生更强大的网络安全智能体
3️⃣ 主要结果与价值
实验结果亮点
- 32B模型在仅使用486条高质量训练轨迹后,在三大CTF基准测试中达到31.9%的Pass@1,领先基线11.6%
- 相比使用9464条轨迹的Cyber-Zero模型,数据效率提升94.9%,实现了相当的性能
- 推理时技术(writeup提示和随机化环境配置)显著提升模型性能,平均提高任务解决率7.4%
实际应用价值
- 为网络安全研究提供了可扩展且标准化的测试环境,支持有机扩展和减少人工干预
- 自动化验证脚本确保环境稳定可执行,98%挑战通过验证,提高了网络安全代理训练环境的可靠性
- 支持多种CTF挑战类型(Web、二进制利用、密码学等),能够处理不同架构和依赖需求
4️⃣ 术语表
- CTF-DOJO:首个为网络安全LLM代理训练设计的大规模可执行运行时环境,包含658个Docker容器化的CTF挑战
- CTF-FORGE:自动化流水线,用于从公开CTF工具快速创建Docker镜像和配置执行环境,支持多种CTF挑战类型
- Pass@k:评估模型性能的主要指标,衡量在k次尝试中至少成功一次的概率
- CTF:Capture The Flag,一种网络安全竞赛形式,包含Crypto、Reverse、Web、Forensics、Pwn等挑战类别
- ENIGMA+:扩展的代理评估框架,专为网络安全任务设计,支持并行执行和上下文管理工具