arXiv ID:
2606.25332
arXiv 提交日期: 2026-06-24
将侦察与利用解耦:衡量基于大语言模型的Web渗透测试能力边界 / Decoupling Reconnaissance and Exploitation: Measuring the Capability Boundaries of LLM-Based Web Penetration Testing
1️⃣ 一句话总结
本文通过将渗透测试中的信息收集(侦察)与漏洞利用分开评估,发现当前基于大语言模型的自动化渗透测试智能体在理想条件下漏洞利用成功率可达90%,但自主侦察能力仅约50%,并揭示了不同架构(多智能体、单体、图驱动)在特定漏洞类型上的优劣。