arXiv ID:
2606.24429
arXiv 提交日期: 2026-06-23
检测开源中的AI编程智能体:对1.8亿仓库的多方法验证普查 / Detecting AI Coding Agents in Open Source: A Validated Multi-Method Census of 180 Million Repositories
1️⃣ 一句话总结
本研究开发了一种结合多种检测手段的框架,系统分析了1.8亿开源代码仓库,发现传统单一检测方法(如仅识别机器人账号)会严重低估AI编程智能体的真实活动量(如Claude Code的检测覆盖率仅有3.3%),且不同检测渠道(如提交记录与拉取请求)捕捉到的是几乎互不重叠的智能体群体和工作类型,因此必须使用多方法融合才能准确评估AI在开源中的实际渗透程度。