arXiv ID:
2605.29442
arXiv 提交日期: 2026-05-28
编程助手为何让用户失望:基于20,574个真实会话的大规模开发者与智能体错位分析 / How Coding Agents Fail Their Users: A Large-Scale Analysis of Developer-Agent Misalignment in 20,574 Real-World Sessions
1️⃣ 一句话总结
本文通过对逾两万个真实编程会话的深入分析,揭示了AI编程助手在理解项目、把握意图、遵循规则、行动边界、代码执行和进度汇报中反复出现的七类典型问题,其中九成故障虽不造成系统损坏,但绝大多数仍需用户手动纠正,为改进训练数据和交互设计提供了实证依据。