arXiv ID:
2604.21598
arXiv 提交日期: 2026-04-23
DryRUN:公共测试在LLM驱动代码生成中的作用 / DryRUN: On the Role of Public Tests in LLM-Driven Code Generation
1️⃣ 一句话总结
本文指出当前多智能体代码生成框架过度依赖人工提供的测试用例,导致模型在隐藏测试中表现不佳,并提出了DryRUN框架,让大语言模型自主生成输入并模拟执行过程来自我纠错,从而无需任何真实测试用例即可达到甚至超越现有方法的性能。