arXiv最新AI论文速览速学

🔍

标签: #code generation ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: Latent Reasoning with Normalizing Flows 06-06

arXiv ID: 2604.26615

arXiv 提交日期: 2026-04-29

llm agents systems code generation test-driven development prompt engineering multi-agent governance

基于提示工程的测试驱动开发治理：用于多智能体代码生成 / TDD Governance for Multi-Agent Code Generation via Prompt Engineering

1️⃣ 一句话总结

本文提出了一种通过提示工程将传统测试驱动开发（TDD）原则转化为结构化的流程约束，从而让AI代码生成更稳定、可靠且易于管理的方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.26923

arXiv 提交日期: 2026-04-29

llm machine learning benchmark code generation class-level cross-domain evaluation compositional

ClassEval-Pro：面向跨领域类级代码生成的基准测试 / ClassEval-Pro: A Cross-Domain Benchmark for Class-Level Code Generation

1️⃣ 一句话总结

本文提出了一个名为ClassEval-Pro的自动化构建的基准测试，包含来自11个领域的300个类级编程任务，用于评估大语言模型在构建完整类代码方面的能力，结果发现当前最强模型仅能通过45.6%的任务，且方法间的协调是核心瓶颈。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.25419

arXiv 提交日期: 2026-04-28

llm reinforcement learning rlvr label-free formal verification mathematical reasoning code generation

JURY-RL：投票提出答案，证明决定奖励——无标签的强化学习验证框架 / JURY-RL: Votes Propose, Proofs Dispose for Label-Free RLVR

1️⃣ 一句话总结

本文提出JURY-RL方法，在不需要人工标注答案的情况下，通过让模型自己投票选出候选答案，再使用形式化验证器（如Lean）判断该答案是否正确，仅在验证成功时才给予奖励，从而稳定地提升了大型语言模型在数学推理等任务上的推理能力，效果接近使用标准答案进行训练的方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.23989

arXiv 提交日期: 2026-04-27

llm model evaluation code generation multi-turn correction iterative refinement inference scaling safety analysis

固定初始代码并迭代优化文本方向以实现安全的多轮代码修正 / Fix Initial Codes and Iteratively Refine Textual Directions Toward Safe Multi-Turn Code Correction

1️⃣ 一句话总结

本文提出了一种名为IRTD的简单方法，通过固定初始代码并反复优化文本提示来逐步修正代码错误，无需复杂的搜索结构，就能达到与最先进方法相当的推理性能，并且理论上能保证修正过程的安全性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.24222

arXiv 提交日期: 2026-04-27

llm systems machine learning code generation retrieval-augmented generation evolving memory enterprise domain private library

MEMCoder：面向私有库代码生成的多维演化记忆框架 / MEMCoder: Multi-dimensional Evolving Memory for Private-Library-Oriented Code Generation

1️⃣ 一句话总结

该论文提出MEMCoder框架，通过让大语言模型在代码生成过程中自主积累并动态更新跨API协调模式和参数约束的使用指南，从而有效解决企业内私有库代码生成准确率低的问题，使现有检索增强生成系统的性能平均提升16.31%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21598

arXiv 提交日期: 2026-04-23

llm agents code generation multi-agent public tests overconfidence gap self-correction

DryRUN：公共测试在LLM驱动代码生成中的作用 / DryRUN: On the Role of Public Tests in LLM-Driven Code Generation

1️⃣ 一句话总结

本文指出当前多智能体代码生成框架过度依赖人工提供的测试用例，导致模型在隐藏测试中表现不佳，并提出了DryRUN框架，让大语言模型自主生成输入并模拟执行过程来自我纠错，从而无需任何真实测试用例即可达到甚至超越现有方法的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.20398

arXiv 提交日期: 2026-04-22

llm reinforcement learning aigc website generation multimodal reward aesthetic evaluation code generation reinforcement learning

WebGen-R1：利用强化学习激励大语言模型生成功能完善且美观的网站 / WebGen-R1: Incentivizing Large Language Models to Generate Functional and Aesthetic Websites with Reinforcement Learning

1️⃣ 一句话总结

本文提出一种名为WebGen-R1的端到端强化学习框架，通过创新的结构化生成方法和多模态奖励机制，成功将仅有7B参数的小型语言模型从几乎无法生成有效网页训练成能产出功能完整、视觉美观的多页网站，性能超越了高达72B的开源模型，并在功能正确性与美观度上媲美671B的顶尖模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.20835

arXiv 提交日期: 2026-04-22

llm model training machine learning code generation reinforcement learning zero-shot transfer supervised fine-tuning programming languages

并行监督微调：提升代码强化学习的零样本跨编程语言迁移能力 / Parallel-SFT: Improving Zero-Shot Cross-Programming-Language Transfer for Code RL

1️⃣ 一句话总结

本文提出Parallel-SFT方法，通过在监督微调阶段加入多种编程语言实现相同功能的“并行程序”数据，使后续的强化学习训练能更好地将编程能力从常见语言（如Python、C++）零样本迁移到资源较少的语言（如Rust、Julia）上，实验表明该方法能让模型内部对功能相同但语言不同的代码产生更紧密的表示聚类，从而提升迁移效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19022

arXiv 提交日期: 2026-04-21

llm agents systems code generation domain-specific knowledge research acceleration framework

加速面向研究的落地代码开发 / On Accelerating Grounded Code Development for Research

1️⃣ 一句话总结

该论文提出一个开源框架，通过让代码助手实时访问最新的研究资料和技术文档，解决了小众科学领域因知识更新快、缺乏领域专用数据而难以使用AI编程工具的问题，从而加速AI在专业科研工作流中的落地应用。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18254

arXiv 提交日期: 2026-04-20

llm natural language processing model training text-to-sql curriculum learning code generation modular adapters fine-tuning

LeGo-Code：模块化课程学习能否推动复杂代码生成？来自Text-to-SQL任务的见解 / LeGo-Code: Can Modular Curriculum Learning Advance Complex Code Generation? Insights from Text-to-SQL

1️⃣ 一句话总结

这篇论文提出了一种名为‘模块化适配器组合’的新方法，通过像搭乐高一样分阶段、由易到难地训练AI模型，有效解决了当前大语言模型在处理复杂数据库查询语句时遇到的困难，从而提升了模型生成复杂代码的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.26615

1️⃣ 一句话总结

arXiv ID: 2604.26923

1️⃣ 一句话总结

arXiv ID: 2604.25419

1️⃣ 一句话总结

arXiv ID: 2604.23989

1️⃣ 一句话总结

arXiv ID: 2604.24222

1️⃣ 一句话总结

arXiv ID: 2604.21598

1️⃣ 一句话总结

arXiv ID: 2604.20398

1️⃣ 一句话总结

arXiv ID: 2604.20835

1️⃣ 一句话总结

arXiv ID: 2604.19022

1️⃣ 一句话总结

arXiv ID: 2604.18254

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.26615 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.26923 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.25419 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.23989 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.24222 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21598 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.20398 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.20835 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19022 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18254 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.26615

arXiv ID: 2604.26923

arXiv ID: 2604.25419

arXiv ID: 2604.23989

arXiv ID: 2604.24222

arXiv ID: 2604.21598

arXiv ID: 2604.20398

arXiv ID: 2604.20835

arXiv ID: 2604.19022

arXiv ID: 2604.18254