arXiv最新AI论文速览速学

🔍

标签: #software development ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 99 最新: Mise en Place for Agentic Coding: Deliberate Preparation as Context Engineering Methodology 05-10

arXiv ID: 2605.05400

arXiv 提交日期: 2026-05-06

agents llm machine learning coding agents context engineering methodology software development

为智能编码做好准备：将审慎准备作为上下文工程方法论 / Mise en Place for Agentic Coding: Deliberate Preparation as Context Engineering Methodology

1️⃣ 一句话总结

本文借鉴烹饪中“备料到位”的理念，提出一种在AI编码前进行系统化准备的三阶段方法（上下文奠定、协作细化、任务分解），通过案例验证其能大幅提升AI编码效率与质量，并定义了“上下文流畅度”作为开发者新技能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.21744

arXiv 提交日期: 2026-04-23

agents llm machine learning ai-assisted coding epistemic grounding agent scaffolds software development proteomics

智能体AI辅助编程：在软件开发中植入知识根基的独特机遇 / Agentic AI-assisted coding offers a unique opportunity to instill epistemic grounding during software development

1️⃣ 一句话总结

本文提出通过创建由社区维护的领域知识文档（以质谱蛋白质组学为例），让智能体AI在辅助编程时自动遵循学科硬约束和行业惯例，从而让非专业用户也能生成科学正确、符合最佳实践的软件，并为未来定制化软件的民主化开发提供了保障。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.28163

arXiv 提交日期: 2026-03-30

llm natural language processing systems requirements engineering user story generation app store reviews software development prompt engineering

从评论到需求：大语言模型能生成类人的用户故事吗？ / From Reviews to Requirements: Can LLMs Generate Human-Like User Stories?

1️⃣ 一句话总结

这篇论文研究发现，大语言模型能够有效地将应用商店中杂乱无章的用户评论自动转换成格式规范、可执行的软件需求（用户故事），其流畅性甚至可与人类媲美，但在生成独立且不重复的需求方面仍有不足。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20979

arXiv 提交日期: 2026-02-24

agents systems llm software development ai agents programming ecosystem human-ai collaboration runtime environment

迈向一个由智能体驱动的软件生态系统 / Toward an Agentic Infused Software Ecosystem

1️⃣ 一句话总结

这篇论文提出，为了充分发挥AI智能体在软件开发中的潜力，我们需要构建一个全新的、由AI智能体、编程工具和运行环境三大支柱协同支撑的软件生态系统，以实现人机高效协作。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.17084

arXiv 提交日期: 2026-02-19

llm agents systems ai coding agents pull request analysis human-ai collaboration software development empirical study

AI编码代理如何沟通：关于其Pull Request描述特征与人类评审响应的研究 / How AI Coding Agents Communicate: A Study of Pull Request Description Characteristics and Human Review Responses

1️⃣ 一句话总结

这项研究发现，不同AI编程助手在提交代码修改请求时，其描述风格存在明显差异，而这些差异会显著影响人类评审员的参与度、响应速度以及最终是否接受该修改。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16997

arXiv 提交日期: 2026-02-19

llm natural language processing systems requirements engineering user story generation prompt engineering software development multimodal extraction

探索利用大语言模型从设计稿中提取用户故事 / Exploring LLMs for User Story Extraction from Mockups

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过结合大语言模型和特定领域词汇表，能够自动、准确地将高保真设计稿转化为软件开发所需的用户故事，从而提升需求工程效率并改善用户与开发者之间的沟通。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.12144

arXiv 提交日期: 2026-02-12

agents systems model evaluation ai coding agents software development pull request analysis mobile development empirical study

关于AI编程助手在开源Android和iOS开发中的应用研究 / On the Adoption of AI Coding Agents in Open-source Android and iOS Development

1️⃣ 一句话总结

这篇论文通过分析近3000个AI生成的代码合并请求，首次实证研究发现，在开源移动应用项目中，Android项目比iOS项目接受了更多AI贡献的代码且接受率更高，同时常规开发任务的代码更容易被采纳，而结构性修改则成功率较低。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10975

arXiv 提交日期: 2026-02-11

llm agents benchmark agentic coding software development execution-based evaluation test-driven code repositories

FeatureBench：面向复杂功能开发的智能体编码能力基准测试 / FeatureBench: Benchmarking Agentic Coding for Complex Feature Development

1️⃣ 一句话总结

这篇论文提出了一个名为FeatureBench的新基准测试，用于全面评估AI编程助手在开发完整软件功能时的真实能力，它通过自动从开源项目中提取可执行的测试任务，发现当前最先进的AI模型在复杂功能开发上的成功率仍然很低，仅为11%。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.12730

arXiv 提交日期: 2025-12-14

llm agents benchmark coding agents repository generation long-horizon evaluation software development autonomous systems

NL2Repo-Bench：面向编码智能体长周期仓库生成能力的评估基准 / NL2Repo-Bench: Towards Long-Horizon Repository Generation Evaluation of Coding Agents

1️⃣ 一句话总结

这篇论文提出了一个名为NL2Repo-Bench的新基准测试，专门用于评估编码智能体根据单一自然语言需求文档、从头开始构建完整可安装Python软件库的长期综合能力，实验发现当前最先进的模型在此任务上表现不佳，揭示了长期规划与跨文件协调是自主编程面临的核心挑战。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.18538

arXiv 提交日期: 2025-11-23

llm model training systems code generation software development model lifecycle benchmark evaluation fine-tuning

从代码基础模型到智能体与应用：代码智能实用指南 / From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence

1️⃣ 一句话总结

这篇论文系统地梳理了代码大语言模型从数据准备到实际应用的全过程，通过一系列实验分析，为如何构建和优化能理解、生成代码的AI模型提供了实用指南，并指出了学术研究与实际软件开发需求之间的差距及未来方向。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.05400

1️⃣ 一句话总结

arXiv ID: 2604.21744

1️⃣ 一句话总结

arXiv ID: 2603.28163

1️⃣ 一句话总结

arXiv ID: 2602.20979

1️⃣ 一句话总结

arXiv ID: 2602.17084

1️⃣ 一句话总结

arXiv ID: 2602.16997

1️⃣ 一句话总结

arXiv ID: 2602.12144

1️⃣ 一句话总结

arXiv ID: 2602.10975

1️⃣ 一句话总结

arXiv ID: 2512.12730

1️⃣ 一句话总结

arXiv ID: 2511.18538

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.05400 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.21744 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.28163 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20979 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.17084 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16997 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.12144 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10975 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.12730 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.18538 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.05400

arXiv ID: 2604.21744

arXiv ID: 2603.28163

arXiv ID: 2602.20979

arXiv ID: 2602.17084

arXiv ID: 2602.16997

arXiv ID: 2602.12144

arXiv ID: 2602.10975

arXiv ID: 2512.12730

arXiv ID: 2511.18538