从代码基础模型到智能体与应用:代码智能实用指南 / From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence
1️⃣ 一句话总结
这篇论文系统地梳理了代码大语言模型从数据准备到实际应用的全过程,通过一系列实验分析,为如何构建和优化能理解、生成代码的AI模型提供了实用指南,并指出了学术研究与实际软件开发需求之间的差距及未来方向。
请先 登录 后再提交论文
从代码基础模型到智能体与应用:代码智能实用指南 / From Code Foundation Models to Agents and Applications: A Practical Guide to Code Intelligence
这篇论文系统地梳理了代码大语言模型从数据准备到实际应用的全过程,通过一系列实验分析,为如何构建和优化能理解、生成代码的AI模型提供了实用指南,并指出了学术研究与实际软件开发需求之间的差距及未来方向。
竞争性编程代码生成中基于可验证奖励的强化学习数据管理最佳实践 / DRIVE: Data Curation Best Practices for Reinforcement Learning with Verifiable Reward in Competitive Code Generation
这篇论文提出了一套针对竞争性编程代码生成任务的数据管理和强化学习训练方法,通过两阶段强化学习和课程设计,使模型在代码竞赛中达到了与顶尖系统相当的性能。
VCode:一种以SVG作为符号视觉表示的多模态编码基准 / VCode: a Multimodal Coding Benchmark with SVG as Symbolic Visual Representation
这篇论文提出了一个名为VCode的多模态编码基准,将图像理解任务转化为生成SVG代码的问题,并引入了一个评估方法和智能代理框架来提升模型在视觉符号表示上的准确性和推理能力。
TokDrift:当大语言模型以子词说话而代码以语法说话 / TokDrift: When LLM Speaks in Subwords but Code Speaks in Grammar
这篇论文发现,由于代码大语言模型使用的子词分词方法(如BPE)与代码语法不匹配,导致即使微小的格式变化(如空格或变量名)也会显著影响模型行为,揭示了当前分词方式是代码理解和生成可靠性的一个隐藏障碍。
CodePlot-CoT:通过代码驱动图像进行数学视觉推理 / CodePlot-CoT: Mathematical Visual Reasoning by Thinking with Code-Driven Images
这项研究提出了一种利用代码生成图像辅助数学推理的新方法,通过构建大规模数据集和训练模型,显著提升了解决需要视觉辅助的数学问题的能力。
ReLook:基于视觉的多模态大语言模型批评器与强化学习结合的自主网页编程框架 / ReLook: Vision-Grounded RL with a Multimodal LLM Critic for Agentic Web Coding
这篇论文提出了一个名为ReLook的智能网页编程系统,它通过结合视觉反馈和多模态大语言模型,让AI能够像人类一样根据网页实际显示效果不断诊断和优化代码,从而显著提升前端开发的质量。
LLM生成的JavaScript代码的隐藏DNA:结构模式实现高精度作者归属 / The Hidden DNA of LLM-Generated JavaScript: Structural Patterns Enable High-Accuracy Authorship Attribution
这项研究发现不同大语言模型生成的JavaScript代码具有独特的结构风格特征,使得即使经过代码变换也能以超过88%的准确率识别出代码是由哪个特定模型生成的。
V-GameGym:面向代码大语言模型的视觉游戏生成基准 / V-GameGym: Visual Game Generation for Code Large Language Models
这篇论文提出了一个名为V-GameGym的基准测试,专门用于评估代码大语言模型在视觉游戏开发中的实际能力,通过引入游戏可玩性、视觉美观度等新指标,弥补了传统代码生成测试与真实游戏开发需求之间的差距。
视觉可编程性:图表理解中代码即思维的指南 / Visual Programmability: A Guide for Code-as-Thought in Chart Understanding
该论文提出了一种自适应视觉语言模型框架,通过强化学习让模型学会动态选择代码推理或直接视觉分析来解决图表理解问题,从而提升推理的准确性和鲁棒性。
强化学习在大型推理模型中的应用综述 / A Survey of Reinforcement Learning for Large Reasoning Models
这篇论文综述了强化学习如何提升大型语言模型的逻辑推理能力,特别是在数学和编程等复杂任务上的应用,并探讨了未来扩展至超级人工智能所面临的计算、算法和数据挑战。