arXiv最新AI论文速览速学

🔍

标签: #self-evolution ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: Experience Makes Skillful: Enabling Generalizable Medical Agent Reasoning via Self-Evolving Skill Memory 06-09

arXiv ID: 2606.09365

arXiv 提交日期: 2026-06-08

medical agents machine learning skill memory self-evolution clinical reasoning memory management reinforcement learning

经验成就技能：通过自我进化的技能记忆实现可泛化的医疗智能体推理 / Experience Makes Skillful: Enabling Generalizable Medical Agent Reasoning via Self-Evolving Skill Memory

1️⃣ 一句话总结

本文提出了一种名为SkeMex的框架，让医疗AI智能体在部署后能像人一样从过往交互中自动提炼出结构化“技能”并不断更新记忆库，从而在不修改模型参数的前提下，更高效、更可靠地应对复杂的临床决策任务，并显著提升在不同任务和模型上的泛化能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.10064

arXiv 提交日期: 2026-05-11

llm agents knowledge graph self-evolution multi-agent frozen backbone benchmark

MAGE：基于协同进化知识图谱的多智能体自我进化框架 / MAGE: Multi-Agent Self-Evolution with Co-Evolutionary Knowledge Graphs

1️⃣ 一句话总结

MAGE提出了一种让语言模型在自我进化中不改变自身参数的方法，通过构建包含经验、任务和技能等四个子图的协同进化知识图谱来存储和检索历史知识，从而在推理时让冻结的弱模型利用这些外部知识持续提升性能，在数学推理、问答、游戏导航等多个任务上取得了优于传统提示方法的成果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.26707

arXiv 提交日期: 2026-04-29

multi-modal model training video curriculum learning self-evolution video question answering question generation evaluation

CurEvo：课程引导的自我进化视频理解框架 / CurEvo: Curriculum-Guided Self-Evolution for Video Understanding

1️⃣ 一句话总结

CurEvo通过引入课程学习机制，让视频理解模型在无需人工标注的情况下，根据自身能力动态调整学习任务的难度和多样性，从而像学生上课一样循序渐进地自我提升，显著提高了视频问答的准确性和语义理解能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.15034

arXiv 提交日期: 2026-04-16

agents systems llm agent protocol self-evolution multi-agent systems resource management closed-loop learning

自生：一种自我演化的智能体协议 / Autogenesis: A Self-Evolving Agent Protocol

1️⃣ 一句话总结

这篇论文提出了一种名为‘自生协议’的新框架，它通过将智能体系统的各个组成部分（如提示、工具、记忆等）定义为可版本化管理的资源，并引入一个闭环的自我改进机制，使得基于大语言模型的智能体系统能够自动、安全地持续优化，从而更有效地完成复杂的长周期任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15707

arXiv 提交日期: 2026-03-16

llm agents systems code generation multi-agent systems self-evolution workflow adaptation programming benchmarks

SEMAG：自进化的多智能体代码生成框架 / SEMAG: Self-Evolutionary Multi-Agent Code Generation

1️⃣ 一句话总结

这篇论文提出了一个名为SEMAG的自进化多智能体框架，它能像人类编程一样分阶段、自适应地处理复杂编程任务，并通过实时选用最新模型来自动升级，从而在多个代码生成基准测试中取得了最先进的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.09206

arXiv 提交日期: 2026-03-10

multi-modal model training agents vision language models self-evolution reinforcement learning zero-shot learning multimodal reasoning

MM-Zero：从零数据出发的自进化多模型视觉语言模型 / MM-Zero: Self-Evolving Multi-Model Vision Language Models From Zero Data

1️⃣ 一句话总结

这篇论文提出了一个名为MM-Zero的新框架，它能让视觉语言模型在没有初始图像数据的情况下，通过让一个基础模型扮演提议者、编码者和解答者三个不同角色进行自我协作与进化，从而显著提升其在多模态推理任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.07348

arXiv 提交日期: 2026-01-12

llm agents systems code optimization self-evolution genetic algorithm algorithmic reasoning program synthesis

用于算法代码优化的受控自进化方法 / Controlled Self-Evolution for Algorithmic Code Optimization

1️⃣ 一句话总结

这篇论文提出了一种名为‘受控自进化’的新方法，通过引入多样化的初始策略、基于反馈的进化操作和分层记忆机制，有效解决了现有代码生成自进化方法效率低、容易陷入局部最优的问题，从而在有限的资源下更快地找到性能更优的算法代码。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.07055

arXiv 提交日期: 2026-01-11

llm agents model training self-evolution search agents policy optimization data-free learning automated curriculum

Dr. Zero：无需训练数据的自我进化搜索智能体 / Dr. Zero: Self-Evolving Search Agents without Training Data

1️⃣ 一句话总结

这篇论文提出了一个名为Dr. Zero的框架，能让AI搜索智能体在没有外部训练数据的情况下，通过一个‘出题者’和‘解题者’相互促进、自动生成并解决越来越难问题的自我进化循环，来高效地提升其复杂推理和搜索能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.08870

arXiv 提交日期: 2025-12-09

llm agents model training federated learning self-evolution privacy multi-agent systems parameter-efficient fine-tuning

Fed-SE：面向隐私受限多环境大语言模型智能体的联邦自进化框架 / Fed-SE: Federated Self-Evolution for Privacy-Constrained Multi-Environment LLM Agents

1️⃣ 一句话总结

这篇论文提出了一个名为Fed-SE的新框架，它能让部署在不同环境中的大语言模型智能体在不共享原始数据、保护隐私的前提下，通过本地自我进化和全局知识聚合的方式协同学习，有效解决了传统联邦学习方法在动态、多样化任务中遇到的性能冲突问题，从而显著提升了智能体的任务成功率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.02472

arXiv 提交日期: 2025-12-02

llm model training agents self-evolution curriculum learning synthetic data reasoning co-evolution

基于最少人工监督的引导式大语言模型自我演化 / Guided Self-Evolving LLMs with Minimal Human Supervision

1️⃣ 一句话总结

这篇论文提出了一个名为R-Few的引导式自我对抗学习框架，通过少量人工标注示例和基于难度的课程训练，使大语言模型能够稳定、可控地自我进化，在数学和通用推理任务上取得了显著性能提升，同时有效避免了模型在无引导自我进化中常见的性能停滞或退化问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.09365

1️⃣ 一句话总结

arXiv ID: 2605.10064

1️⃣ 一句话总结

arXiv ID: 2604.26707

1️⃣ 一句话总结

arXiv ID: 2604.15034

1️⃣ 一句话总结

arXiv ID: 2603.15707

1️⃣ 一句话总结

arXiv ID: 2603.09206

1️⃣ 一句话总结

arXiv ID: 2601.07348

1️⃣ 一句话总结

arXiv ID: 2601.07055

1️⃣ 一句话总结

arXiv ID: 2512.08870

1️⃣ 一句话总结

arXiv ID: 2512.02472

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.09365 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.10064 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.26707 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.15034 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15707 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.09206 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.07348 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.07055 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.08870 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.02472 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.09365

arXiv ID: 2605.10064

arXiv ID: 2604.26707

arXiv ID: 2604.15034

arXiv ID: 2603.15707

arXiv ID: 2603.09206

arXiv ID: 2601.07348

arXiv ID: 2601.07055

arXiv ID: 2512.08870

arXiv ID: 2512.02472