arXiv最新AI论文速览速学

🔍

标签: #continual learning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: TSN-Affinity: Similarity-Driven Parameter Reuse for Continual Offline Reinforcement Learning 04-29

arXiv ID: 2603.11395

arXiv 提交日期: 2026-03-12

reinforcement learning model training agents continual learning world models replay buffer catastrophic forgetting dreamerv3

ARROW：用于鲁棒世界模型的增强回放 / ARROW: Augmented Replay for RObust World models

1️⃣ 一句话总结

这篇论文提出了一种名为ARROW的新型持续强化学习算法，它通过引入一个受神经科学启发的、高效的双重回放缓冲区来训练一个世界模型，从而在让智能体学习新任务的同时，显著减少对旧任务的遗忘，并保持知识迁移能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.09576

arXiv 提交日期: 2026-03-10

machine learning model training theory continual learning online learning transformers hopfield networks parameter-efficient adaptation

无遗忘路由 / Routing without Forgetting

1️⃣ 一句话总结

这篇论文提出了一种名为‘无遗忘路由’的新方法，通过在Transformer模型中引入基于能量的联想检索层，让模型能够在只看到一次数据的情况下，动态地为每个输入选择最合适的处理路径，从而有效解决了在线持续学习中的灾难性遗忘问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02951

arXiv 提交日期: 2026-03-03

agents reinforcement learning model training continual learning gui agents reinforcement fine-tuning multimodal llm gradient surgery

CGL：通过强化微调推进持续GUI学习 / CGL: Advancing Continual GUI Learning via Reinforcement Fine-Tuning

1️⃣ 一句话总结

这篇论文提出了一个名为CGL的新框架，通过巧妙地结合监督微调和强化学习，并引入动态调整机制与梯度处理策略，有效解决了图形用户界面智能体在持续学习新任务时容易遗忘旧知识的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22474

arXiv 提交日期: 2026-02-25

robotics agents model evaluation policy steering uncertainty calibration conformal prediction vision-language models continual learning

何时行动、询问或学习：基于不确定性的策略引导 / When to Act, Ask, or Learn: Uncertainty-Aware Policy Steering

1️⃣ 一句话总结

这篇论文提出了一个名为UPS的智能机器人决策框架，它能够识别任务指令的模糊性和自身执行能力的不确定性，从而自主选择是执行动作、向人类询问澄清，还是请求干预学习，以此减少对人工反馈的依赖并提升执行可靠性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20361

arXiv 提交日期: 2026-02-23

systems model training machine learning continual learning neural receivers ofdm online adaptation wireless communications

在检测中学习：基于DMRS的神经OFDM接收机持续学习框架 / Learning During Detection: Continual Learning for Neural OFDM Receivers via DMRS

1️⃣ 一句话总结

这项研究提出了一种利用现有参考信号、无需额外开销就能让智能通信接收机在正常工作中持续学习并适应信道变化的新方法，解决了传统神经网络接收机需要中断服务进行重新训练的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.17174

arXiv 提交日期: 2026-02-19

robotics reinforcement learning model training continual learning robust control domain randomization sim-to-real vibration control

持续不确定性学习 / Continual uncertainty learning

1️⃣ 一句话总结

这篇论文提出了一种新的课程式持续学习框架，通过将复杂的多不确定性控制问题分解为一系列顺序学习任务，并结合模型控制器来加速学习，最终成功设计出能抵抗结构非线性和动态变化的汽车动力系统振动控制器，并实现了从仿真到现实的顺利迁移。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.17559

arXiv 提交日期: 2026-02-19

model training machine learning natural language processing continual learning weight regularization low-rank adaptation parameter efficiency task interference

重访权重正则化在低秩持续学习中的应用 / Revisiting Weight Regularization for Low-Rank Continual Learning

1️⃣ 一句话总结

这篇论文提出了一种名为EWC-LoRA的新方法，通过将经典的权重正则化技术应用于低秩适配器，有效解决了大规模预训练模型在持续学习中的任务干扰问题，同时保持了存储和计算开销的恒定。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16173

arXiv 提交日期: 2026-02-18

agents model training machine learning personalized agents human feedback continual learning preference modeling explicit memory

从人类反馈中学习个性化智能体 / Learning Personalized Agents from Human Feedback

1️⃣ 一句话总结

这篇论文提出了一个名为PAHF的框架，让AI智能体能够通过与用户的实时互动，持续学习和适应每个用户独特且可能变化的个人偏好，从而提供更贴心的服务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.14767

arXiv 提交日期: 2026-02-16

computer vision model training machine learning continual learning semantic segmentation segment anything model incremental learning training-free

SAILS：通过增量学习语义实现任务不变且免训练的持续学习，用于任意分割 / SAILS: Segment Anything with Incrementally Learned Semantics for Task-Invariant and Training-Free Continual Learning

1️⃣ 一句话总结

这篇论文提出了一个名为SAILS的免训练持续学习框架，它巧妙地利用基础模型将图像分割任务分解为两个步骤——先用SAM模型进行零样本区域提取，再用原型进行语义关联，从而在完全不更新模型参数的情况下，不仅避免了传统持续学习中常见的“遗忘”问题，甚至还能让学习新知识反过来提升旧任务的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.07892

arXiv 提交日期: 2026-02-08

llm model training machine learning safety alignment continual learning orthogonal gradient projection alignment tax forgetting mitigation

将安全对齐视为持续学习：通过正交梯度投影减轻对齐代价 / Safety Alignment as Continual Learning: Mitigating the Alignment Tax via Orthogonal Gradient Projection

1️⃣ 一句话总结

这篇论文提出了一种名为OGPSA的轻量级方法，通过将安全更新限制在模型通用能力的正交方向上，有效解决了大语言模型在安全对齐过程中会损失原有通用能力（如推理和编程）的普遍问题，从而在提升安全性的同时更好地保持了模型的整体性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.11395

1️⃣ 一句话总结

arXiv ID: 2603.09576

1️⃣ 一句话总结

arXiv ID: 2603.02951

1️⃣ 一句话总结

arXiv ID: 2602.22474

1️⃣ 一句话总结

arXiv ID: 2602.20361

1️⃣ 一句话总结

arXiv ID: 2602.17174

1️⃣ 一句话总结

arXiv ID: 2602.17559

1️⃣ 一句话总结

arXiv ID: 2602.16173

1️⃣ 一句话总结

arXiv ID: 2602.14767

1️⃣ 一句话总结

arXiv ID: 2602.07892

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.11395 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.09576 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02951 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22474 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20361 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.17174 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.17559 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16173 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.14767 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.07892 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.11395

arXiv ID: 2603.09576

arXiv ID: 2603.02951

arXiv ID: 2602.22474

arXiv ID: 2602.20361

arXiv ID: 2602.17174

arXiv ID: 2602.17559

arXiv ID: 2602.16173

arXiv ID: 2602.14767

arXiv ID: 2602.07892