arXiv最新AI论文速览速学

🔍

标签: #catastrophic forgetting ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 166 72小时内新更新论文 72h更新 171 最新: Detection of Autonomous Shuttles in Urban Traffic Images Using Adaptive Residual Context 03-17

arXiv ID: 2603.15404

arXiv 提交日期: 2026-03-16

computer vision systems model training object detection catastrophic forgetting adaptive architecture urban traffic autonomous vehicles

利用自适应残差上下文检测城市交通图像中的自动驾驶接驳车 / Detection of Autonomous Shuttles in Urban Traffic Images Using Adaptive Residual Context

1️⃣ 一句话总结

这篇论文提出了一种名为自适应残差上下文（ARC）的新模型架构，它能在不遗忘原有知识的前提下，高效地将自动驾驶接驳车这类新车辆类别添加到现有的交通监控系统中，从而提升道路安全评估能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.12163

arXiv 提交日期: 2026-03-12

theory model training machine learning continual learning catastrophic forgetting mixture models kl divergence post-training

训练后遗忘的定量表征 / A Quantitative Characterization of Forgetting in Post-Training

1️⃣ 一句话总结

这篇论文通过理论分析，揭示了生成模型在持续训练后发生遗忘的根本原因，并精确量化了遗忘的程度，指出遗忘主要取决于训练目标函数的选择、新旧任务数据的重叠程度以及训练时的数据采样方式。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.11395

arXiv 提交日期: 2026-03-12

reinforcement learning model training agents continual learning world models replay buffer catastrophic forgetting dreamerv3

ARROW：用于鲁棒世界模型的增强回放 / ARROW: Augmented Replay for RObust World models

1️⃣ 一句话总结

这篇论文提出了一种名为ARROW的新型持续强化学习算法，它通过引入一个受神经科学启发的、高效的双重回放缓冲区来训练一个世界模型，从而在让智能体学习新任务的同时，显著减少对旧任务的遗忘，并保持知识迁移能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08647

arXiv 提交日期: 2026-03-09

model training machine learning llm fine-tuning catastrophic forgetting parameter expansion plasticity stability trade-off transformer adaptation

增长而非覆盖：实现无遗忘的模型微调 / Grow, Don't Overwrite: Fine-tuning Without Forgetting

1️⃣ 一句话总结

这篇论文提出了一种创新的模型微调方法，通过复制并扩展预训练模型的内部结构来学习新任务，从而在保持原有能力不丢失的同时，达到与完全微调相当的新任务性能，且计算成本更低。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08426

arXiv 提交日期: 2026-03-09

machine learning model training model evaluation class incremental learning catastrophic forgetting model compression dynamic scaling memory efficiency

生长、评估、压缩：面向内存高效类增量学习的自适应主干网络缩放 / Grow, Assess, Compress: Adaptive Backbone Scaling for Memory-Efficient Class Incremental Learning

1️⃣ 一句话总结

这篇论文提出了一种名为GRACE的自适应模型缩放框架，它通过‘生长、评估、压缩’的循环策略，在持续学习新任务时智能地管理模型规模，既有效防止了遗忘旧知识，又大幅降低了内存消耗。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03040

arXiv 提交日期: 2026-03-03

model training machine learning systems progressive neural networks concept drift time series catastrophic forgetting recurrent neural networks

cPNN：用于演化流式时间序列的连续渐进式神经网络 / cPNN: Continuous Progressive Neural Networks for Evolving Streaming Time Series

1️⃣ 一句话总结

本文提出了一种名为cPNN的连续渐进式神经网络，它能同时处理数据流中的概念漂移和时间依赖性问题，并有效防止神经网络遗忘已学知识，从而快速适应不断变化的数据流。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02629

arXiv 提交日期: 2026-03-03

multi-modal model training machine learning anomaly detection incremental learning information bottleneck multimodal fusion catastrophic forgetting

迈向增量式统一多模态异常检测：从信息瓶颈视角增强多模态去噪 / Towards an Incremental Unified Multimodal Anomaly Detection: Augmenting Multimodal Denoising From an Information Bottleneck Perspective

1️⃣ 一句话总结

这篇论文提出了一种名为IB-IUMAD的新方法，通过结合Mamba解码器和信息瓶颈融合模块来过滤冗余和虚假特征，有效解决了多模态异常检测模型在学习新类别时容易忘记旧知识的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04252

arXiv 提交日期: 2026-02-04

machine learning model training computer vision active learning class incremental learning catastrophic forgetting image classification sample selection

ACIL：用于图像分类的主动类增量学习 / ACIL: Active Class Incremental Learning for Image Classification

1️⃣ 一句话总结

本文提出了一种名为ACIL的新框架，通过结合主动学习和类增量学习，在持续学习新类别的过程中，智能选择少量最具信息量的样本进行人工标注，从而大幅降低标注成本并有效防止模型遗忘旧知识。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.19897

arXiv 提交日期: 2026-01-27

machine learning model training agents continual learning self-distillation catastrophic forgetting fine-tuning on-policy learning

自蒸馏实现持续学习 / Self-Distillation Enables Continual Learning

1️⃣ 一句话总结

这篇论文提出了一种名为‘自蒸馏微调’的新方法，让大模型能够像学生一样，通过模仿自己过去的优秀表现来学习新技能，从而在不断学习新知识的同时，有效防止忘记旧本领。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.14133

arXiv 提交日期: 2026-01-20

robotics multi-modal model training vision-language-action embodied ai catastrophic forgetting mixture-of-transformers robot manipulation

TwinBrainVLA：通过非对称混合变换器释放通用视觉语言模型在具身任务中的潜力 / TwinBrainVLA: Unleashing the Potential of Generalist VLMs for Embodied Tasks via Asymmetric Mixture-of-Transformers

1️⃣ 一句话总结

这篇论文提出了一种名为TwinBrainVLA的新模型架构，它通过一个‘左脑’保持通用视觉理解能力，同时用一个可训练的‘右脑’专门学习机器人精细动作，从而解决了机器人控制任务中模型既要懂世界又要会动手的冲突，在保持高水平语义理解的同时实现了更精确的操控。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.15404

1️⃣ 一句话总结

arXiv ID: 2603.12163

1️⃣ 一句话总结

arXiv ID: 2603.11395

1️⃣ 一句话总结

arXiv ID: 2603.08647

1️⃣ 一句话总结

arXiv ID: 2603.08426

1️⃣ 一句话总结

arXiv ID: 2603.03040

1️⃣ 一句话总结

arXiv ID: 2603.02629

1️⃣ 一句话总结

arXiv ID: 2602.04252

1️⃣ 一句话总结

arXiv ID: 2601.19897

1️⃣ 一句话总结

arXiv ID: 2601.14133

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.15404 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.12163 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.11395 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08647 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08426 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03040 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02629 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04252 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.19897 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.14133 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.15404

arXiv ID: 2603.12163

arXiv ID: 2603.11395

arXiv ID: 2603.08647

arXiv ID: 2603.08426

arXiv ID: 2603.03040

arXiv ID: 2603.02629

arXiv ID: 2602.04252

arXiv ID: 2601.19897

arXiv ID: 2601.14133