arXiv最新AI论文速览速学

🔍

标签: #forgetting ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 98 72小时内新更新论文 72h更新 100 最新: Auditing Machine Unlearning: A Systematic Research on Whether Models Truly Forget 06-22

arXiv ID: 2606.16110

arXiv 提交日期: 2026-06-15

machine learning model evaluation machine unlearning auditing privacy evaluation forgetting

审计机器遗忘：关于模型是否真正遗忘的系统性研究 / Auditing Machine Unlearning: A Systematic Research on Whether Models Truly Forget

1️⃣ 一句话总结

本文提出了一种首个实用且通用的机器遗忘审计框架，通过无需重新训练基线、避免训练大量影子模型且不干预原始训练过程的方式，系统验证了现有遗忘算法是否真的彻底删除了指定数据，并发现基于重新训练和微调的方法有效，而基于去优化和Fisher/Hessian的方法会失败甚至损害模型性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.10406

arXiv 提交日期: 2026-06-09

machine learning model training forgetting optimizer gradient interference orthogonalization continual learning

FOGO：具有遗忘感知的正交化优化器 / FOGO: Forgetting-aware Orthogonalization Optimizer

1️⃣ 一句话总结

本文提出了一种名为FOGO的新型优化器，它能够自动检测并解决训练过程中的梯度冲突，防止某些“强势”梯度方向长期压制其他有用但罕见的更新方向，从而在标准训练、类别不平衡、持续学习以及大模型微调等场景下显著提升模型的收敛速度和记忆保留能力，效果优于Adam和Muon。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28705

arXiv 提交日期: 2026-05-27

llm theory in-context learning continual learning generalization attention mechanism forgetting

上下文持续学习中的泛化与遗忘机制理解 / Understanding Generalization and Forgetting in In-Context Continual Learning

1️⃣ 一句话总结

本文首次为上下文持续学习建立了理论框架，通过分析注意力机制如何处理连续任务序列，揭示了标准注意力因统一或因果聚合历史上下文而必然导致任务间干扰，从而解释了长提示中性能下降和顺序敏感性现象。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.27975

arXiv 提交日期: 2026-05-27

machine learning model training continual learning hopfield networks diffusion models memory replay forgetting

现代Hopfield网络中的持续学习及其在扩散模型中的应用 / Continual Learning in Modern Hopfield Networks with an Application to Diffusion Models

1️⃣ 一句话总结

本文通过分析现代Hopfield网络的能量特性，发现任务切换后高能量、孤立的数据样本更容易被遗忘，而回放这些高能量样本能有效缓解遗忘，并将这一发现成功应用于扩散模型（如Stable Diffusion）的持续学习中。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.03570

arXiv 提交日期: 2026-01-07

llm model training theory concept learning continual pretraining interpretability forgetting circuit analysis

大语言模型在持续预训练中如何学习概念？ / How Do Large Language Models Learn Concepts During Continual Pre-Training?

1️⃣ 一句话总结

这篇论文通过分析大语言模型内部的‘概念电路’，揭示了模型在持续学习新知识时如何获取、遗忘以及让不同概念相互影响的具体动态过程，为设计更可解释和稳健的模型训练方法提供了新视角。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.16110

1️⃣ 一句话总结

arXiv ID: 2606.10406

1️⃣ 一句话总结

arXiv ID: 2605.28705

1️⃣ 一句话总结

arXiv ID: 2605.27975

1️⃣ 一句话总结

arXiv ID: 2601.03570

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.16110 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.10406 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28705 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.27975 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.03570 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.16110

arXiv ID: 2606.10406

arXiv ID: 2605.28705

arXiv ID: 2605.27975

arXiv ID: 2601.03570