arXiv最新AI论文速览速学

🔍

标签: #memorization ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: The Rules-and-Facts Model for Simultaneous Generalization and Memorization in Neural Networks 03-30

arXiv ID: 2603.25579

arXiv 提交日期: 2026-03-26

theory machine learning model training statistical physics of learning teacher-student framework generalization memorization overparameterization

神经网络中同时实现泛化与记忆的规则-事实模型 / The Rules-and-Facts Model for Simultaneous Generalization and Memorization in Neural Networks

1️⃣ 一句话总结

这篇论文提出了一个名为‘规则-事实’的理论模型，解释了现代神经网络如何通过足够的参数容量和恰当的优化策略，在学会通用规则的同时，也能记住训练数据中的特定事实或例外情况。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.21658

arXiv 提交日期: 2026-03-23

llm model training model evaluation memorization model analysis internal mechanisms scaling laws pre-training

大语言模型记忆的统计与内部层次对比分析：跨模型共性与模型特定特征 / A Comparative Analysis of LLM Memorization at Statistical and Internal Levels: Cross-Model Commonalities and Model-Specific Signatures

1️⃣ 一句话总结

这篇论文通过对比分析多个大语言模型系列，揭示了模型记忆行为在统计层面（如记忆率随模型规模对数线性增长）和内部机制层面（如存在共享的解码过程和重要注意力头）的普遍规律，同时也发现了不同模型家族特有的记忆特征。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02333

arXiv 提交日期: 2026-03-02

natural language processing model training model evaluation diffusion language models memorization data extraction privacy sampling resolution

扩散语言模型的记忆特性分析：广义提取与采样效应 / Characterizing Memorization in Diffusion Language Models: Generalized Extraction and Sampling Effects

1️⃣ 一句话总结

这篇论文通过建立一个统一的概率提取框架，首次系统性地揭示了扩散语言模型（DLM）的记忆特性，发现其记忆训练数据的能力会随着采样分辨率的提高而严格增强，并且在同等条件下比自回归模型泄露个人信息的风险更低。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20580

arXiv 提交日期: 2026-02-24

llm model training data privacy memorization personal information data filtering model scaling

语言模型中的个人信息复述 / Personal Information Parroting in Language Models

1️⃣ 一句话总结

这篇论文发现，大语言模型在训练时会记住并精确复述训练数据中的大量个人信息（如邮箱、电话），且模型越大、训练越久，这种隐私泄露风险就越高，因此建议对训练数据进行严格的过滤和匿名化处理。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20114

arXiv 提交日期: 2026-02-23

computer vision model training model evaluation machine unlearning vision transformers benchmark memorization forgetting quality

视觉Transformer的遗忘能力基准测试 / Benchmarking Unlearning for Vision Transformers

1️⃣ 一句话总结

这篇论文首次为视觉Transformer建立了机器遗忘能力的基准测试框架，通过系统评估不同算法在不同模型和数据上的表现，揭示了视觉Transformer的记忆特性，并为未来开发更安全、公平的AI提供了可复现的评估基础。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.11061

arXiv 提交日期: 2026-01-16

llm model training theory reinforcement learning memorization mechanistic interpretability circuit analysis data contamination

虚假奖励悖论：从机制上理解RLVR如何激活大语言模型中的记忆捷径 / Spurious Rewards Paradox: Mechanistically Understanding How RLVR Activates Memorization Shortcuts in LLMs

1️⃣ 一句话总结

这篇论文发现，即使使用错误的奖励信号进行强化学习训练，大语言模型也能取得性能提升，其机制是模型在中间层形成了一个‘锚点-适配器’神经回路，绕过了复杂的推理过程，直接通过记忆来生成答案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.21337

arXiv 提交日期: 2025-12-24

computer vision multi-modal model evaluation vision-language models popularity bias ordinal regression benchmark dataset memorization

超越记忆：一个多模态序数回归基准，用于揭示视觉-语言模型中的流行度偏见 / Beyond Memorization: A Multi-Modal Ordinal Regression Benchmark to Expose Popularity Bias in Vision-Language Models

1️⃣ 一句话总结

这篇论文通过构建一个包含5.5万多张建筑图像的大型数据集，发现当前先进的视觉-语言模型存在严重的流行度偏见，即对知名建筑的识别准确率远高于普通建筑，揭示了模型过度依赖记忆而非真正理解能力的缺陷。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.25579

1️⃣ 一句话总结

arXiv ID: 2603.21658

1️⃣ 一句话总结

arXiv ID: 2603.02333

1️⃣ 一句话总结

arXiv ID: 2602.20580

1️⃣ 一句话总结

arXiv ID: 2602.20114

1️⃣ 一句话总结

arXiv ID: 2601.11061

1️⃣ 一句话总结

arXiv ID: 2512.21337

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.25579 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.21658 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02333 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20580 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20114 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.11061 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.21337 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.25579

arXiv ID: 2603.21658

arXiv ID: 2603.02333

arXiv ID: 2602.20580

arXiv ID: 2602.20114

arXiv ID: 2601.11061

arXiv ID: 2512.21337