arXiv最新AI论文速览速学

🔍

标签: #training dynamics ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 166 72小时内新更新论文 72h更新 171 最新: Path-conditioned training: a principled way to rescale ReLU neural networks 02-24

arXiv ID: 2602.19799

arXiv 提交日期: 2026-02-23

machine learning model training theory neural networks relu parameter rescaling training dynamics initialization

路径条件训练：一种重新缩放ReLU神经网络参数的原则性方法 / Path-conditioned training: a principled way to rescale ReLU neural networks

1️⃣ 一句话总结

这篇论文提出了一种基于几何原理的新方法，通过优化调整ReLU神经网络参数的缩放比例来改善训练动态，从而有效加速模型训练过程。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21996

arXiv 提交日期: 2026-01-29

llm model training theory mechanistic interpretability influence functions data attribution circuit analysis training dynamics

机制化数据归因：追踪可解释大语言模型单元的训练起源 / Mechanistic Data Attribution: Tracing the Training Origins of Interpretable LLM Units

1️⃣ 一句话总结

这篇论文提出了一个名为MDA的新方法，能够像‘基因溯源’一样，精准找出训练数据中哪些具体样本催生了模型内部的可解释功能单元（如‘归纳头’），并通过实验证实了这些单元与模型上下文学习能力之间的因果联系，最终还利用这一发现开发了一种能有效引导模型发展的数据增强技术。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.16531

arXiv 提交日期: 2026-01-23

systems model training machine learning conditional memory training dynamics hash collisions implicit regularization gating mechanism

用于印迹式条件记忆的无冲突热层扩展：一项关于训练动态的对照研究 / A Collision-Free Hot-Tier Extension for Engram-Style Conditional Memory: A Controlled Study of Training Dynamics

1️⃣ 一句话总结

这项研究发现，在一种名为‘印迹式条件记忆’的AI模型中，单纯消除数据查找时的冲突（即不同数据被映射到同一位置）并不能提升模型性能，因为这种冲突反而起到了有益的‘隐性调节’作用，而模型性能的主要瓶颈在于其内部‘门控’机制如何分配权重。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.08297

arXiv 提交日期: 2026-01-13

llm theory model evaluation attention patterns rotary position embedding training dynamics transformer analysis slash attention

揭秘注意力机制中的斜线模式：RoPE的作用 / Demystifying the Slash Pattern in Attention: The Role of RoPE

1️⃣ 一句话总结

这篇论文通过理论和实验分析，解释了为什么大语言模型的注意力机制中会出现‘斜线主导头’模式，并揭示了旋转位置编码（RoPE）中的中高频成分是导致这一现象的关键原因。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.06421

arXiv 提交日期: 2025-12-06

model training aigc computer vision autoregressive generation exposure bias training dynamics image generation coarse-to-fine

重新思考逐尺度自回归生成中的训练动态 / Rethinking Training Dynamics in Scale-wise Autoregressive Generation

1️⃣ 一句话总结

本文提出了一种名为“自自回归精炼”的新方法，通过改进训练过程来减少模型在生成图像时因预测误差累积导致的质量下降问题，从而高效提升现有自回归模型的生成效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.26707

arXiv 提交日期: 2025-10-30

llm model training model evaluation value alignment post-training preference optimization training dynamics sft

价值漂移：追踪大语言模型后训练过程中的价值对齐 / Value Drifts: Tracing Value Alignment During LLM Post-Training

1️⃣ 一句话总结

这篇论文研究发现，大语言模型的价值取向主要是在监督微调阶段形成的，后续的偏好优化阶段很难改变已建立的价值，且不同优化算法对价值对齐的影响不同，为改进模型与人类价值观的对齐提供了关键指导。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.14807

arXiv 提交日期: 2025-10-16

llm reinforcement learning model training policy optimization exploration-exploitation pass@k training dynamics reasoning benchmarks

SimKO：简单的Pass@K策略优化 / SimKO: Simple Pass@K Policy Optimization

1️⃣ 一句话总结

这篇论文提出了一种名为SimKO的新方法，通过非对称地调整模型在正确和错误答案上的概率分布，有效缓解了现有强化学习方法中过度关注单一答案而忽视其他可能性的问题，从而在数学和逻辑推理任务中显著提升了模型探索多种正确答案的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.19799

1️⃣ 一句话总结

arXiv ID: 2601.21996

1️⃣ 一句话总结

arXiv ID: 2601.16531

1️⃣ 一句话总结

arXiv ID: 2601.08297

1️⃣ 一句话总结

arXiv ID: 2512.06421

1️⃣ 一句话总结

arXiv ID: 2510.26707

1️⃣ 一句话总结

arXiv ID: 2510.14807

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.19799 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21996 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.16531 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.08297 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.06421 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.26707 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.14807 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.19799

arXiv ID: 2601.21996

arXiv ID: 2601.16531

arXiv ID: 2601.08297

arXiv ID: 2512.06421

arXiv ID: 2510.26707

arXiv ID: 2510.14807