arXiv ID:
2603.02649
arXiv 提交日期: 2026-03-03
HomeAdam:Adam与AdamW算法有时“回家”以获得更好的可证明泛化性能 / HomeAdam: Adam and AdamW Algorithms Sometimes Go Home to Obtain Better Provable Generalization
1️⃣ 一句话总结
这篇论文提出了一种名为HomeAdam的新优化算法,它通过让Adam/W算法在某些步骤中切换回类似SGD的动量更新,在理论上同时实现了比原始Adam更快的收敛速度和更优的泛化性能。