arXiv ID:
2602.20646
arXiv 提交日期: 2026-02-24
关于带有前向与后向扰动随机梯度下降的收敛性研究 / On the Convergence of Stochastic Gradient Descent with Perturbed Forward-Backward Passes
1️⃣ 一句话总结
这篇论文首次系统分析了深度学习训练中,前向和后向计算过程同时存在扰动时随机梯度下降的收敛性,解释了训练中常见的梯度尖峰现象,并给出了扰动不影响最终收敛速度的条件。