arXiv ID:
2601.17483
arXiv 提交日期: 2026-01-24
神经网络训练的自动稳定性与恢复 / Automatic Stability and Recovery for Neural Network Training
1️⃣ 一句话总结
这篇论文提出了一种在神经网络训练过程中自动监控、检测并从中断性错误中恢复的运行时框架,无需修改原有优化器,从而保证了训练过程的稳定性和安全性。