arXiv ID:
2603.15367
arXiv 提交日期: 2026-03-16
用于小批量训练前馈神经网络采样的受控朗之万动力学 / Controlled Langevin Dynamics for Sampling of Feedforward Neural Networks Trained with Minibatches
1️⃣ 一句话总结
这篇论文提出了一种使用小批量梯度进行高效采样的伪朗之万动力学方法,它能够像传统精确采样方法一样探索神经网络参数空间中的低损失区域,但计算成本大大降低,可扩展到百万参数级别的网络,并且通过调节采样温度就能找到泛化性能最佳的模型,无需依赖验证集或早停技巧。