arXiv ID:
2602.19799
arXiv 提交日期: 2026-02-23
路径条件训练:一种重新缩放ReLU神经网络参数的原则性方法 / Path-conditioned training: a principled way to rescale ReLU neural networks
1️⃣ 一句话总结
这篇论文提出了一种基于几何原理的新方法,通过优化调整ReLU神经网络参数的缩放比例来改善训练动态,从而有效加速模型训练过程。