arXiv ID:
2603.18168
arXiv 提交日期: 2026-03-18
任意形状与尺寸的残差网络:在大尺度极限下的训练动态收敛性 / ResNets of All Shapes and Sizes: Convergence of Training Dynamics in the Large-scale Limit
1️⃣ 一句话总结
这篇论文严格证明了当残差网络的深度、宽度和嵌入维度同时趋于无穷大时,其训练过程会收敛到一个确定的极限,并给出了收敛速度的定量估计,这一理论框架也适用于Transformer等主流架构。