arXiv ID:
2604.19453
arXiv 提交日期: 2026-04-21
ZC-Swish:面向边缘与微批次应用的深度无批归一化网络稳定方法 / ZC-Swish: Stabilizing Deep BN-Free Networks for Edge and Micro-Batch Applications
1️⃣ 一句话总结
该论文提出了一种名为ZC-Swish的新型激活函数,通过让输出均值始终接近零,解决了在无法使用批归一化的深度网络中(如医疗影像小批次训练或联邦学习场景)因激活函数(如Swish、ReLU)非零中心特性导致的梯度消失和训练崩溃问题,使网络在深度达32层时仍能稳定训练并保持较高准确率。