arXiv ID:
2604.10202
arXiv 提交日期: 2026-04-11
非线性平滑神经网络中交叉熵损失Hessian矩阵特征谱的Wolkowicz-Styan上界 / Wolkowicz-Styan Upper Bound on the Hessian Eigenspectrum for Cross-Entropy Loss in Nonlinear Smooth Neural Networks
1️⃣ 一句话总结
这篇论文为非线性平滑多层神经网络的交叉熵损失函数,推导出了一个无需数值计算、用网络参数和训练数据表示的Hessian矩阵最大特征值上界公式,从而为理解损失函数的平坦程度(与泛化能力相关)提供了新的理论分析工具。