arXiv ID:
2604.23225
arXiv 提交日期: 2026-04-25
深度学习交叉熵训练中的层分离优化框架 / A Layer Separation Optimization Framework for Cross-Entropy Training in Deep Learning
1️⃣ 一句话总结
该研究提出了一种层分离策略,通过引入辅助变量将深层网络的复杂优化问题拆解为一系列简单子问题,从而缓解交叉熵损失训练中的非凸性难题,并在理论和实验上证明了该方法的有效性和收敛性。