arXiv ID:
2605.01928
arXiv 提交日期: 2026-05-03
通过最优传输训练不可微网络 / Training Non-Differentiable Networks via Optimal Transport
1️⃣ 一句话总结
本文提出了一种名为PolyStep的梯度免费优化方法,通过仅利用前向传播在压缩子空间的顶点上评估损失并计算最优传输更新,从而高效地训练包含脉冲神经元、量化层等不可微组件的神经网络,实验表明在多种不可微架构上显著优于现有梯度免费方法,并具备理论收敛保证。