arXiv ID:
2603.08257
arXiv 提交日期: 2026-03-09
超越ReinMax:面向离散隐变量的低方差梯度估计器 / Beyond ReinMax: Low-Variance Gradient Estimators for Discrete Latent Variables
1️⃣ 一句话总结
这篇论文提出了两种新的梯度估计方法(ReinMax-Rao和ReinMax-CV),通过在现有ReinMax方法中融入统计降噪技术,显著降低了模型训练中离散隐变量梯度估计的方差,从而提升了变分自编码器等模型的训练效果。