arXiv ID:
2512.15702
通过自重采样实现自回归视频扩散模型的端到端训练 / End-to-End Training for Autoregressive Video Diffusion via Self-Resampling
1️⃣ 一句话总结
这篇论文提出了一种名为‘重采样强制’的全新端到端训练框架,它通过让模型在训练时主动模拟并纠正自己未来可能犯的预测错误,成功解决了自回归视频生成中常见的‘曝光偏差’问题,从而能够直接训练出能生成长时间、高一致性视频的模型,无需依赖复杂的教师模型或额外训练步骤。