arXiv ID:
2601.05966
VideoAR:通过下一帧与尺度预测的自回归视频生成 / VideoAR: Autoregressive Video Generation via Next-Frame & Scale Prediction
1️⃣ 一句话总结
本文提出了首个大规模视觉自回归视频生成框架VideoAR,它通过结合多尺度下一帧预测与自回归建模,在显著提升生成效率的同时,达到了与主流扩散模型相媲美的视频质量,为高效且高质量的视频生成提供了新方案。