arXiv ID:
2605.02134
arXiv 提交日期: 2026-05-04
基于预测性潜在变量的视频生成 / Video Generation with Predictive Latents
1️⃣ 一句话总结
本文提出了一种名为预测性视频变分自编码器(PV-VAE)的方法,通过让模型在编码部分过去帧的同时预测未来帧,使得潜在空间能够更好地捕捉视频的动态规律,从而显著提升视频生成的质量和训练效率。