arXiv ID:
2508.21058
arXiv 提交日期: 2025-08-28
用于生成长视频的上下文混合方法 / Mixture of Contexts for Long Video Generation
1️⃣ 一句话总结
本文提出了一种名为‘上下文混合’的新型注意力机制,通过让模型动态选择并关注视频中最关键的历史片段,解决了长视频生成中因计算量过大导致的内容记忆和一致性难题,从而能够高效生成长达数分钟且内容连贯的视频。