← 返回列表

菜单

🤖 系统
📄 Abstract - Video-As-Prompt: A Unified Framework for Semantically Controlled Video Generation
正在获取摘要...
详细标签: semantic control video-as-prompt diffusion transformers zero-shot generation position encoding 或 搜索:

📄 论文总结

视频作为提示:语义控制视频生成的统一框架 / Video-As-Prompt: A Unified Framework for Semantically Controlled Video Generation


1️⃣ 一句话总结

本文提出了Video-As-Prompt (VAP)框架,首次实现了使用参考视频作为语义提示来统一控制视频生成,避免了传统方法中像素级映射、任务特定设计等限制,并具备零样本泛化能力。


2️⃣ 论文创新点

1. Video-As-Prompt统一框架

2. 混合专家Transformer架构

3. VAP-Data数据集

4. 时间偏置旋转位置编码


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF