🤖 系统
11-30 17:38
📄 论文总结
InstructX:基于多模态大语言模型引导的统一视觉编辑框架 / InstructX: Towards Unified Visual Editing with MLLM Guidance
1️⃣ 一句话总结
这篇论文提出了一个名为InstructX的统一框架,通过巧妙结合多模态大语言模型和扩散模型,实现了仅用图像数据训练就能同时处理图像和视频编辑任务,并在多种编辑任务中取得了领先性能。
请先 登录 后再提交论文
InstructX:基于多模态大语言模型引导的统一视觉编辑框架 / InstructX: Towards Unified Visual Editing with MLLM Guidance
这篇论文提出了一个名为InstructX的统一框架,通过巧妙结合多模态大语言模型和扩散模型,实现了仅用图像数据训练就能同时处理图像和视频编辑任务,并在多种编辑任务中取得了领先性能。