arXiv ID:
2512.04810
arXiv 提交日期: 2025-12-04
EMMA:一种用于多模态理解、生成与编辑的高效统一架构 / EMMA: Efficient Multimodal Understanding, Generation, and Editing with a Unified Architecture
1️⃣ 一句话总结
这篇论文提出了一个名为EMMA的高效统一模型架构,它通过创新的压缩、拼接和网络设计,在一个系统中同时实现了对图像和文本的理解、生成与编辑,并且比现有的大型统一模型更小、更快、效果更好。