arXiv ID:
2605.17766
arXiv 提交日期: 2026-05-18
LatentUMM:面向统一多模态模型的双重潜空间对齐方法 / LatentUMM: Dual Latent Alignment for Unified Multimodal Models
1️⃣ 一句话总结
本文提出一种名为LatentUMM的新框架,通过在统一多模态模型中引入双重潜空间对齐(同时对齐不同模态间以及编码与生成过程),解决了模型在理解与生成任务之间存在的功能不一致问题,从而显著提升了跨模态转换时的语义一致性。