arXiv ID:
2604.19858
arXiv 提交日期: 2026-04-21
万像:突破生成式视觉智能的边界 / Wan-Image: Pushing the Boundaries of Generative Visual Intelligence
1️⃣ 一句话总结
本文提出了一种名为Wan-Image的统一视觉生成系统,通过融合大语言模型的认知能力与扩散Transformer的高保真像素合成,并借助大规模多模态数据训练和精细标注,实现了从普通图像生成到专业级图像创作工具的跨越,解决了复杂文字渲染、多主体身份保持、精确编辑等关键难题。