arXiv ID:
2604.26341
arXiv 提交日期: 2026-04-29
SpatialFusion:赋予统一图像生成模型内在的3D几何感知能力 / SpatialFusion: Endowing Unified Image Generation with Intrinsic 3D Geometric Awareness
1️⃣ 一句话总结
本文提出SpatialFusion框架,通过在统一图像生成模型中引入并行空间变换器来学习深度信息,并将这些几何约束注入扩散模型,使得生成的图像在空间一致性上显著超越GPT-4o等现有模型,同时不增加额外推理开销。