arXiv ID:
2606.13676
arXiv 提交日期: 2026-06-11
模态强制:可扩展的空间生成方法 / Modality Forcing for Scalable Spatial Generation
1️⃣ 一句话总结
本文提出了一种名为“模态强制”的简单后训练方法,通过为图像和深度数据分配不同的噪声级别,让预训练的文生图模型能够在不依赖密集深度数据的情况下,同时或分别生成图像与深度图,从而在保持模型可扩展性的同时,大幅提升深度预测的准确性。