arXiv ID:
2603.03026
arXiv 提交日期: 2026-03-03
任意分辨率任意几何:从多视角到多块 / Any Resolution Any Geometry: From Multi-View To Multi-Patch
1️⃣ 一句话总结
这篇论文提出了一个名为URGT的多块Transformer模型,它通过将高分辨率图像分割成多个小块并利用跨块注意力机制进行联合处理,在单张图像上同时实现了高精度的深度和表面法线估计,显著提升了细节保持与全局一致性,并在多个指标上取得了领先的性能。