arXiv ID:
2605.30093
arXiv 提交日期: 2026-05-28
几何至关重要:用于学习语义对应的3D基础先验 / Geometry Matters: 3D Foundation Priors for Learning Semantic Correspondence
1️⃣ 一句话总结
本文提出一种后训练框架,通过利用3D基础模型(如SAM3D)自动提取图像的几何与姿态信息,增强2D视觉特征(如DINO和Stable Diffusion)的3D感知能力,从而更准确地区分外观相似但空间上不同的物体区域,并显著提升语义对应的准确性。