arXiv ID:
2510.09320
arXiv 提交日期: 2025-10-10
面向自监督单目深度估计的粗细粒度语言引导混合特征聚合方法 / Hybrid-grained Feature Aggregation with Coarse-to-fine Language Guidance for Self-supervised Monocular Depth Estimation
1️⃣ 一句话总结
这项研究提出了一种结合CLIP和DINO基础模型的新方法,通过从粗到细的语言引导融合全局语义和局部空间特征,显著提升了自监督单目深度估计的精度,并能直接增强现有主流模型的性能。