arXiv ID:
2603.14579
arXiv 提交日期: 2026-03-15
基于语义采样的医学图像空间定位 / Medical Image Spatial Grounding with Semantic Sampling
1️⃣ 一句话总结
这篇论文针对医学图像三维空间定位的独特挑战,提出了一个名为MIS-Ground的评测基准来系统评估视觉语言模型的能力,并开发了一种低成本、模型无关的优化方法MIS-SemSam,通过语义采样显著提升了模型定位解剖结构的准确性。