arXiv ID:
2602.12173
arXiv 提交日期: 2026-02-12
SAM3-LiteText:针对高效视觉语言分割的SAM3文本编码器解剖学研究 / SAM3-LiteText: An Anatomical Study of the SAM3 Text Encoder for Efficient Vision-Language Segmentation
1️⃣ 一句话总结
这篇论文通过分析大量真实分割提示,发现现有视觉语言分割模型中的文本编码器存在严重冗余,并据此设计了一个轻量化的文本编码框架,在保持分割性能的同时,将模型参数减少了高达88%。