arXiv ID:
2602.21627
arXiv 提交日期: 2026-02-25
使用RLE进行语义分割的标记化 / Tokenizing Semantic Segmentation with RLE
1️⃣ 一句话总结
这篇论文提出了一种新颖的通用方法,通过将图像和视频中的语义分割掩码转换为类似语言的离散标记序列,并利用自回归模型进行预测,从而统一处理图像和视频的分割任务,同时还能扩展到全景分割。