arXiv ID:
2604.24575
arXiv 提交日期: 2026-04-27
扩散模型作为通用分割学习器 / Diffusion Model as a Generalist Segmentation Learner
1️⃣ 一句话总结
本文提出DiGSeg框架,利用预训练扩散模型的去噪过程作为通用分割工具,通过将图像和掩码编码为条件信号并结合文本特征,在无需领域定制的情况下,在语义分割、开放词汇分割以及医疗、遥感等跨领域任务中均达到领先性能,从而将扩散模型从图像生成器转变为多功能视觉理解器。