arXiv ID:
2604.04780
arXiv 提交日期: 2026-04-06
CLEAR:在统一多模态模型中解锁生成潜力以理解退化图像 / CLEAR: Unlocking Generative Potential for Degraded Image Understanding in Unified Multimodal Models
1️⃣ 一句话总结
这篇论文提出了一个名为CLEAR的框架,通过训练模型在推理时主动生成图像细节并优化生成与理解之间的连接,显著提升了统一多模态模型在应对模糊、噪声等退化图像时的理解能力,同时不影响其在清晰图像上的原有性能。