🤖 系统
11-30 17:44
📄 论文总结
从去噪到精炼:视觉语言扩散模型的校正框架 / From Denoising to Refining: A Corrective Framework for Vision-Language Diffusion Model
1️⃣ 一句话总结
这篇论文提出了一个名为ReDiff的校正框架,通过教模型识别和修正自身生成错误,有效解决了视觉语言扩散模型在并行解码时因初始错误导致的连锁反应问题,显著提升了生成内容的连贯性和事实准确性。