arXiv ID:
2512.15560
arXiv 提交日期: 2025-12-17
GRAN-TED:为扩散模型生成鲁棒、对齐且细致的文本嵌入 / GRAN-TED: Generating Robust, Aligned, and Nuanced Text Embedding for Diffusion Models
1️⃣ 一句话总结
这篇论文提出了一个名为GRAN-TED的新方法,它通过一个快速高效的文本基准测试和一个两阶段训练策略,显著提升了文生图/视频扩散模型中文本编码器的性能,使生成的图像和视频更精准地符合文字描述。