arXiv ID:
2601.05823
通过解耦表征对齐提升潜在扩散模型 / Boosting Latent Diffusion Models via Disentangled Representation Alignment
1️⃣ 一句话总结
这篇论文提出了一种名为Send-VAE的新型图像编码器,它通过将编码器的潜在空间与视觉基础模型的语义层次对齐,实现了对图像属性的解耦表征,从而显著提升了潜在扩散模型的图像生成质量和训练效率。