arXiv ID:
2512.17909
arXiv 提交日期: 2025-12-19
语义与重建并重:让表征编码器为文本到图像生成与编辑做好准备 / Both Semantics and Reconstruction Matter: Making Representation Encoders Ready for Text-to-Image Generation and Editing
1️⃣ 一句话总结
这篇论文提出了一种新方法,通过引入语义-像素联合重建目标,将主要用于图像识别的编码器特征改造成既紧凑又富含细节的表示,从而成功用于高质量的文本生成图像和图像编辑任务,并取得了优异的性能。