arXiv ID:
2604.05730
arXiv 提交日期: 2026-04-07
基于组合并行令牌预测的可控图像生成 / Controllable Image Generation with Composed Parallel Token Prediction
1️⃣ 一句话总结
这篇论文提出了一种新的可控图像生成方法,能够更精确地组合多个输入条件(如物体位置、关系或文本描述)来生成图像,不仅在效果上显著优于现有技术,而且生成速度更快,还能直接应用于已有的文本生成图像模型进行精细控制。