arXiv ID:
2602.20672
arXiv 提交日期: 2026-02-24
从边界框到图像:大规模文生图模型中的数值边界框与颜色控制 / BBQ-to-Image: Numeric Bounding Box and Qolor Control in Large-Scale Text-to-Image Models
1️⃣ 一句话总结
这篇论文提出了一种名为BBQ的新方法,让文生图AI模型能够直接理解并精确执行用户输入的数值指令(如物体位置、大小和具体RGB颜色值),从而用类似拖拽和拾色器的直观操作替代了传统模糊的文字描述,实现了对生成图像的精准空间和色彩控制。