arXiv ID:
2606.23679
arXiv 提交日期: 2026-06-22
语义浏览:图像生成中的可控多样性 / Semantic Browsing: Controllable Diversity for Image Generation
1️⃣ 一句话总结
本文提出一种名为“语义浏览”的新方法,通过让视觉语言模型在文本层面主动调整描述文字,从而生成一系列在语义上有所不同、且每种变化都对应着用户可以理解的设计选择,解决了现有图像生成模型在提升多样性时缺乏可控性和可解读性的问题。