← 返回列表

菜单

🤖 系统
📄 Abstract - Enhancing Color Fidelity in Text-to-Image Generation via LLM Semantic Disambiguation and Embedding Refinement
正在获取摘要...
详细标签: text-to-image generation color fidelity semantic disambiguation embedding refinement benchmark evaluation 或 搜索:

📄 论文总结

通过大语言模型语义消歧和嵌入精炼提升文本到图像生成中的颜色保真度

Enhancing Color Fidelity in Text-to-Image Generation via LLM Semantic Disambiguation and Embedding Refinement


1️⃣ 一句话总结

本文提出了一种无需训练的方法,利用大语言模型(LLM)消除文本提示中模糊颜色术语的歧义,并通过在CIELab颜色空间中进行基于检索的嵌入精炼,显著提升了文本到图像(T2I)生成模型在复杂颜色表达上的准确性和一致性。


2️⃣ 论文创新点

1. 基于LLM的语义颜色消歧

2. 基于检索的嵌入精炼

3. TintBench基准数据集


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF