← 返回列表

菜单

🤖 系统
📄 Abstract
正在获取摘要...
详细标签: text-to-image evaluation multidisciplinary benchmark automated assessment semantic correctness visual quality metrics 或 搜索:

📄 论文总结

GenExam:多学科文本到图像考试基准

GenExam: A Multidisciplinary Text-to-Image Exam Benchmark


1️⃣ 一句话总结

GenExam是首个专注于多学科文本到图像生成任务的考试风格基准,包含10个学科的1000个样本,通过严格的四层分类和细粒度评分点评估模型在语义正确性和视觉合理性方面的表现,实验显示即使最先进模型在严格标准下得分也低于15%。


2️⃣ 论文创新点

1. 多学科考试风格评估基准

2. 细粒度评分点系统

3. 多维评估框架

4. 严格分数标准


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF