🤖 系统
11-30 17:33
📄 论文总结
GenExam: 一个多学科的文本到图像考试 / GenExam: A Multidisciplinary Text-to-Image Exam
1️⃣ 一句话总结
这篇论文提出了首个多学科文本到图像生成考试基准GenExam,通过涵盖10个学科的1000道考题来严格评估AI模型在理解、推理和图像生成方面的综合能力,实验表明当前最先进的模型得分极低,突显了该基准的挑战性。
请先 登录 后再提交论文
GenExam: 一个多学科的文本到图像考试 / GenExam: A Multidisciplinary Text-to-Image Exam
这篇论文提出了首个多学科文本到图像生成考试基准GenExam,通过涵盖10个学科的1000道考题来严格评估AI模型在理解、推理和图像生成方面的综合能力,实验表明当前最先进的模型得分极低,突显了该基准的挑战性。