🤖 系统
12-02 14:50
WiseEdit:评估认知与创意驱动的图像编辑能力的基准 / WiseEdit: Benchmarking Cognition- and Creativity-Informed Image Editing
1️⃣ 一句话总结
这篇论文提出了一个名为WiseEdit的新基准测试,它通过模拟人类认知创作过程来全面评估图像编辑模型在知识推理和创意生成方面的能力,揭示了当前先进模型的局限性。
请先 登录 后再提交论文
WiseEdit:评估认知与创意驱动的图像编辑能力的基准 / WiseEdit: Benchmarking Cognition- and Creativity-Informed Image Editing
这篇论文提出了一个名为WiseEdit的新基准测试,它通过模拟人类认知创作过程来全面评估图像编辑模型在知识推理和创意生成方面的能力,揭示了当前先进模型的局限性。
MovieCORE:电影中的认知推理 / MovieCORE: COgnitive REasoning in Movies
这篇论文提出了一个名为MovieCORE的新型视频问答数据集,专门用于测试AI对电影内容深层认知理解的能力,并通过创新的智能增强方法显著提升了现有模型的推理表现。