← 返回列表

菜单

🤖 系统
📄 Abstract - V-GameGym: A Comprehensive Benchmark for Visual Game Generation
正在获取摘要...
顶级标签: llm
详细标签: visual game generation code generation multimodal evaluation llm benchmarking automated testing 或 搜索:

📄 论文总结

V-GameGym:视觉游戏生成的综合基准测试

V-GameGym: A Comprehensive Benchmark for Visual Game Generation


1️⃣ 一句话总结

V-GameGym是一个针对代码大语言模型的视觉游戏生成基准测试,包含2,219个高质量样本,覆盖100个主题集群,通过基于聚类的数据筛选方法和多模态评估框架来评估代码生成与视觉合成的综合能力。


2️⃣ 论文创新点

1. 基于聚类的数据筛选方法

2. 多模态评估框架

3. 自动化测试集构建流程


3️⃣ 主要结果与价值

实验结果亮点

实际应用价值


4️⃣ 术语表

📄 打开原文 PDF