arXiv ID:
2602.17594
arXiv 提交日期: 2026-02-19
AI游戏商店:通过人类游戏对机器通用智能进行可扩展、开放式的评估 / AI Gamestore: Scalable, Open-Ended Evaluation of Machine General Intelligence with Human Games
1️⃣ 一句话总结
这篇论文提出了一个名为‘AI游戏商店’的新评估平台,通过让AI系统学习和游玩大量由人类设计、为人类设计的游戏,来更全面、动态地衡量其是否具备接近人类的通用智能,初步测试表明当前顶尖模型在大多数游戏上的表现远不及人类平均水平。