arXiv ID:
2602.11144
arXiv 提交日期: 2026-02-11
GENIUS:生成式流体智能评估套件 / GENIUS: Generative Fluid Intelligence Evaluation Suite
1️⃣ 一句话总结
这篇论文提出了一个名为GENIUS的新评估标准,旨在测试AI模型在遇到全新、未见过的情境时,能否像人类一样灵活推理、归纳规律并创造新内容,而不仅仅是依赖已有的知识库,结果发现当前主流模型在这方面的能力仍有明显不足。