arXiv ID:
2606.27397
arXiv 提交日期: 2026-06-24
SidConArena:在开放式、正和博弈谈判中评估智能体的环境 / SidConArena: An Environment Evaluating Agents in Open-Ended,Positive-Sum Bargaining Game
1️⃣ 一句话总结
这篇论文提出了一个名为SidConArena的新型测试框架,它通过模拟包含谈判、生产和投资拍卖的多人经济游戏,来评估AI智能体在开放式合作与竞争场景下的综合决策能力,并发现当前最先进的模型虽然表现较好,但仍存在资源误判、谈判被动和长期规划不足等缺陷。