arXiv ID:
2602.01640
arXiv 提交日期: 2026-02-02
A2Eval:具身智能体的代理化与自动化评估框架 / A2Eval: Agentic and Automated Evaluation for Embodied Brain
1️⃣ 一句话总结
这篇论文提出了一个名为A2Eval的自动化评估框架,它通过两个协作的智能代理来自动生成平衡的测试集和执行评估,从而大幅降低了传统具身智能模型评估的成本和时间,同时纠正了排名偏差,使评估结果更可靠、更高效。