🤖 系统
11-30 17:49
📄 论文总结
CostBench:评估动态环境中LLM工具使用代理的多轮成本最优规划与适应能力 / CostBench: Evaluating Multi-Turn Cost-Optimal Planning and Adaptation in Dynamic Environments for LLM Tool-Use Agents
1️⃣ 一句话总结
这篇论文提出了一个名为CostBench的新评估基准,专门用于测试AI代理在动态环境中制定和调整经济高效计划的能力,发现当前先进模型在成本优化规划和实时适应方面存在显著不足。