← 返回列表

菜单

🤖 系统
📄 Abstract - MSC-Bench: A Large-Scale Benchmark for Evaluating Multi-Server Tool Orchestration
正在获取摘要...
顶级标签: agents
详细标签: tool orchestration multi-server systems agent evaluation function equivalence hierarchical protocols 或 搜索:

📄 论文总结

MSC-Bench:用于评估多服务器工具编排的大规模基准测试 / MSC-Bench: A Large-Scale Benchmark for Evaluating Multi-Server Tool Orchestration


1️⃣ 一句话总结

MSC-Bench是一个专门为分层模型上下文协议(MCP)生态系统设计的大规模基准测试,通过构建等效函数集作为真实标签,系统评估AI代理在从简单工具使用到复杂跨服务器规划的多跳工具编排能力。


2️⃣ 论文创新点

1. 等效函数集方法

2. 五级课程设计

3. 真实世界MCP工具语料库


3️⃣ 主要结果与价值

结果亮点

实际价值


4️⃣ 术语表

📄 打开原文 PDF