arXiv ID:
2603.22206
arXiv 提交日期: 2026-03-23
Chimera:面向异构大语言模型的延迟与性能感知多智能体服务系统 / Chimera: Latency- and Performance-Aware Multi-agent Serving for Heterogeneous LLMs
1️⃣ 一句话总结
这篇论文提出了一个名为Chimera的智能调度系统,它能让由不同规模和能力的大语言模型组成的异构集群,在协同处理多智能体复杂任务时,同时实现更低的延迟和更高的任务成功率。