arXiv ID:
2604.26881
arXiv 提交日期: 2026-04-29
FaaSMoE:面向多租户混合专家模型服务的无服务器框架 / FaaSMoE: A Serverless Framework for Multi-Tenant Mixture-of-Experts Serving
1️⃣ 一句话总结
这篇论文提出了一种名为FaaSMoE的新型系统,它利用无服务器计算平台的按需扩展和闲置归零特性,将混合专家模型中的每个“专家”部署为独立的即用即付函数,从而大幅降低多用户场景下的资源浪费——实验表明,相比传统方式,它能节约超过三分之二的计算资源。