arXiv ID:
2603.16104
arXiv 提交日期: 2026-03-17
面向智能体工作流的高效大语言模型服务:一个数据系统视角 / Efficient LLM Serving for Agentic Workflows: A Data Systems Perspective
1️⃣ 一句话总结
这篇论文提出了一种名为Helium的新型服务框架,它将复杂的AI智能体工作流视为数据库查询计划来优化,通过主动缓存和缓存感知调度等技术,显著提升了执行效率,比现有系统快了最多1.56倍。