arXiv ID:
2604.12301
arXiv 提交日期: 2026-04-14
Local-Splitter:针对编码智能体工作负载,减少云端大语言模型令牌使用的七种策略的测量研究 / Local-Splitter: A Measurement Study of Seven Tactics for Reducing Cloud LLM Token Usage on Coding-Agent Workloads
1️⃣ 一句话总结
这项研究系统地测量了七种策略,通过让一个小型本地模型充当‘把关人’来筛选任务,从而有效减少调用昂贵云端大语言模型的令牌消耗,最高可节省79%的成本,并且发现最佳策略组合取决于具体的工作负载类型。