arXiv最新AI论文速览速学

🔍

标签: #cost optimization ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: Local-Splitter: A Measurement Study of Seven Tactics for Reducing Cloud LLM Token Usage on Coding-Agent Workloads 04-19

arXiv ID: 2604.12301

arXiv 提交日期: 2026-04-14

llm agents systems token reduction coding agents cost optimization model cascading efficiency tactics

Local-Splitter：针对编码智能体工作负载，减少云端大语言模型令牌使用的七种策略的测量研究 / Local-Splitter: A Measurement Study of Seven Tactics for Reducing Cloud LLM Token Usage on Coding-Agent Workloads

1️⃣ 一句话总结

这项研究系统地测量了七种策略，通过让一个小型本地模型充当‘把关人’来筛选任务，从而有效减少调用昂贵云端大语言模型的令牌消耗，最高可节省79%的成本，并且发现最佳策略组合取决于具体的工作负载类型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.07897

arXiv 提交日期: 2026-03-09

llm agents systems automated machine learning feature engineering execution time prediction cost optimization retrieval-augmented generation

LeJOT-AutoML：基于大语言模型的特征工程用于Databricks作业执行时间预测与成本优化 / LeJOT-AutoML: LLM-Driven Feature Engineering for Job Execution Time Prediction in Databricks Cost Optimization

1️⃣ 一句话总结

这篇论文提出了一个名为LeJOT-AutoML的智能框架，它利用大语言模型自动分析作业日志和脚本，快速生成预测执行时间所需的关键特征，从而将特征工程周期从数周缩短至半小时，并在实际部署中帮助节省了约19%的云计算成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19509

arXiv 提交日期: 2026-02-23

llm agents model evaluation mixture-of-agents cost optimization dynamic routing inference efficiency confidence calibration

金字塔MoA：一种面向成本优化的任意时间推理概率框架 / Pyramid MoA: A Probabilistic Framework for Cost-Optimized Anytime Inference

1️⃣ 一句话总结

这篇论文提出了一种名为‘金字塔MoA’的智能系统架构，它通过一个轻量级调度器，仅在必要时将难题分配给更强的大模型处理，从而在保持与大模型相近的高准确率（例如在数学题上达到93%）的同时，显著降低了61%的计算成本，实现了性能与预算的高效平衡。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.07429

arXiv 提交日期: 2025-10-08

llm systems model training adaptive routing contextual bandit preference learning cost optimization online decision making

基于多臂老虎机反馈学习大语言模型路由：一种策略，多种权衡 / Learning to Route LLMs from Bandit Feedback: One Policy, Many Trade-offs

1️⃣ 一句话总结

这篇论文提出了一种名为BaRP的新方法，它通过模拟在线反馈训练一个大语言模型路由系统，让运营商无需重新训练就能在部署时灵活调整性能和成本之间的平衡，从而在节省开支的同时保持高质量输出。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.12301

1️⃣ 一句话总结

arXiv ID: 2603.07897

1️⃣ 一句话总结

arXiv ID: 2602.19509

1️⃣ 一句话总结

arXiv ID: 2510.07429

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.12301 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.07897 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19509 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.07429 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.12301

arXiv ID: 2603.07897

arXiv ID: 2602.19509

arXiv ID: 2510.07429