arXiv最新AI论文速览速学

🔍

标签: #cost efficiency ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 90 72小时内新更新论文 72h更新 90 最新: Cheap Reward Hacking Detection 06-09

arXiv ID: 2606.08893

arXiv 提交日期: 2026-06-08

reinforcement learning llm machine learning reward hacking detection trajectory embedding linear probe cost efficiency

廉价奖励黑客检测 / Cheap Reward Hacking Detection

1️⃣ 一句话总结

本文提出了一种低成本检测奖励黑客行为的方法，通过训练一个小型Transformer编码器将游戏轨迹映射到嵌入空间，并用线性探针识别异常，在几乎不增加计算成本的情况下，性能可与昂贵的语言模型评判方法相媲美。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.20401

arXiv 提交日期: 2026-04-22

systems data theory approximate nearest neighbor search oblivious ram disk-based index privacy cost efficiency

Onyx：成本高效的磁盘无感知近似最近邻搜索 / Onyx: Cost-Efficient Disk-Oblivious ANN Search

1️⃣ 一句话总结

Onyx提出了一种新的设计思路，通过让近似最近邻搜索层减少带宽消耗、让内存混淆层减少访问次数，配合紧凑中间表示和局部感知浅树结构，在保护用户查询隐私的同时，显著降低了磁盘存储的成本和延迟。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.06296

arXiv 提交日期: 2026-04-07

agents systems model evaluation client-side optimization model selection multi-step pipelines search algorithms cost efficiency

AgentOpt v0.1 技术报告：面向基于大语言模型智能体的客户端优化 / AgentOpt v0.1 Technical Report: Client-Side Optimization for LLM-Based Agent

1️⃣ 一句话总结

这篇论文提出了首个框架无关的客户端智能体优化工具AgentOpt，它通过高效的搜索算法，帮助开发者在构建多步骤AI智能体时，自动选择最符合成本、质量和速度要求的大模型组合，从而显著降低部署成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.05818

arXiv 提交日期: 2026-03-06

llm agents model evaluation graph of thoughts adaptive routing cost efficiency budget control reasoning framework

RouteGoT：面向成本高效思维图推理的节点自适应路由方法 / RouteGoT: Node-Adaptive Routing for Cost-Efficient Graph of Thoughts Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为RouteGoT的智能路由框架，它通过为思维图推理中不同难度的节点任务动态分配不同规模的语言模型，在保证或提升推理准确率的同时，大幅降低了计算成本（如令牌消耗），实现了性能与成本的高效平衡。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.03752

arXiv 提交日期: 2026-03-04

llm model training model evaluation model cascading confidence calibration reinforcement learning cost efficiency reasoning

基于置信度校准的大小语言模型协作系统：一种实现高效推理的成本优化方法 / Confidence-Calibrated Small-Large Language Model Collaboration for Cost-Efficient Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为COREA的协作系统，它先让成本低的小模型尝试回答问题并评估自己的把握，如果把握不足再转交给昂贵的大模型处理，从而在保证高准确率的同时，显著降低了使用大模型的成本开销。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.20789

arXiv 提交日期: 2026-01-28

llm agents model training coding agents supervised finetuning synthetic data repository specialization cost efficiency

SERA：软验证高效代码库智能体 / SERA: Soft-Verified Efficient Repository Agents

1️⃣ 一句话总结

这篇论文提出了一种名为SERA的高效、低成本训练方法，能让开源的代码助手快速学习并精通某个私有代码库，其性能媲美顶尖模型，但训练成本仅为传统强化学习方法的1/26，从而首次将‘为私有代码库定制AI助手’这一理论优势变为现实。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.08893

1️⃣ 一句话总结

arXiv ID: 2604.20401

1️⃣ 一句话总结

arXiv ID: 2604.06296

1️⃣ 一句话总结

arXiv ID: 2603.05818

1️⃣ 一句话总结

arXiv ID: 2603.03752

1️⃣ 一句话总结

arXiv ID: 2601.20789

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.08893 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.20401 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.06296 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.05818 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.03752 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.20789 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.08893

arXiv ID: 2604.20401

arXiv ID: 2604.06296

arXiv ID: 2603.05818

arXiv ID: 2603.03752

arXiv ID: 2601.20789