arXiv ID:
2606.08893
廉价奖励黑客检测 / Cheap Reward Hacking Detection
1️⃣ 一句话总结
本文提出了一种低成本检测奖励黑客行为的方法,通过训练一个小型Transformer编码器将游戏轨迹映射到嵌入空间,并用线性探针识别异常,在几乎不增加计算成本的情况下,性能可与昂贵的语言模型评判方法相媲美。
廉价奖励黑客检测 / Cheap Reward Hacking Detection
本文提出了一种低成本检测奖励黑客行为的方法,通过训练一个小型Transformer编码器将游戏轨迹映射到嵌入空间,并用线性探针识别异常,在几乎不增加计算成本的情况下,性能可与昂贵的语言模型评判方法相媲美。
Onyx:成本高效的磁盘无感知近似最近邻搜索 / Onyx: Cost-Efficient Disk-Oblivious ANN Search
Onyx提出了一种新的设计思路,通过让近似最近邻搜索层减少带宽消耗、让内存混淆层减少访问次数,配合紧凑中间表示和局部感知浅树结构,在保护用户查询隐私的同时,显著降低了磁盘存储的成本和延迟。
AgentOpt v0.1 技术报告:面向基于大语言模型智能体的客户端优化 / AgentOpt v0.1 Technical Report: Client-Side Optimization for LLM-Based Agent
这篇论文提出了首个框架无关的客户端智能体优化工具AgentOpt,它通过高效的搜索算法,帮助开发者在构建多步骤AI智能体时,自动选择最符合成本、质量和速度要求的大模型组合,从而显著降低部署成本。
RouteGoT:面向成本高效思维图推理的节点自适应路由方法 / RouteGoT: Node-Adaptive Routing for Cost-Efficient Graph of Thoughts Reasoning
这篇论文提出了一种名为RouteGoT的智能路由框架,它通过为思维图推理中不同难度的节点任务动态分配不同规模的语言模型,在保证或提升推理准确率的同时,大幅降低了计算成本(如令牌消耗),实现了性能与成本的高效平衡。
基于置信度校准的大小语言模型协作系统:一种实现高效推理的成本优化方法 / Confidence-Calibrated Small-Large Language Model Collaboration for Cost-Efficient Reasoning
这篇论文提出了一种名为COREA的协作系统,它先让成本低的小模型尝试回答问题并评估自己的把握,如果把握不足再转交给昂贵的大模型处理,从而在保证高准确率的同时,显著降低了使用大模型的成本开销。
SERA:软验证高效代码库智能体 / SERA: Soft-Verified Efficient Repository Agents
这篇论文提出了一种名为SERA的高效、低成本训练方法,能让开源的代码助手快速学习并精通某个私有代码库,其性能媲美顶尖模型,但训练成本仅为传统强化学习方法的1/26,从而首次将‘为私有代码库定制AI助手’这一理论优势变为现实。
请先 登录 后再提交论文