arXiv最新AI论文速览速学

🔍

标签: #token efficiency ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: One Token per Multimodal Evidence: Latent Memory for Resource-Constrained QA 06-10

arXiv ID: 2606.10572

arXiv 提交日期: 2026-06-09

llm multi-modal model training latent memory question answering retrieval-augmented generation token efficiency compression

每项多模态证据仅用一个token：面向资源受限问答的隐式记忆 / One Token per Multimodal Evidence: Latent Memory for Resource-Constrained QA

1️⃣ 一句话总结

本文提出了一种名为“隐式记忆”的新方法，将每个文本或图像证据压缩成一个高维的“隐式token”，从而大幅降低大模型在问答任务中需要处理的数据量，在节省3到10倍计算资源的同时，仍能保持甚至提升答案的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.05037

arXiv 提交日期: 2026-06-03

llm agents systems api error recovery self-reflection structured suggestions benchmark leakage audit token efficiency

自我反思型API：结构化信息比冗长描述更能帮助AI智能体从错误中恢复 / Self-Reflective APIs: Structure Beats Verbosity for AI Agent Recovery

1️⃣ 一句话总结

该论文提出了一种“自我反思型”API设计，当AI智能体调用失败时，不返回冗长的错误描述，而是直接返回结构化的、机器可读的修复建议，实验表明这种方法能显著提升智能体任务完成率和效率，尤其在部分模型中表现突出。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.05245

arXiv 提交日期: 2026-05-04

natural language processing llm systems retrieval-augmented generation multi-hop reasoning evidence selection token efficiency question answering

AdaGATE：面向多跳检索增强生成的自适应缺口感知令牌高效证据整合方法 / AdaGATE: Adaptive Gap-Aware Token-Efficient Evidence Assembly for Multi-Hop Retrieval-Augmented Generation

1️⃣ 一句话总结

本文提出了一种无需训练的智能证据筛选方法AdaGATE，它通过自动识别和填补信息缺口、生成精准子问题，并智能权衡证据的覆盖度、新颖性和相关性，以更少的输入文本显著提升了多跳问答在复杂检索场景下的准确性和稳健性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.19572

arXiv 提交日期: 2026-04-21

agents llm systems compression terminal agents token efficiency self-evolving long-horizon

一种通过观察上下文压缩实现高效终端智能体的自演化框架 / A Self-Evolving Framework for Efficient Terminal Agents via Observational Context Compression

1️⃣ 一句话总结

本文提出了一种名为TACO的自适应框架，能让终端操作型AI智能体在长任务交互过程中，自动学习和优化压缩历史观察信息的方法，从而在不降低甚至提升任务表现的前提下，显著减少计算开销和令牌消耗。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.05865

arXiv 提交日期: 2026-04-07

llm systems data json serialization token efficiency structured data context window parsing optimization

JTON：一种面向大语言模型的、具有Zen Grid表格编码的令牌高效JSON超集 / JTON: A Token-Efficient JSON Superset with Zen Grid Tabular Encoding for Large Language Models

1️⃣ 一句话总结

这篇论文提出了一种名为JTON的新数据格式，它通过一种叫Zen Grid的表格编码方法，在完全兼容JSON的同时，大幅减少了LLM处理表格数据时所需的令牌数量，从而降低了使用成本并提升了部分模型的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08659

arXiv 提交日期: 2026-03-09

llm model evaluation systems adaptive reasoning compute allocation difficulty estimation token efficiency utility maximization

CODA：面向自适应推理的难度感知计算分配方法 / CODA: Difficulty-Aware Compute Allocation for Adaptive Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为CODA的智能方法，它能让大型推理模型根据问题的难易程度自动调整思考深度，从而在简单问题上节省大量计算资源，在复杂问题上则投入更多思考以提升性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04864

arXiv 提交日期: 2026-02-04

llm multi-modal model training vision-language models token efficiency object representation adaptive inference mask-based features

当LLaVA遇见物体：视觉语言模型的令牌组合方法 / When LLaVA Meets Objects: Token Composition for Vision-Language-Models

1️⃣ 一句话总结

这篇论文提出了一种名为Mask-LLaVA的新方法，通过组合不同层级的视觉特征来大幅减少视觉语言模型所需的图像表示令牌数量，从而在保持性能的同时显著提升模型推理效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.04786

arXiv 提交日期: 2026-01-08

agents systems model training agent history token efficiency optical compression reinforcement learning visual caching

AgentOCR：通过光学自压缩重构智能体历史记录 / AgentOCR: Reimagining Agent History via Optical Self-Compression

1️⃣ 一句话总结

这篇论文提出了一个名为AgentOCR的新框架，它通过将智能体交互历史转换成紧凑的图像而非冗长的文本，并让智能体自己学习如何平衡任务成功率和计算资源消耗，从而在保持高性能的同时，大幅降低了AI智能体运行所需的计算和内存开销。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.10572

1️⃣ 一句话总结

arXiv ID: 2606.05037

1️⃣ 一句话总结

arXiv ID: 2605.05245

1️⃣ 一句话总结

arXiv ID: 2604.19572

1️⃣ 一句话总结

arXiv ID: 2604.05865

1️⃣ 一句话总结

arXiv ID: 2603.08659

1️⃣ 一句话总结

arXiv ID: 2602.04864

1️⃣ 一句话总结

arXiv ID: 2601.04786

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.10572 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.05037 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.05245 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.19572 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.05865 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08659 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04864 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.04786 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.10572

arXiv ID: 2606.05037

arXiv ID: 2605.05245

arXiv ID: 2604.19572

arXiv ID: 2604.05865

arXiv ID: 2603.08659

arXiv ID: 2602.04864

arXiv ID: 2601.04786