arXiv最新AI论文速览速学

🔍

标签: #token reduction ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 98 72小时内新更新论文 72h更新 100 最新: Archon: A Unified Multimodal Model for Holistic Digital Human Generation 06-01

arXiv ID: 2605.30311

arXiv 提交日期: 2026-05-28

multi-modal aigc video generation digital human avatar generation autoregressive model token reduction diffusion decoder

Archon：面向全方位数字人生成的统一多模态模型 / Archon: A Unified Multimodal Model for Holistic Digital Human Generation

1️⃣ 一句话总结

本文提出一个名为Archon的统一多模态模型，它能同时处理文本、音频、动作和视觉等七种模态，通过高效的令牌压缩和逐步推理策略，高质量地生成逼真的数字人说话视频及其他虚拟人物内容。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.22011

arXiv 提交日期: 2026-05-21

computer vision model training machine learning diffusion transformers token reduction output similarity pair match ratio scheduling

重新思考扩散模型的令牌精简：基于输出相似性感知的方法 / Rethinking Token Reduction for Diffusion Models via Output-Similarity-Awareness

1️⃣ 一句话总结

本文提出一种名为DiTo的令牌精简新方法，通过利用扩散模型相邻时间步之间输出令牌相似性稳定的特点，用先前时间步的相似性来指导后续时间步的令牌合并，从而在显著降低计算成本的同时，比传统方法生成更高质量的图像。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.20170

arXiv 提交日期: 2026-05-19

llm natural language processing knowledge graph knowledge representation token reduction sub-graph encoding hallucination grounding

KoRe：面向大型语言模型的紧凑知识表示方法 / KoRe: Compact Knowledge Representations for Large Language Models

1️⃣ 一句话总结

本文提出了一种名为KoRe的方法，将知识图谱中的1跳子图压缩成离散的知识令牌，并注入大语言模型中，从而在减少10倍令牌使用量的同时，保持了与现有方法相当的任务表现，有效解决了大模型知识不透明、难以更新和易产生幻觉的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.12301

arXiv 提交日期: 2026-04-14

llm agents systems token reduction coding agents cost optimization model cascading efficiency tactics

Local-Splitter：针对编码智能体工作负载，减少云端大语言模型令牌使用的七种策略的测量研究 / Local-Splitter: A Measurement Study of Seven Tactics for Reducing Cloud LLM Token Usage on Coding-Agent Workloads

1️⃣ 一句话总结

这项研究系统地测量了七种策略，通过让一个小型本地模型充当‘把关人’来筛选任务，从而有效减少调用昂贵云端大语言模型的令牌消耗，最高可节省79%的成本，并且发现最佳策略组合取决于具体的工作负载类型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.05718

arXiv 提交日期: 2026-04-07

computer vision model training model evaluation vision transformer token reduction semantic segmentation latency optimization efficient inference

MPM：用于高效视觉Transformer的互配对合并方法 / MPM: Mutual Pair Merging for Efficient Vision Transformers

1️⃣ 一句话总结

这篇论文提出了一种无需训练、基于互近邻配对的简单令牌合并方法，能在保持语义分割精度的同时，显著降低视觉Transformer模型的计算开销和实际运行时间。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.12254

arXiv 提交日期: 2026-03-12

multi-modal model training model evaluation video understanding token reduction autoregressive selection reinforcement learning benchmark

先注视再关注：通过自回归凝视实现高效且可扩展的视频理解 / Attend Before Attention: Efficient and Scalable Video Understanding via Autoregressive Gazing

1️⃣ 一句话总结

这篇论文提出了一个名为AutoGaze的轻量级模块，它通过自回归学习的方式，智能地筛选出视频中最关键的画面片段，从而让大模型在处理长、高清视频时能大幅减少计算量、提升速度，同时保持甚至超越原有的理解能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.11656

arXiv 提交日期: 2026-02-12

multi-modal agents model training token reduction autonomous driving efficient inference multi-modal llm end-to-end systems

SToRM：面向高效端到端自动驾驶的多模态大语言模型监督式令牌缩减框架 / SToRM: Supervised Token Reduction for Multi-modal LLMs toward efficient end-to-end autonomous driving

1️⃣ 一句话总结

这篇论文提出了一个名为SToRM的新方法，它能让自动驾驶系统中的多模态大语言模型在显著降低计算成本（最高达30倍）的同时，保持与使用全部视觉数据时同等的驾驶性能，从而解决了现有模型因计算资源需求过高而难以在车辆上高效部署的难题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.03929

arXiv 提交日期: 2025-11-06

multi-modal natural language processing model training vision-language document understanding video comprehension mamba-transformer token reduction

NVIDIA Nemotron Nano V2 VL / NVIDIA Nemotron Nano V2 VL

1️⃣ 一句话总结

这篇论文介绍了NVIDIA最新推出的视觉语言模型Nemotron Nano V2 VL，它通过改进模型架构和训练方法，在文档理解、长视频分析和推理任务上表现更出色，同时提升了处理长内容的效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.30311

1️⃣ 一句话总结

arXiv ID: 2605.22011

1️⃣ 一句话总结

arXiv ID: 2605.20170

1️⃣ 一句话总结

arXiv ID: 2604.12301

1️⃣ 一句话总结

arXiv ID: 2604.05718

1️⃣ 一句话总结

arXiv ID: 2603.12254

1️⃣ 一句话总结

arXiv ID: 2602.11656

1️⃣ 一句话总结

arXiv ID: 2511.03929

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.30311 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.22011 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.20170 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.12301 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.05718 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.12254 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.11656 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.03929 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.30311

arXiv ID: 2605.22011

arXiv ID: 2605.20170

arXiv ID: 2604.12301

arXiv ID: 2604.05718

arXiv ID: 2603.12254

arXiv ID: 2602.11656

arXiv ID: 2511.03929