arXiv最新AI论文速览速学

🔍

标签: #reasoning efficiency ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 166 72小时内新更新论文 72h更新 171 最新: Reasoning as Compression: Unifying Budget Forcing via the Conditional Information Bottleneck 03-16

arXiv ID: 2603.08462

arXiv 提交日期: 2026-03-09

llm theory model training reasoning efficiency information bottleneck chain-of-thought reinforcement learning lossy compression

推理即压缩：通过条件信息瓶颈统一预算强制 / Reasoning as Compression: Unifying Budget Forcing via the Conditional Information Bottleneck

1️⃣ 一句话总结

这篇论文提出将大语言模型中的思维链推理视为一个压缩问题，通过一种新的条件信息瓶颈训练目标，在减少推理过程长度的同时，能更智能地保留关键逻辑信息，从而在控制计算成本的同时保持甚至提升任务准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.07915

arXiv 提交日期: 2026-03-09

llm agents model evaluation reasoning efficiency adaptive computation agent systems cost reduction dynamic routing

Ares：面向高效大语言模型智能体的自适应推理努力选择框架 / Ares: Adaptive Reasoning Effort Selection for Efficient LLM Agents

1️⃣ 一句话总结

这篇论文提出了一个名为Ares的框架，它通过一个轻量级路由器动态地为智能体任务的每一步选择最低必要的推理强度，从而在几乎不影响任务成功率的前提下，显著降低了大语言模型智能体的推理成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.09953

arXiv 提交日期: 2026-02-10

llm model training agents process supervision attention mechanism reinforcement learning reasoning efficiency credit assignment

ATTNPO：基于注意力引导的过程监督高效推理方法 / ATTNPO: Attention-Guided Process Supervision for Efficient Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为ATTNPO的新方法，它巧妙地利用模型自身的注意力信号来识别并减少推理过程中的冗余步骤，从而在保证甚至提升推理准确率的同时，显著缩短了推理长度，实现了更高效、更精准的复杂问题求解。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08354

arXiv 提交日期: 2026-02-09

llm model evaluation theory reasoning efficiency chain-of-thought sampling paradigm self-aware reasoning reinforcement learning

你的推理模型是否隐式地知道何时停止思考？ / Does Your Reasoning Model Implicitly Know When to Stop Thinking?

1️⃣ 一句话总结

这篇论文发现大型推理模型其实隐含着知道何时该停止思考的能力，并提出了一种名为SAGE的新采样方法，能有效利用这种能力，在提升模型推理准确率的同时大幅减少不必要的计算步骤。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03249

arXiv 提交日期: 2026-02-03

llm model training systems reasoning efficiency kv cache compression reinforcement learning dynamic summarization chain-of-thought

手风琴式思考：通过自调节步骤摘要实现高效可读的大语言模型推理 / Accordion-Thinking: Self-Regulated Step Summaries for Efficient and Readable LLM Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为‘手风琴式思考’的新方法，让大语言模型学会在推理过程中自动总结并压缩中间思考步骤，从而在不降低解题准确性的前提下，大幅提升推理效率并降低内存消耗，同时生成的摘要也使推理过程对人类更易读。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03814

arXiv 提交日期: 2026-02-03

llm model evaluation theory risk control adaptive computation conformal prediction reasoning efficiency early exiting

保形思维：计算预算下推理的风险控制 / Conformal Thinking: Risk Control for Reasoning on a Compute Budget

1️⃣ 一句话总结

这篇论文提出了一种新方法，让大语言模型在回答问题时能自动决定何时停止思考，从而在保证错误率不超限的前提下，最大限度地节省计算资源。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.01982

arXiv 提交日期: 2026-02-02

llm model training natural language processing chain-of-thought activation steering reasoning efficiency instruction tuning self-supervised learning

S3-CoT：通过自采样简明推理实现高效思维链大语言模型 / S3-CoT: Self-Sampled Succinct Reasoning Enables Efficient Chain-of-Thought LLMs

1️⃣ 一句话总结

这篇论文提出了一种让大语言模型学会‘快速思考’的新方法，它通过引导模型自己生成简洁的推理步骤来学习，无需人工标注数据，从而在数学和医学任务上更高效、更准确地解决问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.14750

arXiv 提交日期: 2026-01-21

llm multi-modal model evaluation chain-of-thought visual reasoning token compression vision language models reasoning efficiency

思维渲染：将文本思维链渲染为图像以实现视觉潜在推理 / Render-of-Thought: Rendering Textual Chain-of-Thought as Images for Visual Latent Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为‘思维渲染’的新方法，它将大语言模型推理过程中冗长的文字思维链转换成图像，从而大幅减少了计算负担并加速了推理过程，同时让模型的思考步骤变得可见和可追溯。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.05110

arXiv 提交日期: 2026-01-08

llm model evaluation systems collaborative inference reasoning efficiency token entropy routing computation allocation

GlimpRouter：通过窥视一个思维标记实现高效的协同推理 / GlimpRouter: Efficient Collaborative Inference by Glimpsing One Token of Thoughts

1️⃣ 一句话总结

这篇论文提出了一种名为GlimpRouter的新方法，它通过让轻量级模型仅生成每个推理步骤的第一个词，并根据该词的‘不确定性’来判断是否需要动用大型模型来完成整个步骤，从而在保证准确率的同时，大幅降低了大型推理模型的运算成本和延迟。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.05175

arXiv 提交日期: 2026-01-08

multi-modal model training model evaluation video understanding chain-of-thought reasoning efficiency video qa confidence-based inference

VideoAuto-R1：通过“思考一次，回答两次”实现视频自动推理 / VideoAuto-R1: Video Auto Reasoning via Thinking Once, Answering Twice

1️⃣ 一句话总结

这篇论文提出了一种新的视频理解框架VideoAuto-R1，它通过‘先给出初步答案，再根据必要进行推理’的智能策略，在保持高准确率的同时，大幅提升了处理效率，减少了不必要的复杂推理步骤。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.08462

1️⃣ 一句话总结

arXiv ID: 2603.07915

1️⃣ 一句话总结

arXiv ID: 2602.09953

1️⃣ 一句话总结

arXiv ID: 2602.08354

1️⃣ 一句话总结

arXiv ID: 2602.03249

1️⃣ 一句话总结

arXiv ID: 2602.03814

1️⃣ 一句话总结

arXiv ID: 2602.01982

1️⃣ 一句话总结

arXiv ID: 2601.14750

1️⃣ 一句话总结

arXiv ID: 2601.05110

1️⃣ 一句话总结

arXiv ID: 2601.05175

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.08462 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.07915 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.09953 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08354 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03249 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03814 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.01982 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.14750 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.05110 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.05175 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.08462

arXiv ID: 2603.07915

arXiv ID: 2602.09953

arXiv ID: 2602.08354

arXiv ID: 2602.03249

arXiv ID: 2602.03814

arXiv ID: 2602.01982

arXiv ID: 2601.14750

arXiv ID: 2601.05110

arXiv ID: 2601.05175