arXiv最新AI论文速览速学

🔍

标签: #kv cache compression ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 95 72小时内新更新论文 72h更新 100 最新: Accordion-Thinking: Self-Regulated Step Summaries for Efficient and Readable LLM Reasoning 02-04

arXiv ID: 2602.03249

arXiv 提交日期: 2026-02-03

llm model training systems reasoning efficiency kv cache compression reinforcement learning dynamic summarization chain-of-thought

手风琴式思考：通过自调节步骤摘要实现高效可读的大语言模型推理 / Accordion-Thinking: Self-Regulated Step Summaries for Efficient and Readable LLM Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为‘手风琴式思考’的新方法，让大语言模型学会在推理过程中自动总结并压缩中间思考步骤，从而在不降低解题准确性的前提下，大幅提升推理效率并降低内存消耗，同时生成的摘要也使推理过程对人类更易读。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03184

arXiv 提交日期: 2026-02-03

llm systems model training kv cache compression long-context inference memory efficiency semantic splitting efficient transformers

DynSplit-KV：用于高效长上下文大语言模型推理中键值缓存压缩的动态语义分割方法 / DynSplit-KV: Dynamic Semantic Splitting for KVCache Compression in Efficient Long-Context LLM Inference

1️⃣ 一句话总结

这篇论文提出了一种名为DynSplit-KV的新方法，它通过动态识别文本中的语义边界来智能分割和压缩大语言模型推理过程中的键值缓存，从而在长文本处理场景下，显著提升了处理速度、降低了内存占用，同时保持了模型的准确性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.21686

arXiv 提交日期: 2026-01-29

llm model training systems kv cache compression low-rank approximation stiefel manifold orthonormal projection decoder-layer reconstruction

别那么“死板”！在Stiefel流形上学习KV缓存的低秩近似 / Don't be so Stief! Learning KV Cache low-rank approximation over the Stiefel manifold

1️⃣ 一句话总结

这篇论文提出了一种名为StiefAttention的新方法，通过直接在正交投影空间中学习并最小化解码器输出误差，来更有效地压缩大语言模型推理时的KV缓存，从而在相同压缩率下显著提升模型性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.08525

arXiv 提交日期: 2025-10-09

llm model training systems kv cache compression reinforcement learning attention heads reasoning models efficient inference

哪些注意力头对推理至关重要？基于强化学习的KV缓存压缩方法 / Which Heads Matter for Reasoning? RL-Guided KV Cache Compression

1️⃣ 一句话总结

这项研究提出了一种基于强化学习的新方法，能够自动识别并保护大语言模型中少数对复杂推理至关重要的注意力头，同时对其他头进行高效压缩，实现在减少20-50%内存占用的同时保持近乎无损的推理性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.03249

1️⃣ 一句话总结

arXiv ID: 2602.03184

1️⃣ 一句话总结

arXiv ID: 2601.21686

1️⃣ 一句话总结

arXiv ID: 2510.08525

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.03249 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03184 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.21686 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.08525 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.03249

arXiv ID: 2602.03184

arXiv ID: 2601.21686

arXiv ID: 2510.08525