arXiv最新AI论文速览速学

🔍

标签: #sparse attention ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 95 72小时内新更新论文 72h更新 100 最新: Speed3R: Sparse Feed-forward 3D Reconstruction Models 03-10

arXiv ID: 2603.08055

arXiv 提交日期: 2026-03-09

computer vision model training systems 3d reconstruction sparse attention pose estimation efficiency structure-from-motion

Speed3R：稀疏前馈三维重建模型 / Speed3R: Sparse Feed-forward 3D Reconstruction Models

1️⃣ 一句话总结

这篇论文提出了一种名为Speed3R的新模型，它通过模仿传统三维重建中只使用少量关键点来估计相机姿态的思路，设计了一种高效的注意力机制，在保证重建质量基本不变的前提下，将处理大量图像时的计算速度提升了12倍以上。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08426

arXiv 提交日期: 2026-02-09

llm model training systems attention mechanism efficiency positional encoding sparse attention long context

棱镜：一种基于频谱感知的块稀疏注意力机制 / Prism: Spectral-Aware Block-Sparse Attention

1️⃣ 一句话总结

这篇论文提出了一种名为Prism的新方法，它通过分析注意力信号中的频率成分，巧妙地解决了现有块稀疏注意力机制在识别重要信息块时效率低、精度差的问题，从而在不损失模型准确性的前提下，大幅提升了长文本处理的速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08329

arXiv 提交日期: 2026-02-09

llm model training systems kv cache sparse attention long-context inference efficiency pre-hoc sparsity

通过事前稀疏化实现近似最优的KV选择，用于长上下文推理 / Near-Oracle KV Selection via Pre-hoc Sparsity for Long-Context Inference

1️⃣ 一句话总结

这篇论文提出了一种名为‘事前稀疏化’的新方法，它能在大型语言模型推理时，提前筛选出关键信息并丢弃不重要的部分，从而在保证回答准确性的前提下，大幅减少计算量和提升处理速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04361

arXiv 提交日期: 2026-02-04

computer vision model training model evaluation sparse attention autoregressive models inference acceleration visual generation high-resolution images

SparVAR：探索视觉自回归建模中的稀疏性以实现免训练加速 / SparVAR: Exploring Sparsity in Visual AutoRegressive Modeling for Training-Free Acceleration

1️⃣ 一句话总结

这篇论文提出了一种名为SparVAR的免训练加速框架，它通过利用视觉自回归模型注意力机制中的稀疏特性，在不跳过高分辨率细节的情况下，显著提升了高分辨率图像生成的速度，同时保持了图像质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.03216

arXiv 提交日期: 2026-02-03

llm model training systems sparse attention long-context inference efficient inference token selection attention acceleration

令牌稀疏注意力：通过交错令牌选择实现高效的长上下文推理 / Token Sparse Attention: Efficient Long-Context Inference with Interleaved Token Selection

1️⃣ 一句话总结

这篇论文提出了一种名为‘令牌稀疏注意力’的新方法，它通过动态、轻量地筛选出每个注意力头中重要的令牌来压缩计算，从而在保持模型准确率的同时，显著提升了处理超长文本时的推理速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.02873

arXiv 提交日期: 2026-02-02

multi-modal agents model training vision-language reasoning active perception chain-of-thought dynamic querying sparse attention

ViThinker：通过动态感知查询实现主动视觉语言推理 / ViThinker: Active Vision-Language Reasoning via Dynamic Perceptual Querying

1️⃣ 一句话总结

这篇论文提出了一个名为ViThinker的新框架，它让视觉语言模型能像人一样主动‘思考’和‘观察’，在推理过程中根据需要动态生成查询来获取关键视觉信息，从而显著提升了复杂视觉推理任务的准确性和效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.16515

arXiv 提交日期: 2026-01-23

model training video generation aigc sparse attention video diffusion linear attention efficient tuning computational efficiency

SALAD：通过高效的线性注意力微调实现视频扩散Transformer的高稀疏性注意力 / SALAD: Achieve High-Sparsity Attention via Efficient Linear Attention Tuning for Video Diffusion Transformer

1️⃣ 一句话总结

这篇论文提出了一种名为SALAD的新方法，通过在视频生成模型中巧妙地结合稀疏注意力和一个轻量级的线性注意力分支，并用一个智能门控机制来动态平衡两者，从而在几乎不损失生成质量的前提下，大幅提升了模型的计算效率，实现了90%的注意力稀疏度和1.72倍的推理加速，而且所需的训练数据和计算量非常少。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.16615

arXiv 提交日期: 2025-12-18

model training computer vision multi-modal sparse attention diffusion transformers efficient training long sequences hierarchical selection

用于高效扩散变换器的可训练对数线性稀疏注意力机制 / Trainable Log-linear Sparse Attention for Efficient Diffusion Transformers

1️⃣ 一句话总结

这篇论文提出了一种名为LLSA的新型可训练稀疏注意力机制，它通过分层结构将计算复杂度从平方级降低到对数线性级，从而在保持图像生成质量的同时，大幅提升了扩散变换器在处理长序列时的训练和推理效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.14008

arXiv 提交日期: 2025-12-16

model training multi-modal natural language processing masked discrete diffusion multimodal generation inference acceleration sparse attention text-to-image

稀疏LaViDa：稀疏多模态离散扩散语言模型 / Sparse-LaViDa: Sparse Multimodal Discrete Diffusion Language Models

1️⃣ 一句话总结

这篇论文提出了一种名为Sparse-LaViDa的新方法，它通过动态移除扩散模型推理过程中不必要的计算，将图像生成和编辑等任务的速度提升了一倍，同时保持了生成质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.08829

arXiv 提交日期: 2025-12-09

multi-modal model training systems vision-language models linear attention sparse attention efficient inference long-context processing

InfiniteVL：融合线性与稀疏注意力，实现高效、无限输入的视觉语言模型 / InfiniteVL: Synergizing Linear and Sparse Attention for Highly-Efficient, Unlimited-Input Vision-Language Models

1️⃣ 一句话总结

这篇论文提出了一种名为InfiniteVL的新型视觉语言模型架构，它巧妙结合了两种注意力机制，在保持高性能的同时，将计算复杂度从平方级降为线性级，从而实现了对超长图像或视频内容的高效、实时理解，且训练数据需求极低。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.08055

1️⃣ 一句话总结

arXiv ID: 2602.08426

1️⃣ 一句话总结

arXiv ID: 2602.08329

1️⃣ 一句话总结

arXiv ID: 2602.04361

1️⃣ 一句话总结

arXiv ID: 2602.03216

1️⃣ 一句话总结

arXiv ID: 2602.02873

1️⃣ 一句话总结

arXiv ID: 2601.16515

1️⃣ 一句话总结

arXiv ID: 2512.16615

1️⃣ 一句话总结

arXiv ID: 2512.14008

1️⃣ 一句话总结

arXiv ID: 2512.08829

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.08055 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08426 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08329 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04361 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.03216 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.02873 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.16515 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.16615 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.14008 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.08829 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.08055

arXiv ID: 2602.08426

arXiv ID: 2602.08329

arXiv ID: 2602.04361

arXiv ID: 2602.03216

arXiv ID: 2602.02873

arXiv ID: 2601.16515

arXiv ID: 2512.16615

arXiv ID: 2512.14008

arXiv ID: 2512.08829