arXiv最新AI论文速览速学

🔍

标签: #efficient attention ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: ViT-AdaLA: Adapting Vision Transformers with Linear Attention 03-18

arXiv ID: 2603.16063

arXiv 提交日期: 2026-03-17

computer vision model training machine learning vision transformers linear attention knowledge transfer model adaptation efficient attention

ViT-AdaLA：使用线性注意力适配视觉Transformer / ViT-AdaLA: Adapting Vision Transformers with Linear Attention

1️⃣ 一句话总结

这篇论文提出了一种名为ViT-AdaLA的新方法，它通过注意力对齐、特征对齐和微调三个步骤，高效地将现有高性能视觉大模型的知识迁移到计算效率更高的线性注意力模型中，从而在保持强大性能的同时显著降低了计算成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.00812

arXiv 提交日期: 2026-02-28

natural language processing model training theory sequence modeling efficient attention hierarchical architecture binary tree linear complexity

波吸引子树：一种用于高效序列建模的分层二叉树归约架构 / Wave-Attractor-Tree: A Hierarchical Binary Tree Reduction Architecture for Efficient Sequence Modeling

1️⃣ 一句话总结

这篇论文提出了一种名为“波吸引子树”的新模型架构，它用分层的二叉树结构代替了传统Transformer的自注意力机制，通过递归合并操作，在保持高性能的同时，显著降低了计算复杂度和内存消耗，特别擅长处理需要理解层次化结构的复杂序列数据。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.18890

arXiv 提交日期: 2025-11-24

llm model training systems small language models latency optimization model architecture efficient attention evolutionary search

Nemotron-Flash：迈向延迟最优的混合小型语言模型 / Nemotron-Flash: Towards Latency-Optimal Hybrid Small Language Models

1️⃣ 一句话总结

这篇论文提出了一种名为Nemotron-Flash的新型混合小型语言模型，它通过优化模型深度与宽度的比例、选择高效的运算模块以及改进训练方法，在保证精度的同时，显著降低了模型在实际设备上的运行延迟并提高了处理速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.16063

1️⃣ 一句话总结

arXiv ID: 2603.00812

1️⃣ 一句话总结

arXiv ID: 2511.18890

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.16063 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.00812 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.18890 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.16063

arXiv ID: 2603.00812

arXiv ID: 2511.18890