arXiv最新AI论文速览速学

🔍

标签: #attention heads ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 50 最新: Explaining Attention with Program Synthesis 06-18

arXiv ID: 2606.19317

arXiv 提交日期: 2026-06-17

llm machine learning interpretability attention heads program synthesis mechanistic interpretability reverse engineering

用程序合成来解释注意力机制 / Explaining Attention with Program Synthesis

1️⃣ 一句话总结

本文提出了一种通过自动生成简单Python程序来模拟和替代Transformer模型中注意力头行为的方法，使得我们既能用人类可读的代码理解模型内部运作，又能在替换大量注意力头后几乎不损害模型性能，从而实现神经网络的可解释性突破。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.14602

arXiv 提交日期: 2026-04-16

llm model training model evaluation toxicity mitigation causal intervention attention heads inference-time intervention benchmark

CausalDetox：用于语言模型脱毒处理的因果头选择与干预 / CausalDetox: Causal Head Selection and Intervention for Language Model Detoxification

1️⃣ 一句话总结

这篇论文提出了一个名为CausalDetox的框架，它通过因果分析精准定位并干预大语言模型中导致有害内容生成的关键注意力头，从而在有效降低模型毒性的同时，保持生成文本的流畅性，并显著提升了处理效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.04613

arXiv 提交日期: 2026-02-04

llm natural language processing model evaluation mechanistic interpretability machine translation attention heads steering vectors sentence equivalence

从大语言模型的机器翻译中分离语言与意义 / Disentangling meaning from language in LLM-based machine translation

1️⃣ 一句话总结

这篇论文通过分析大语言模型内部的注意力机制，发现翻译任务被分解为‘生成目标语言文本’和‘保留原句意义’两个独立的子任务，并分别由不同的注意力头负责，通过微调极少数相关头部就能实现高质量的指令无关翻译。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.02989

arXiv 提交日期: 2026-01-06

llm theory model evaluation mechanistic interpretability counting tasks system-2 reasoning causal mediation analysis attention heads

通过系统二策略实现大语言模型大规模计数任务的机制可解释性 / Mechanistic Interpretability of Large-Scale Counting in LLMs through a System-2 Strategy

1️⃣ 一句话总结

这篇论文提出了一种模仿人类深度思考（系统二）的简单方法，通过将大语言模型不擅长的大规模计数任务拆解成多个小任务分别解决再汇总，从而突破了模型自身的结构限制，显著提升了计数准确率，并揭示了其内部工作机制。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.08525

arXiv 提交日期: 2025-10-09

llm model training systems kv cache compression reinforcement learning attention heads reasoning models efficient inference

哪些注意力头对推理至关重要？基于强化学习的KV缓存压缩方法 / Which Heads Matter for Reasoning? RL-Guided KV Cache Compression

1️⃣ 一句话总结

这项研究提出了一种基于强化学习的新方法，能够自动识别并保护大语言模型中少数对复杂推理至关重要的注意力头，同时对其他头进行高效压缩，实现在减少20-50%内存占用的同时保持近乎无损的推理性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.19317

1️⃣ 一句话总结

arXiv ID: 2604.14602

1️⃣ 一句话总结

arXiv ID: 2602.04613

1️⃣ 一句话总结

arXiv ID: 2601.02989

1️⃣ 一句话总结

arXiv ID: 2510.08525

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.19317 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.14602 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.04613 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.02989 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.08525 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.19317

arXiv ID: 2604.14602

arXiv ID: 2602.04613

arXiv ID: 2601.02989

arXiv ID: 2510.08525