arXiv最新AI论文速览速学

🔍

标签: #attention analysis ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: Reasoning Fails Where Step Flow Breaks 04-09

arXiv ID: 2604.06695

arXiv 提交日期: 2026-04-08

llm model evaluation theory reasoning models attention analysis information flow test-time intervention chain-of-thought

推理失败之处，步骤流中断之所 / Reasoning Fails Where Step Flow Breaks

1️⃣ 一句话总结

这篇论文发现大型推理模型在长链思考中会出现信息流中断问题，并提出了一种无需重新训练就能修复这些问题、提升模型在数学和科学任务上表现的新方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.01989

arXiv 提交日期: 2026-04-02

multi-modal model evaluation natural language processing visual attention hallucination mitigation multimodal llms cognitive inference attention analysis

静止的注意力保持静止：打破视觉惯性以缓解认知幻觉 / Attention at Rest Stays at Rest: Breaking Visual Inertia for Cognitive Hallucination Mitigation

1️⃣ 一句话总结

这篇论文发现多模态大语言模型中的视觉注意力存在‘惯性’问题，即注意力一旦在解码初期固定就难以动态转移，导致模型难以进行物体间关系推理而产生‘认知幻觉’，并提出了一种无需训练的方法来打破这种惯性，有效缓解了此类幻觉。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.17958

arXiv 提交日期: 2026-01-25

theory model evaluation natural language processing transformer interpretability attention analysis linear representation model understanding high-order tensors

TensorLens：通过高阶注意力张量进行端到端的Transformer分析 / TensorLens: End-to-End Transformer Analysis via High-Order Attention Tensors

1️⃣ 一句话总结

这篇论文提出了一个名为TensorLens的新方法，它用一个统一的高阶注意力张量来完整表示整个Transformer模型的计算过程，为模型可解释性研究提供了更强大的分析基础。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.14127

arXiv 提交日期: 2026-01-20

multi-modal model evaluation llm safety evaluation multimodal reasoning benchmark attention analysis risk assessment

聪明的副作用：多模态大语言模型在多图推理中的安全风险 / The Side Effects of Being Smart: Safety Risks in MLLMs' Multi-Image Reasoning

1️⃣ 一句话总结

这篇论文发现，随着多模态大语言模型处理多图推理的能力越强，它们反而更容易产生安全漏洞，因为模型可能过度专注于解题而忽视了安全约束。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.06431

arXiv 提交日期: 2026-01-10

llm agents reinforcement learning instruction following logic-structured training reward design attention analysis structured constraints

LSRIF：用于指令遵循的逻辑结构化强化学习 / LSRIF: Logic-Structured Reinforcement Learning for Instruction Following

1️⃣ 一句话总结

这篇论文提出了一种名为LSRIF的新训练框架，它通过显式地建模指令中的逻辑结构（如顺序、条件和并行关系），并设计对应的结构化奖励方法，显著提升了大语言模型遵循复杂指令和进行逻辑推理的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2510.13251

arXiv 提交日期: 2025-10-15

natural language processing computer vision model evaluation video large language models mechanistic interpretability information flow temporal reasoning attention analysis

绘制信息流：揭示视频大语言模型中隐藏的信息传递路径 / Map the Flow: Revealing Hidden Pathways of Information in VideoLLMs

1️⃣ 一句话总结

这项研究通过分析视频大语言模型内部工作机制，揭示了其进行时间推理时遵循的固定信息流动模式，并发现模型在保留核心性能的同时可以大幅简化注意力连接。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.06695

1️⃣ 一句话总结

arXiv ID: 2604.01989

1️⃣ 一句话总结

arXiv ID: 2601.17958

1️⃣ 一句话总结

arXiv ID: 2601.14127

1️⃣ 一句话总结

arXiv ID: 2601.06431

1️⃣ 一句话总结

arXiv ID: 2510.13251

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.06695 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.01989 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.17958 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.14127 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.06431 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2510.13251 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.06695

arXiv ID: 2604.01989

arXiv ID: 2601.17958

arXiv ID: 2601.14127

arXiv ID: 2601.06431

arXiv ID: 2510.13251