arXiv最新AI论文速览速学

🔍

标签: #long-context ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: ATLAS: All-round Testing of Long-context Abilities across Scales 05-28

arXiv ID: 2601.11044

arXiv 提交日期: 2026-01-16

agents benchmark llm autonomous agents agent evaluation tool usage long-context automated assessment

AgencyBench：在百万令牌真实世界场景中评测自主智能体的前沿能力 / AgencyBench: Benchmarking the Frontiers of Autonomous Agents in 1M-Token Real-World Contexts

1️⃣ 一句话总结

这篇论文提出了一个名为AgencyBench的新基准测试，它通过模拟真实、复杂且耗时的任务，自动评估不同AI智能体的综合能力，发现闭源模型整体表现优于开源模型，并揭示了智能体性能与其运行框架紧密相关。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.11516

arXiv 提交日期: 2026-01-16

llm model evaluation systems activation probes misuse mitigation distribution shift long-context ai safety

为Gemini构建生产就绪的探针 / Building Production-Ready Probes For Gemini

1️⃣ 一句话总结

这篇论文提出并测试了几种新型神经网络探针架构，以解决现有探针在长上下文等生产环境分布变化下泛化能力不足的问题，成功将其应用于谷歌前沿大模型Gemini中，以低成本高效地防范模型滥用。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.24601

arXiv 提交日期: 2025-12-31

llm systems model evaluation long-context inference-time scaling recursive models prompt processing context window

递归语言模型 / Recursive Language Models

1️⃣ 一句话总结

这篇论文提出了一种名为‘递归语言模型’的新方法，它能让大语言模型像编程一样，通过自我调用和分解的方式，高效处理远超其本身能力范围的超长文本，从而大幅提升长文本任务的处理效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.20856

arXiv 提交日期: 2025-12-24

llm model training agents mixture-of-experts mamba-transformer long-context reinforcement learning tool use

NVIDIA Nemotron 3：高效且开放的智能模型 / NVIDIA Nemotron 3: Efficient and Open Intelligence

1️⃣ 一句话总结

NVIDIA发布了Nemotron 3系列模型，包含Nano、Super和Ultra三个版本，它们采用创新的混合架构，在保持高效推理和超长上下文处理能力的同时，提供了强大的智能体协作、推理和对话功能，并且该系列模型将开源其权重和训练方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.12602

arXiv 提交日期: 2025-12-14

natural language processing model training theory linear attention state space models continuous-time dynamics long-context numerical stability

无误差线性注意力是免费午餐：来自连续时间动力学的精确解 / Error-Free Linear Attention is a Free Lunch: Exact Solution from Continuous-Time Dynamics

1️⃣ 一句话总结

这篇论文提出了一种名为EFLA的新型线性注意力机制，它通过将在线学习过程建模为连续时间动态系统，并巧妙地利用其矩阵结构，首次实现了在保持线性计算复杂度的同时，获得了完全精确、无误差积累的解，从而在理论上和实验上都显著提升了长文本建模的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.10411

arXiv 提交日期: 2025-12-11

llm model training model evaluation attention mechanism efficient inference long-context fine-tuning computational complexity

滑动窗口注意力适应 / Sliding Window Attention Adaptation

1️⃣ 一句话总结

这篇论文提出了一套名为SWAA的实用方法，通过组合五种策略，成功地将原本使用全注意力的预训练大语言模型高效地适应到计算成本更低的滑动窗口注意力机制上，从而在保持长文本处理性能的同时显著降低了推理成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.07805

arXiv 提交日期: 2025-12-08

natural language processing model training theory positional encoding group theory long-context attention transformer

群表示位置编码 / Group Representational Position Encoding

1️⃣ 一句话总结

这篇论文提出了一个名为GRAPE的统一框架，它利用数学中的群作用理论，将RoPE和ALiBi等主流位置编码方法都纳入其中，为设计长文本模型中的位置信息表示提供了一个更通用、更灵活的理论基础。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.07525

arXiv 提交日期: 2025-12-08

llm model training theory positional encoding long-context attention mechanism rotary position embeddings complex-valued representation

超越实数：面向长上下文大语言模型的旋转位置编码虚部扩展 / Beyond Real: Imaginary Extension of Rotary Position Embeddings for Long-Context LLMs

1️⃣ 一句话总结

这篇论文提出了一种改进的旋转位置编码方法，通过重新利用之前被丢弃的虚部信息来增强大语言模型对长文本的理解能力，实验证明该方法能有效提升长上下文任务的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.03704

arXiv 提交日期: 2025-12-03

llm agents natural language processing dialogue systems state tracking alignment long-context attention mechanisms

DZ-TDPO：用于长对话中可变状态追踪的非破坏性时间对齐方法 / DZ-TDPO: Non-Destructive Temporal Alignment for Mutable State Tracking in Long-Context Dialogue

1️⃣ 一句话总结

这篇论文提出了一种名为DZ-TDPO的新方法，它通过智能调整模型对过去对话的关注方式，让AI助手在长对话中能更灵活地跟踪用户意图的变化，而不会破坏模型原有的通用能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.21631

arXiv 提交日期: 2025-11-26

multi-modal llm model evaluation vision-language model long-context mixture-of-experts benchmark video understanding

Qwen3-VL技术报告 / Qwen3-VL Technical Report

1️⃣ 一句话总结

这篇论文介绍了通义千问系列目前最强的多模态大模型Qwen3-VL，它在文本理解、长上下文处理以及图像视频推理方面都表现卓越，并提供了从轻量到超大规模的不同版本，旨在成为现实应用中多模态智能的核心引擎。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2601.11044

1️⃣ 一句话总结

arXiv ID: 2601.11516

1️⃣ 一句话总结

arXiv ID: 2512.24601

1️⃣ 一句话总结

arXiv ID: 2512.20856

1️⃣ 一句话总结

arXiv ID: 2512.12602

1️⃣ 一句话总结

arXiv ID: 2512.10411

1️⃣ 一句话总结

arXiv ID: 2512.07805

1️⃣ 一句话总结

arXiv ID: 2512.07525

1️⃣ 一句话总结

arXiv ID: 2512.03704

1️⃣ 一句话总结

arXiv ID: 2511.21631

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2601.11044 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.11516 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.24601 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.20856 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.12602 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.10411 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.07805 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.07525 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.03704 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.21631 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2601.11044

arXiv ID: 2601.11516

arXiv ID: 2512.24601

arXiv ID: 2512.20856

arXiv ID: 2512.12602

arXiv ID: 2512.10411

arXiv ID: 2512.07805

arXiv ID: 2512.07525

arXiv ID: 2512.03704

arXiv ID: 2511.21631