arXiv最新AI论文速览速学

🔍

llm ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 149 72小时内新更新论文 72h更新 315 最新: Open-Source Reproduction and Explainability Analysis of Corrective Retrieval Augmented Generation 03-18

arXiv ID: 2511.21631

arXiv 提交日期: 2025-11-26

multi-modal llm model evaluation vision-language model long-context mixture-of-experts benchmark video understanding

Qwen3-VL技术报告 / Qwen3-VL Technical Report

1️⃣ 一句话总结

这篇论文介绍了通义千问系列目前最强的多模态大模型Qwen3-VL，它在文本理解、长上下文处理以及图像视频推理方面都表现卓越，并提供了从轻量到超大规模的不同版本，旨在成为现实应用中多模态智能的核心引擎。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.21395

arXiv 提交日期: 2025-11-26

multi-modal model training llm visual reasoning latent space reinforcement learning multimodal llms knowledge distillation

Monet：超越图像和语言的潜在视觉空间推理 / Monet: Reasoning in Latent Visual Space Beyond Images and Language

1️⃣ 一句话总结

这篇论文提出了一个名为Monet的训练框架，通过让多模态大语言模型直接在潜在视觉空间中生成连续的视觉思维嵌入来进行推理，并针对训练挑战设计了专门的优化方法，显著提升了模型在真实世界感知和抽象视觉推理任务上的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.20639

arXiv 提交日期: 2025-11-25

multi-agents llm systems latent collaboration multi-agent systems hidden embeddings latent working memory efficiency optimization

多智能体系统中的潜在协作 / Latent Collaboration in Multi-Agent Systems

1️⃣ 一句话总结

这篇论文提出了一个名为LatentMAS的无训练框架，让多个AI智能体直接在内部表示空间中进行协作，相比传统基于文本交互的方法，不仅显著提升了推理准确率和效率，还大幅降低了计算和通信开销。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.20626

arXiv 提交日期: 2025-11-25

model training machine learning llm optimization algorithms training stability orthogonalization robust optimization gradient descent

ROOT：一种用于神经网络训练的鲁棒正交化优化器 / ROOT: Robust Orthogonalized Optimizer for Neural Network Training

1️⃣ 一句话总结

这篇论文提出了一种名为ROOT的新型优化器，它通过自适应正交化和抗噪机制，有效解决了大模型训练中的不稳定问题，在噪声环境下比现有优化器收敛更快、性能更好。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.20494

arXiv 提交日期: 2025-11-25

multi-modal llm model evaluation adversarial attack multimodal llms security model disruption transferability

对抗性混淆攻击：扰乱多模态大语言模型 / Adversarial Confusion Attack: Disrupting Multimodal Large Language Models

1️⃣ 一句话总结

这篇论文提出了一种名为‘对抗性混淆攻击’的新威胁方法，它通过向图像中添加微小的、人眼难以察觉的干扰，就能让多模态大语言模型（如GPT-5.1）产生混乱或自信的错误回答，从而破坏AI代理的可靠运行。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.20347

arXiv 提交日期: 2025-11-25

llm reinforcement learning model training policy optimization training stability mixture-of-experts mathematical reasoning adaptive clipping

软自适应策略优化 / Soft Adaptive Policy Optimization

1️⃣ 一句话总结

这项研究提出了一种名为SAPO的新方法，通过智能调节学习信号来提升大语言模型训练的稳定性和效率，相比现有技术能更灵活地平衡学习效果与稳定性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.20344

arXiv 提交日期: 2025-11-25

llm natural language processing theory analogical reasoning relational concepts representation analysis cognitive comparison model capabilities

类比推理的奇特案例：探究大语言模型中的类比推理能力 / The Curious Case of Analogies: Investigating Analogical Reasoning in Large Language Models

1️⃣ 一句话总结

这篇论文研究发现，大语言模型虽然能在一定程度上编码和运用高级关系概念进行类比推理，但其能力仍有限，尤其在将已知关系应用到新情境时存在困难，这与人类的认知方式既有相似之处也存在明显差距。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.20233

arXiv 提交日期: 2025-11-25

llm natural language processing model evaluation fact-checking explainable ai model steering internal knowledge self-refinement

REFLEX：通过将真实性解构为风格与实质，实现自我优化的可解释事实核查 / REFLEX: Self-Refining Explainable Fact-Checking via Disentangling Truth into Style and Substance

1️⃣ 一句话总结

本文提出了一种名为REFLEX的新型事实核查方法，它通过将‘真实性’分解为表达风格和事实实质，并利用大模型内部知识进行自我优化，从而在无需大量依赖外部知识库的情况下，实现了更准确、可解释且高效的事实核查。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2511.20102

arXiv 提交日期: 2025-11-25

llm model training machine learning sparse attention long-context processing training framework gradient alignment attention optimization

SSA：通过特征空间中对齐完整与稀疏注意力输出的稀疏稀疏注意力 / SSA: Sparse Sparse Attention by Aligning Full and Sparse Attention Outputs in Feature Space

1️⃣ 一句话总结

这篇论文提出了一种名为SSA的新型训练框架，通过让稀疏注意力在每一层都与完整注意力的输出对齐，既保持了梯度更新到所有词元，又显著提升了模型在稀疏计算下的性能，同时支持灵活的计算与性能权衡。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2512.07843

arXiv 提交日期: 2025-11-24

llm model training model evaluation parallel reasoning inference efficiency chain-of-thought reinforcement learning mathematical reasoning

ThreadWeaver：面向语言模型高效并行推理的自适应线程技术 / ThreadWeaver: Adaptive Threading for Efficient Parallel Reasoning in Language Models

1️⃣ 一句话总结

这篇论文提出了一种名为ThreadWeaver的新方法，它能让大语言模型在解决复杂问题时像多线程处理任务一样并行思考，从而在保持与顶尖顺序推理模型相同准确率的同时，显著提升了推理速度，且无需修改现有推理引擎。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2511.21631

1️⃣ 一句话总结

arXiv ID: 2511.21395

1️⃣ 一句话总结

arXiv ID: 2511.20639

1️⃣ 一句话总结

arXiv ID: 2511.20626

1️⃣ 一句话总结

arXiv ID: 2511.20494

1️⃣ 一句话总结

arXiv ID: 2511.20347

1️⃣ 一句话总结

arXiv ID: 2511.20344

1️⃣ 一句话总结

arXiv ID: 2511.20233

1️⃣ 一句话总结

arXiv ID: 2511.20102

1️⃣ 一句话总结

arXiv ID: 2512.07843

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2511.21631 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.21395 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.20639 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.20626 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.20494 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.20347 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.20344 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.20233 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2511.20102 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2512.07843 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2511.21631

arXiv ID: 2511.21395

arXiv ID: 2511.20639

arXiv ID: 2511.20626

arXiv ID: 2511.20494

arXiv ID: 2511.20347

arXiv ID: 2511.20344

arXiv ID: 2511.20233

arXiv ID: 2511.20102

arXiv ID: 2512.07843