arXiv最新AI论文速览速学

🔍

标签: #latent reasoning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 98 72小时内新更新论文 72h更新 100 最新: VideoLatent: Video-Language Learning via Latent Self-Forcing 06-23

arXiv ID: 2606.22870

arXiv 提交日期: 2026-06-22

multi-modal llm model training video understanding latent reasoning multimodal llm efficiency chain-of-thought

VideoLatent：通过潜在自强制学习视频语言 / VideoLatent: Video-Language Learning via Latent Self-Forcing

1️⃣ 一句话总结

为了高效且低成本地提升多模态大模型对视频的理解与推理能力，本文提出了一种名为VideoLatent的新方法，它让模型在内部自动进行“潜在推理”，仅需视频、问题和答案这类简单数据即可训练，不仅性能全面超越现有模型，还将训练和推理的计算开销分别降低至原来的六分之一和六十八分之一。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.06447

arXiv 提交日期: 2026-06-04

llm model training latent reasoning normalizing flows chain-of-thought tractable likelihood code generation

基于归一化流的潜在推理方法 / Latent Reasoning with Normalizing Flows

1️⃣ 一句话总结

本文提出NF-CoT框架，通过在大语言模型中嵌入归一化流模型，将链式思维推理过程转化为连续、高效的潜在思维状态，在保持传统自回归生成优势（如从左到右解码、概率采样、键值缓存兼容等）的同时，显著提升代码生成任务的通过率并降低中间推理成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.25745

arXiv 提交日期: 2026-05-25

llm model training model evaluation chain-of-thought latent reasoning compression reinforcement learning efficiency

选择性潜在思考：语言模型推理链的自适应压缩 / Selective Latent Thinking: Adaptive Compression of LLM Reasoning Chains

1️⃣ 一句话总结

这篇论文提出了一种名为“选择性潜在思考”的方法，让大语言模型在推理时自动判断哪些步骤可以压缩成更高效的“思维潜影”，哪些步骤必须保留为完整文字推理，从而在几乎不牺牲准确率的前提下，大幅缩短推理链条的长度、降低计算成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.15198

arXiv 提交日期: 2026-05-14

multi-modal visual reasoning model training functional token latent reasoning agentic reasoning reinforcement learning visual reasoning benchmark

ATLAS：代理型还是潜在视觉推理？一个词足矣 / ATLAS: Agentic or Latent Visual Reasoning? One Word is Enough for Both

1️⃣ 一句话总结

本文提出ATLAS框架，通过引入一种称为“功能词”的特殊离散词元，将代理型推理（通过代码或工具调用）与潜在推理（通过隐式嵌入）的优势结合，无需生成中间图像或修改模型结构，从而高效、可解释地完成复杂视觉推理任务，并配合一种稳定强化学习训练的新方法LA-GRPO，在多个基准测试中取得了领先性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.06285

arXiv 提交日期: 2026-05-07

llm retrieval natural language processing retrieval augmented generation latent reasoning inference latency dense retrieval end-to-end optimization

基于潜在推理与检索的高效智能体RAG框架 / LatentRAG: Latent Reasoning and Retrieval for Efficient Agentic RAG

1️⃣ 一句话总结

LatentRAG提出一种新方法，让AI模型在内部‘潜在空间’中完成思考和搜索，而不是逐字生成文字，从而在保持回答质量的同时将推理速度提升近10倍，解决了传统智能体RAG系统响应慢的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.17892

arXiv 提交日期: 2026-04-20

llm reinforcement learning latent reasoning gumbel-softmax policy optimization stochastic sampling gradient estimation

潜在推理策略优化：面向大语言模型的连续空间推理增强方法 / LEPO: Latent Reasoning Policy Optimization for Large Language Models

1️⃣ 一句话总结

本文提出一种名为LEPO的新框架，通过向大语言模型的潜在推理过程中注入可控随机性（利用Gumbel-Softmax技术），使得模型能在连续思维空间中探索多样化的推理路径，并直接应用强化学习优化这些潜在表示，从而显著提升推理性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.08065

arXiv 提交日期: 2026-04-09

multi-modal model training machine learning latent reasoning predictive embeddings visual language models tool-augmented reasoning perception

基于预测嵌入的多模态潜在推理 / Multimodal Latent Reasoning via Predictive Embeddings

1️⃣ 一句话总结

这篇论文提出了一种名为Pearl的新方法，它让视觉语言模型在‘潜在空间’里学习使用外部工具（如裁剪、深度估算）的经验，从而在推理时无需实际调用这些工具就能提升图像理解能力，既高效又减少了错误。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.08299

arXiv 提交日期: 2026-04-09

llm theory model evaluation reasoning chain-of-thought latent reasoning selective activation contrastive regularization

SeLaR：大语言模型中的选择性潜在推理 / SeLaR: Selective Latent Reasoning in Large Language Models

1️⃣ 一句话总结

这篇论文提出了一种名为SeLaR的轻量级方法，通过智能地在大语言模型推理过程中切换使用确定性词和软性概率向量，解决了现有推理方法容易出错或探索不足的问题，从而在多个任务上提升了推理性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15051

arXiv 提交日期: 2026-03-16

llm model training theory latent reasoning adaptive computation efficiency mathematical reasoning chain-of-thought

潜在思考：面向大语言模型隐式推理的自适应锚点优化方法 / Thinking in Latents: Adaptive Anchor Refinement for Implicit Reasoning in LLMs

1️⃣ 一句话总结

这篇论文提出了一种名为AdaAnchor的新方法，它让大语言模型在内部进行‘无声’的迭代思考，通过动态调整思考步骤来高效解决数学应用题，能在保持甚至提升准确率的同时，大幅减少输出文本的长度和计算成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20980

arXiv 提交日期: 2026-02-24

multi-modal model training natural language processing multimodal llms latent reasoning visual semantics attention alignment visual understanding

CrystaL：多模态大语言模型中视觉潜在特征的自发涌现 / CrystaL: Spontaneous Emergence of Visual Latents in MLLMs

1️⃣ 一句话总结

这篇论文提出了一个名为CrystaL的单阶段框架，它通过并行处理完整图像和受损图像并显式对齐其内部注意力与预测，使得多模态大模型能够在无需额外标注的情况下，自发地在推理过程中形成并保留与任务高度相关的关键视觉语义信息，从而显著提升了模型在细粒度视觉理解任务上的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.22870

1️⃣ 一句话总结

arXiv ID: 2606.06447

1️⃣ 一句话总结

arXiv ID: 2605.25745

1️⃣ 一句话总结

arXiv ID: 2605.15198

1️⃣ 一句话总结

arXiv ID: 2605.06285

1️⃣ 一句话总结

arXiv ID: 2604.17892

1️⃣ 一句话总结

arXiv ID: 2604.08065

1️⃣ 一句话总结

arXiv ID: 2604.08299

1️⃣ 一句话总结

arXiv ID: 2603.15051

1️⃣ 一句话总结

arXiv ID: 2602.20980

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.22870 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.06447 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.25745 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.15198 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.06285 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.17892 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.08065 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.08299 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15051 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20980 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.22870

arXiv ID: 2606.06447

arXiv ID: 2605.25745

arXiv ID: 2605.15198

arXiv ID: 2605.06285

arXiv ID: 2604.17892

arXiv ID: 2604.08065

arXiv ID: 2604.08299

arXiv ID: 2603.15051

arXiv ID: 2602.20980