arXiv最新AI论文速览速学

🔍

标签: #chain-of-thought ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: VideoLatent: Video-Language Learning via Latent Self-Forcing 06-23

arXiv ID: 2606.22870

arXiv 提交日期: 2026-06-22

multi-modal llm model training video understanding latent reasoning multimodal llm efficiency chain-of-thought

VideoLatent：通过潜在自强制学习视频语言 / VideoLatent: Video-Language Learning via Latent Self-Forcing

1️⃣ 一句话总结

为了高效且低成本地提升多模态大模型对视频的理解与推理能力，本文提出了一种名为VideoLatent的新方法，它让模型在内部自动进行“潜在推理”，仅需视频、问题和答案这类简单数据即可训练，不仅性能全面超越现有模型，还将训练和推理的计算开销分别降低至原来的六分之一和六十八分之一。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.15576

arXiv 提交日期: 2026-06-14

llm reinforcement learning model training credit assignment self-distillation reasoning chain-of-thought verifiable reward

在分叉点定位信用：基于路径条件的自蒸馏方法提升大语言模型推理能力 / Localizing Credit at the Divergence: Path-Conditioned Self-Distillation for LLM Reasoning

1️⃣ 一句话总结

本文提出了一种名为“回溯自蒸馏”的新方法，通过让模型在训练过程中参考同一批中成功的推理路径，而不是仅仅依赖最终答案，从而更精准地识别并强化推理链条中导致成功的关键决策点，显著提升了数学和代码推理任务的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.15441

arXiv 提交日期: 2026-06-13

llm agents security prompt injection defense chain-of-thought reinforcement learning adversarial attack

基于推理的任务对齐：对抗自适应提示注入攻击的防御方法 / Defending against Adaptive Prompt Injection Attacks via Reasoning-enabled Task Alignment

1️⃣ 一句话总结

本文提出一种名为RETA的训练方法，通过让AI助手在每次执行任务时先进行逻辑推理，判断外来指令是否与用户原始任务一致，从而有效抵御那些经过专门优化的复杂注入攻击，将攻击成功率控制在10%以下，同时保持较好的任务性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.06447

arXiv 提交日期: 2026-06-04

llm model training latent reasoning normalizing flows chain-of-thought tractable likelihood code generation

基于归一化流的潜在推理方法 / Latent Reasoning with Normalizing Flows

1️⃣ 一句话总结

本文提出NF-CoT框架，通过在大语言模型中嵌入归一化流模型，将链式思维推理过程转化为连续、高效的潜在思维状态，在保持传统自回归生成优势（如从左到右解码、概率采样、键值缓存兼容等）的同时，显著提升代码生成任务的通过率并降低中间推理成本。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.02994

arXiv 提交日期: 2026-06-02

llm agents reasoning primitives react agents pseudo-tools trace mining chain-of-thought

从智能体轨迹中归纳推理原语 / Inducing Reasoning Primitives from Agent Traces

1️⃣ 一句话总结

该论文提出一种新方法，通过分析AI智能体（如ReAct模式）在解决问题时留下的操作记录，自动提取出高频、可复用的推理步骤，并将其转化为一套简洁的“伪工具”库，从而让AI在后续任务中更稳定地调用这些推理套路，显著提升了在逻辑推理、规则应用和规划等复杂任务上的准确率，甚至超越了人工设计的专家方案。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.03217

arXiv 提交日期: 2026-06-02

llm theory chain-of-thought in-context learning generalization phase transition linear regression

上下文学习中思维链的渐近理论 / An Asymptotic Theory of Chain-of-Thought in In-Context Learning

1️⃣ 一句话总结

本文通过一个可理论求解的线性回归模型，利用高维随机矩阵工具，推导出思维链推理深度影响泛化误差的精确公式，发现了推理效果从指数提升到饱和甚至下降的相变规律，并揭示了深层推理只有在预训练数据充分且上下文信息丰富时才有效的条件。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.31483

arXiv 提交日期: 2026-05-29

llm multimodal model evaluation hallucination evaluation bengali benchmark low-resource language chain-of-thought

BenHalluEval：面向孟加拉语大语言模型的多任务幻觉评估框架 / BenHalluEval: A Multi-Task Hallucination Evaluation Framework for Large Language Models on Bengali

1️⃣ 一句话总结

本文提出了首个专门针对孟加拉语的幻觉评估框架BenHalluEval，通过构建包含12000个幻觉样本的基准测试和双轨校准指标BenHalluScore，系统评估了7种主流大语言模型在四项任务中的幻觉表现，发现单轨评估和仅依赖思维链提示的方法在低资源语言环境下效果不佳。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28913

arXiv 提交日期: 2026-05-27

llm natural language processing model evaluation chain-of-thought reasoning transfer cross-model analysis prefix trajectories

推理的旅行：剖析思维链如何在模型间传递 / Reasoning that Travels: Dissecting How Chain-of-Thought Transfers Across Models

1️⃣ 一句话总结

这篇论文深入研究了大型推理模型生成的思维链（CoT）文本如何在不同的模型间传递并帮助对方解决问题，发现这种传递效果并非单一机制，而是包含了直接答案提取、推理引导和接收模型自身能力影响等多种不同的作用方式。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.27824

arXiv 提交日期: 2026-05-27

llm natural language processing chain-of-thought reasoning mechanisms attention head analysis causal mediation logical reasoning

揭示逻辑推理中的算法推演回路 / Revealing Algorithmic Deductive Circuits for Logical Reasoning

1️⃣ 一句话总结

本文发现大型语言模型在少数示例下进行逻辑推理时，少数专用注意力头（约占总数的3%）负责提取事实与规则信息，而更高层则协调这些中间步骤以形成整体推理策略，如图遍历算法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28008

arXiv 提交日期: 2026-05-27

llm model training model evaluation chain-of-thought data compression supervised fine-tuning reinforcement learning reasoning

压缩思想：压缩推理数据在大型语言模型后训练中的作用时机与方式 / Zipping the Thought: When and How Compressed Reasoning Data Works in LLM Post-Training

1️⃣ 一句话总结

本文研究了在大型语言模型后训练中，使用压缩推理数据（即缩短思考链）的效果，发现不同类型的压缩方式对监督微调和强化学习的影响各异，并在不同数据规模下表现出不同的泛化能力与记忆倾向。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.22870

1️⃣ 一句话总结

arXiv ID: 2606.15576

1️⃣ 一句话总结

arXiv ID: 2606.15441

1️⃣ 一句话总结

arXiv ID: 2606.06447

1️⃣ 一句话总结

arXiv ID: 2606.02994

1️⃣ 一句话总结

arXiv ID: 2606.03217

1️⃣ 一句话总结

arXiv ID: 2605.31483

1️⃣ 一句话总结

arXiv ID: 2605.28913

1️⃣ 一句话总结

arXiv ID: 2605.27824

1️⃣ 一句话总结

arXiv ID: 2605.28008

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.22870 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.15576 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.15441 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.06447 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.02994 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.03217 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.31483 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28913 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.27824 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28008 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.22870

arXiv ID: 2606.15576

arXiv ID: 2606.15441

arXiv ID: 2606.06447

arXiv ID: 2606.02994

arXiv ID: 2606.03217

arXiv ID: 2605.31483

arXiv ID: 2605.28913

arXiv ID: 2605.27824

arXiv ID: 2605.28008