arXiv最新AI论文速览速学

🔍

标签: #chain-of-thought ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: Neural Garbage Collection: Learning to Forget while Learning to Reason 04-25

arXiv ID: 2602.01982

arXiv 提交日期: 2026-02-02

llm model training natural language processing chain-of-thought activation steering reasoning efficiency instruction tuning self-supervised learning

S3-CoT：通过自采样简明推理实现高效思维链大语言模型 / S3-CoT: Self-Sampled Succinct Reasoning Enables Efficient Chain-of-Thought LLMs

1️⃣ 一句话总结

这篇论文提出了一种让大语言模型学会‘快速思考’的新方法，它通过引导模型自己生成简洁的推理步骤来学习，无需人工标注数据，从而在数学和医学任务上更高效、更准确地解决问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.02477

arXiv 提交日期: 2026-02-02

llm model training theory reasoning reinforcement learning divide-and-conquer scalability chain-of-thought

通过分而治之推理训练大语言模型提升测试时扩展性 / Training LLMs for Divide-and-Conquer Reasoning Elevates Test-Time Scalability

1️⃣ 一句话总结

这篇论文提出了一种新的强化学习训练框架，教会大语言模型像‘庖丁解牛’一样，先将复杂问题拆分成多个子问题逐一解决，再整合答案，从而在应对高难度任务时比传统‘一步步想’的方法表现更好、扩展性更强。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.01705

arXiv 提交日期: 2026-02-02

llm reinforcement learning model training latent diffusion reasoning diversity preservation chain-of-thought exploration

超越模式激发：通过潜在扩散推理器实现多样性保持的强化学习 / Beyond Mode Elicitation: Diversity-Preserving Reinforcement Learning via Latent Diffusion Reasoner

1️⃣ 一句话总结

这篇论文提出了一种名为LaDi-RL的新方法，它通过在一个连续的潜在空间中进行扩散引导的探索来优化大语言模型的推理过程，有效避免了传统方法中因强化学习导致思维链多样性下降的问题，从而在代码生成和数学推理任务上取得了更好的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.02453

arXiv 提交日期: 2026-02-02

natural language processing multi-modal model evaluation multimodal reasoning visual storytelling chain-of-thought comics temporal reasoning

用漫画思考：通过结构化视觉叙事增强多模态推理 / Thinking with Comics: Enhancing Multimodal Reasoning through Structured Visual Storytelling

1️⃣ 一句话总结

这篇论文提出了一种名为‘用漫画思考’的新方法，它利用漫画这种信息密度高、结构清晰的视觉媒介，在图片和视频之间找到了一个平衡点，从而更高效、更准确地进行多步骤的时间和因果推理任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.23184

arXiv 提交日期: 2026-01-30

llm natural language processing model training latent reasoning chain-of-thought variational autoencoder multi-modal reasoning efficient inference

ReGuLaR：基于渲染思维链引导的变分潜在推理 / ReGuLaR: Variational Latent Reasoning Guided by Rendered Chain-of-Thought

1️⃣ 一句话总结

这篇论文提出了一种名为ReGuLaR的新方法，它通过将思维链转化为图像来引导和压缩推理过程，从而让大语言模型在保持高准确率的同时，大幅减少了计算开销。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.19834

arXiv 提交日期: 2026-01-27

multi-modal theory model evaluation visual generation world models chain-of-thought multimodal reasoning evaluation suite

视觉生成通过多模态世界模型解锁类人推理 / Visual Generation Unlocks Human-Like Reasoning through Multimodal World Models

1️⃣ 一句话总结

这篇论文通过理论和实验证明，在涉及物理和空间等需要丰富先验知识的任务中，结合视觉生成与语言推理的多模态世界模型，比纯语言模型能更有效地模拟人类认知，实现更强大的类人智能推理。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.14750

arXiv 提交日期: 2026-01-21

llm multi-modal model evaluation chain-of-thought visual reasoning token compression vision language models reasoning efficiency

思维渲染：将文本思维链渲染为图像以实现视觉潜在推理 / Render-of-Thought: Rendering Textual Chain-of-Thought as Images for Visual Latent Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为‘思维渲染’的新方法，它将大语言模型推理过程中冗长的文字思维链转换成图像，从而大幅减少了计算负担并加速了推理过程，同时让模型的思考步骤变得可见和可追溯。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.13976

arXiv 提交日期: 2026-01-20

agents multi-modal model training vision-language navigation chain-of-thought latent reasoning real-time inference multimodal learning

FantasyVLN：用于视觉语言导航的统一多模态思维链推理框架 / FantasyVLN: Unified Multimodal Chain-of-Thought Reasoning for Vision-Language Navigation

1️⃣ 一句话总结

这篇论文提出了一个名为FantasyVLN的新方法，它通过将想象中的视觉信息压缩编码，让AI机器人在执行导航任务时既能像人一样进行多步骤推理，又能保持实时运行速度，解决了现有方法要么推理能力弱、要么速度太慢的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.14249

arXiv 提交日期: 2026-01-20

llm model training model evaluation reasoning distillation chain-of-thought data selection teacher-student alignment metric

哪些推理轨迹能让学生模型更好地学习推理？一个衡量信息对齐的简单指标 / Which Reasoning Trajectories Teach Students to Reason Better? A Simple Metric of Informative Alignment

1️⃣ 一句话总结

这篇论文提出了一个名为‘排序-惊奇度比率’的简单新指标，它能有效评估用于训练学生大语言模型的推理轨迹的质量，帮助挑选出既贴合学生当前水平又富含新信息的最佳教学材料，从而显著提升模型在复杂推理任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.11404

arXiv 提交日期: 2026-01-16

robotics multi-modal agents vision-language-action action reasoning robot policy chain-of-thought manipulation

ACoT-VLA：面向视觉-语言-动作模型的动作思维链 / ACoT-VLA: Action Chain-of-Thought for Vision-Language-Action Models

1️⃣ 一句话总结

这篇论文提出了一种名为ACoT-VLA的新方法，它让机器人通过在动作空间中直接进行结构化思考（即生成一系列粗略的动作意图）来指导最终决策，从而比传统方法更精确地完成复杂的操作任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.01982

1️⃣ 一句话总结

arXiv ID: 2602.02477

1️⃣ 一句话总结

arXiv ID: 2602.01705

1️⃣ 一句话总结

arXiv ID: 2602.02453

1️⃣ 一句话总结

arXiv ID: 2601.23184

1️⃣ 一句话总结

arXiv ID: 2601.19834

1️⃣ 一句话总结

arXiv ID: 2601.14750

1️⃣ 一句话总结

arXiv ID: 2601.13976

1️⃣ 一句话总结

arXiv ID: 2601.14249

1️⃣ 一句话总结

arXiv ID: 2601.11404

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.01982 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.02477 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.01705 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.02453 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.23184 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.19834 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.14750 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.13976 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.14249 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.11404 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.01982

arXiv ID: 2602.02477

arXiv ID: 2602.01705

arXiv ID: 2602.02453

arXiv ID: 2601.23184

arXiv ID: 2601.19834

arXiv ID: 2601.14750

arXiv ID: 2601.13976

arXiv ID: 2601.14249

arXiv ID: 2601.11404