arXiv最新AI论文速览速学

🔍

标签: #reasoning ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: LLMs as ASP Programmers: Self-Correction Enables Task-Agnostic Nonmonotonic Reasoning 05-01

arXiv ID: 2603.02858

arXiv 提交日期: 2026-03-03

llm natural language processing theory argument mining description logics knowledge representation reasoning explainable ai

基于大语言模型的论证挖掘与论证及描述逻辑的结合：一个用于辩论推理的统一框架 / LLM-based Argument Mining meets Argumentation and Description Logics: a Unified Framework for Reasoning about Debates

1️⃣ 一句话总结

这篇论文提出了一个结合大语言模型、定量论证和模糊描述逻辑的新框架，能够从原始辩论文本中提取结构化、可解释的论证关系并进行推理，克服了纯统计模型在复杂文本推理上的不足。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.22495

arXiv 提交日期: 2026-02-26

llm model training reinforcement learning knowledge distillation reasoning reinforcement learning policy optimization model compression

面向大语言模型推理的强化学习感知知识蒸馏 / Reinforcement-aware Knowledge Distillation for LLM Reasoning

1️⃣ 一句话总结

本文提出了一种名为RLAD的新方法，通过在强化学习训练过程中智能地选择时机模仿更强大的教师模型，成功地将复杂大模型的推理能力高效地压缩到更小、更快的模型中，解决了传统方法中目标冲突和分布不匹配的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21533

arXiv 提交日期: 2026-02-25

llm agents multi-modal multi-agent systems scientific discovery materials design catalyst discovery reasoning

基于多智能体大语言模型框架的推理驱动单原子催化剂设计 / Reasoning-Driven Design of Single Atom Catalysts via a Multi-Agent Large Language Model Framework

1️⃣ 一句话总结

这篇论文提出了一个名为MAESTRO的多智能体大语言模型框架，通过让多个扮演不同角色的AI智能体协作推理和优化，成功发现了打破传统反应中间体比例关系的高性能单原子催化剂，为材料发现提供了新策略。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.21371

arXiv 提交日期: 2026-02-24

llm model training theory attention mechanism multi-head attention reasoning parameter efficiency transformer architecture

交错头注意力机制 / Interleaved Head Attention

1️⃣ 一句话总结

这篇论文提出了一种名为‘交错头注意力’的新方法，通过让注意力头之间在计算时相互通信，有效解决了传统多头注意力机制在处理多步推理任务时信息不互通的问题，从而提升了大型语言模型在数学解题和复杂信息检索等任务上的表现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.20132

arXiv 提交日期: 2026-02-23

llm reinforcement learning model training advantage distribution reasoning policy optimization diversity distribution matching

LAD：用于推理的优势分布学习 / LAD: Learning Advantage Distribution for Reasoning

1️⃣ 一句话总结

这篇论文提出了一种名为LAD的新方法，通过让AI模型学习并匹配‘优势分布’，而不是单纯追求最高奖励，来解决当前大模型在数学和代码推理中容易陷入单一思维、缺乏多样性的问题，从而在提升准确率的同时，也增加了答案的多样性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19317

arXiv 提交日期: 2026-02-22

llm natural language processing agents personalized qa retrieval-augmented generation reinforcement learning reasoning retrieval policy

学习推理以实现个性化问答中个人上下文的多步骤检索 / Learning to Reason for Multi-Step Retrieval of Personal Context in Personalized Question Answering

1️⃣ 一句话总结

这篇论文提出了一个名为PR2的强化学习框架，它通过让AI学习在回答个性化问题时，智能地决定何时、如何从用户个人资料中检索信息并融入推理过程，从而生成更符合用户背景和偏好的答案，显著提升了问答系统的个性化效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16490

arXiv 提交日期: 2026-02-18

llm model training theory iterative computation model depth reasoning layer looping depth growth

从深度增长到循环：大语言模型中迭代计算的统一视角 / From Growing to Looping: A Unified View of Iterative Computation in LLMs

1️⃣ 一句话总结

这篇论文发现，让大语言模型通过‘深度增长’（训练时由浅入深）和‘循环’（推理时重复使用某些层）两种方式提升推理能力，其背后的工作机制本质上是相同的，都是通过一种迭代计算过程来实现，并且这两种方法可以相互结合，进一步放大效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.15564

arXiv 提交日期: 2026-02-17

llm natural language processing systems text-to-sql reinforcement learning adaptive workflows dynamic inference reasoning

超越静态流程：学习面向文本到SQL的动态工作流 / Beyond Static Pipelines: Learning Dynamic Workflows for Text-to-SQL

1️⃣ 一句话总结

这篇论文提出了一个名为SquRL的强化学习框架，它能让大型语言模型在文本转SQL任务中动态地选择并组合不同的处理步骤，从而比固定的静态方法更能适应复杂和陌生的查询，显著提升了实际应用中的效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.14795

arXiv 提交日期: 2026-02-16

data machine learning systems knowledge graphs dataset creation ontology neurosymbolic reasoning

模式的回归：为知识图谱上的机器学习与推理构建完整数据集 / Return of the Schema: Building Complete Datasets for Machine Learning and Reasoning on Knowledge Graphs

1️⃣ 一句话总结

这篇论文提出了一个名为Resource的工作流程和数据集套件，旨在为知识图谱的机器学习和推理任务提供同时包含事实数据和本体模式信息的完整数据集，以弥补现有数据集的不足并支持更复杂的推理方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.14534

arXiv 提交日期: 2026-02-16

multi-modal agents reinforcement learning motion understanding motion generation reasoning chain-of-motion human motion

MoRL：用于统一运动理解与生成的强化推理模型 / MoRL: Reinforced Reasoning for Unified Motion Understanding and Generation

1️⃣ 一句话总结

这篇论文提出了一个名为MoRL的统一模型，它通过结合监督学习和强化学习来理解和生成人体运动，并引入了一种名为“运动链”的推理方法，让模型能像人一样一步步思考和规划动作，从而在逻辑推理和动作真实性上都取得了更好的效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.02858

1️⃣ 一句话总结

arXiv ID: 2602.22495

1️⃣ 一句话总结

arXiv ID: 2602.21533

1️⃣ 一句话总结

arXiv ID: 2602.21371

1️⃣ 一句话总结

arXiv ID: 2602.20132

1️⃣ 一句话总结

arXiv ID: 2602.19317

1️⃣ 一句话总结

arXiv ID: 2602.16490

1️⃣ 一句话总结

arXiv ID: 2602.15564

1️⃣ 一句话总结

arXiv ID: 2602.14795

1️⃣ 一句话总结

arXiv ID: 2602.14534

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.02858 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.22495 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21533 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.21371 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.20132 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19317 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16490 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.15564 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.14795 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.14534 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.02858

arXiv ID: 2602.22495

arXiv ID: 2602.21533

arXiv ID: 2602.21371

arXiv ID: 2602.20132

arXiv ID: 2602.19317

arXiv ID: 2602.16490

arXiv ID: 2602.15564

arXiv ID: 2602.14795

arXiv ID: 2602.14534