arXiv最新AI论文速览速学

🔍

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 167 最新: MovieTeller: Tool-augmented Movie Synopsis with ID Consistent Progressive Abstraction 02-27

arXiv ID: 2602.05547

arXiv 提交日期: 2026-02-05

llm model training agents reinforcement learning post-training multi-task learning policy optimization reasoning

多任务GRPO：跨任务的可靠大语言模型推理 / Multi-Task GRPO: Reliable LLM Reasoning Across Tasks

1️⃣ 一句话总结

这项研究提出了一种名为MT-GRPO的新算法，通过动态调整任务权重和引入比例保持采样器，有效解决了多任务强化学习训练中常见的性能失衡问题，从而显著提升了模型在所有任务上的最差性能，并提高了训练效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05883

arXiv 提交日期: 2026-02-05

llm model training model evaluation modeling and simulation prompting retrieval-augmented generation fine-tuning determinism

建模与仿真中的大语言模型指南：从核心技术到关键挑战 / A Guide to Large Language Models in Modeling and Simulation: From Core Techniques to Critical Challenges

1️⃣ 一句话总结

这篇论文为建模与仿真领域的从业者提供了一份实用指南，旨在帮助他们识别和避免使用大语言模型时常见的误区（如数据过载、参数设置不当等），从而更明智、更有效地将大语言模型集成到工作流程中。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05717

arXiv 提交日期: 2026-02-05

reinforcement learning theory model training policy optimization exploration collapse support coverage gradient alignment regularization

锚定策略优化：通过支持约束修正来缓解探索崩溃 / Anchored Policy Optimization: Mitigating Exploration Collapse Via Support-Constrained Rectification

1️⃣ 一句话总结

这篇论文提出了一种名为‘锚定策略优化’的新方法，通过确保智能体在强化学习中始终覆盖有效的行动选项，解决了现有方法因过度‘锐化’而导致的探索范围崩溃问题，从而在提升任务成功率的同时保持了决策的多样性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05393

arXiv 提交日期: 2026-02-05

llm model training machine learning knowledge transfer training acceleration representation learning pretraining parameter efficiency

晚到早训练：让大语言模型学得更早，从而更快更好 / Late-to-Early Training: LET LLMs Learn Earlier, So Faster and Better

1️⃣ 一句话总结

这篇论文提出了一种名为‘晚到早训练’的新方法，它利用一个已经训练好的小模型来指导一个新的大模型在训练初期就学习到更深层的知识，从而显著加快训练速度并提升最终性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05951

arXiv 提交日期: 2026-02-05

model training aigc computer vision flow matching source distribution text-to-image generative models conditional generation

更好的源，更好的流：为流匹配学习条件依赖的源分布 / Better Source, Better Flow: Learning Condition-Dependent Source Distribution for Flow Matching

1️⃣ 一句话总结

这篇论文提出，在文本生成图像的流匹配模型中，学习一个根据文本条件变化的源分布，而不是使用固定的高斯分布，可以显著提升模型性能，实现更快的收敛和更好的生成效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05463

arXiv 提交日期: 2026-02-05

theory systems machine learning thermodynamic limits energy efficiency information theory physical intelligence bits-per-joule

物理智能的热力学极限 / Thermodynamic Limits of Physical Intelligence

1️⃣ 一句话总结

这篇论文提出了两个基于“比特/焦耳”的新指标，用于衡量智能系统在获取环境信息和执行有效行动时的能量效率，并建立了一个统一的评估框架，旨在将人工智能的能力与其物理能耗直接联系起来。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05550

arXiv 提交日期: 2026-02-05

natural language processing data benchmark code retrieval dataset code embedding fine-tuning programming language

ArkTS-CodeSearch：一个用于代码检索的开源ArkTS数据集 / ArkTS-CodeSearch: A Open-Source ArkTS Dataset for Code Retrieval

1️⃣ 一句话总结

这篇论文创建了首个面向OpenHarmony生态核心语言ArkTS的大规模公开数据集和评估基准，并通过训练模型提升了用自然语言查询匹配ArkTS代码的能力。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05574

arXiv 提交日期: 2026-02-05

medical computer vision machine learning medical imaging neurodegenerative disease multi-modal classification mri analysis hybrid cnn-ml

一种结合CNN与机器学习的混合框架，利用MRI和脑结构特征进行运动障碍的多模态分类 / A Hybrid CNN and ML Framework for Multi-modal Classification of Movement Disorders Using MRI and Brain Structural Features

1️⃣ 一句话总结

本研究提出了一种结合卷积神经网络和传统机器学习的新方法，通过融合脑部MRI图像、结构分割图和体积测量数据，有效区分了非典型帕金森病亚型与帕金森病，为早期精准诊断提供了有力工具。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05289

arXiv 提交日期: 2026-02-05

llm agents systems multi-agent systems collective ai evaluation metric collaboration gain design science

迈向集体人工智能科学：基于LLM的多智能体系统需要从盲目试错转向严谨科学 / Towards a Science of Collective AI: LLM-based Multi-Agent Systems Need a Transition from Blind Trial-and-Error to Rigorous Science

1️⃣ 一句话总结

这篇论文指出当前基于大语言模型的多智能体系统研究过于依赖试错，缺乏科学框架，因此提出了一个包含统一协作增益指标和系统化因素库的集成框架，旨在将该领域从盲目实验转变为严谨科学。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05385

arXiv 提交日期: 2026-02-05

llm natural language processing systems text-to-sql monte carlo tree search reasoning schema linking modular architecture

IESR：基于高效MCTS的模块化推理方法，用于大型语言模型的文本转SQL任务 / IESR:Efficient MCTS-Based Modular Reasoning for Text-to-SQL with Large Language Models

1️⃣ 一句话总结

本文提出了一种名为IESR的高效模块化推理框架，它结合了蒙特卡洛树搜索和多数投票机制，让轻量级大语言模型无需微调就能在复杂的文本转SQL任务中取得顶尖性能，并揭示了当前模型在数学计算和常识推理上的不足。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.05547

1️⃣ 一句话总结

arXiv ID: 2602.05883

1️⃣ 一句话总结

arXiv ID: 2602.05717

1️⃣ 一句话总结

arXiv ID: 2602.05393

1️⃣ 一句话总结

arXiv ID: 2602.05951

1️⃣ 一句话总结

arXiv ID: 2602.05463

1️⃣ 一句话总结

arXiv ID: 2602.05550

1️⃣ 一句话总结

arXiv ID: 2602.05574

1️⃣ 一句话总结

arXiv ID: 2602.05289

1️⃣ 一句话总结

arXiv ID: 2602.05385

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.05547 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05883 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05717 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05393 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05951 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05463 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05550 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05574 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05289 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05385 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.05547

arXiv ID: 2602.05883

arXiv ID: 2602.05717

arXiv ID: 2602.05393

arXiv ID: 2602.05951

arXiv ID: 2602.05463

arXiv ID: 2602.05550

arXiv ID: 2602.05574

arXiv ID: 2602.05289

arXiv ID: 2602.05385