arXiv最新AI论文速览速学

🔍

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 50 72小时内新更新论文 72h更新 167 最新: MovieTeller: Tool-augmented Movie Synopsis with ID Consistent Progressive Abstraction 02-27

arXiv ID: 2602.08742

arXiv 提交日期: 2026-02-09

data systems theory nearest neighbor search diversity welfare functions algorithm design retrieval-augmented generation

多样化相似性搜索的福利主义公式化方法 / Welfarist Formulations for Diverse Similarity Search

1️⃣ 一句话总结

这篇论文提出了一种基于福利经济学原理的新方法，用于在最近邻搜索中自动且灵活地平衡结果的相关性与多样性，并设计了高效的算法来实现这一目标。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08586

arXiv 提交日期: 2026-02-09

llm agents theory multi-agent reasoning gain decomposition theoretical framework role-based diversity principled consensus

PRISM：一种基于增益分解的多智能体推理原则性框架 / PRISM: A Principled Framework for Multi-Agent Reasoning via Gain Decomposition

1️⃣ 一句话总结

这篇论文提出了一个名为PRISM的理论框架，将多智能体协作提升大语言模型推理能力的原因分解为探索、信息和聚合三个核心维度，并基于此设计了一个能同时优化这三个维度的新系统，在多个任务上取得了领先的性能和计算效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08786

arXiv 提交日期: 2026-02-09

systems machine learning model evaluation resource allocation prediction value welfare impact empirical toolkit policy evaluation

从实证角度理解预测在资源分配中的价值 / Empirically Understanding the Value of Prediction in Allocation

1️⃣ 一句话总结

这篇论文开发了一套实证工具包，帮助决策者量化比较在资源分配问题中，投资于预测模型与投资于扩大资源容量或提升服务质量这两种不同策略，哪个能带来更大的实际效益，并通过德国就业服务和埃塞俄比亚扶贫两个真实案例展示了该工具的应用。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08859

arXiv 提交日期: 2026-02-09

machine learning theory data dataset similarity metric learning geometric measure generative models high-dimensional data

幅度距离：一种数据集相似性的几何度量 / Magnitude Distance: A Geometric Measure of Dataset Similarity

1️⃣ 一句话总结

这篇论文提出了一种名为‘幅度距离’的新方法，用于衡量不同数据集之间的相似性，它通过一个可调节的参数来捕捉数据的整体结构或局部细节，并且在处理高维数据时依然有效，还能用于训练生成模型。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08696

arXiv 提交日期: 2026-02-09

audio medical model training speech synthesis dysarthria disentanglement text-to-speech pathological speech

基于原型的解耦可控构音障碍语音合成 / Prototype-Based Disentanglement for Controllable Dysarthric Speech Synthesis

1️⃣ 一句话总结

这篇论文提出了一种名为ProtoDisent-TTS的新方法，它能够将说话人的声音特质和构音障碍的发音特征分离开来，从而可以灵活地生成或转换健康语音与障碍语音，有效提升了语音识别和辅助技术的性能与可控性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08214

arXiv 提交日期: 2026-02-09

llm model evaluation systems adversarial attack resource exhaustion reasoning models safety evaluation recursive entropy

RECUR：一种通过递归熵引导的反事实利用与反思实现的资源耗尽攻击 / RECUR: Resource Exhaustion Attack via Recursive-Entropy Guided Counterfactual Utilization and Reflection

1️⃣ 一句话总结

这篇论文提出了一种名为RECUR的攻击方法，它通过构造特殊问题来干扰大型推理模型的反思过程，使其陷入过度计算，从而显著消耗系统资源，揭示了模型推理机制本身存在的安全隐患。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08387

arXiv 提交日期: 2026-02-09

llm model training systems training framework pytorch parallelization reproducibility large-scale experiments

Modalities：一个用于大规模大语言模型训练与研究的PyTorch原生框架 / Modalities, a PyTorch-native Framework For Large-scale LLM Training and Research

1️⃣ 一句话总结

这篇论文提出了一个名为Modalities的PyTorch原生框架，它通过集成先进的并行化策略和模块化设计，旨在高效支持万亿级数据、十亿级参数的大语言模型预训练与系统性消融实验，从而解决现有框架在实验管理和可复现性方面的不足。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.09002

arXiv 提交日期: 2026-02-09

robotics multi-modal agents social navigation vision-language model path planning human-robot interaction contextual reasoning

从障碍到礼仪：基于视觉语言模型路径选择的机器人社会导航 / From Obstacles to Etiquette: Robot Social Navigation with VLM-Informed Path Selection

1️⃣ 一句话总结

这篇论文提出了一种让机器人在人群中移动时更懂‘礼貌’的新方法，它先用传统技术规划几条可行的物理路线，然后借助一个经过专门训练的视觉语言模型，像人一样‘思考’哪条路线最符合社交礼仪，从而选出既安全又不打扰他人的最优路径。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08603

arXiv 提交日期: 2026-02-09

agents multi-modal model training composed image retrieval agentic planning trajectory optimization mixed-integer programming visual-language reasoning

OSCAR：用于组合图像检索的优化引导智能体规划框架 / OSCAR: Optimization-Steered Agentic Planning for Composed Image Retrieval

1️⃣ 一句话总结

这篇论文提出了一个名为OSCAR的新框架，它将组合图像检索任务从一个依赖试错的启发式搜索过程，转变为一个有理论依据的轨迹优化问题，通过离线计算最优检索路径并在线引导模型，从而用更少的数据实现了更准确、泛化能力更强的检索效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08216

arXiv 提交日期: 2026-02-09

theory machine learning model training transformer theory attention mechanism information thermodynamics statistical physics lagrangian dynamics

Transformer的热力学同构：一种基于拉格朗日方法的注意力动力学研究 / Thermodynamic Isomorphism of Transformers: A Lagrangian Approach to Attention Dynamics

1️⃣ 一句话总结

这篇论文首次从物理学的“最小作用量原理”出发，将Transformer模型中的注意力机制视为一个遵循热力学和信息动力学规律的系统，从而为人工智能的底层机制提供了一个统一的理论框架，并解释了模型训练中的涌现现象。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.08742

1️⃣ 一句话总结

arXiv ID: 2602.08586

1️⃣ 一句话总结

arXiv ID: 2602.08786

1️⃣ 一句话总结

arXiv ID: 2602.08859

1️⃣ 一句话总结

arXiv ID: 2602.08696

1️⃣ 一句话总结

arXiv ID: 2602.08214

1️⃣ 一句话总结

arXiv ID: 2602.08387

1️⃣ 一句话总结

arXiv ID: 2602.09002

1️⃣ 一句话总结

arXiv ID: 2602.08603

1️⃣ 一句话总结

arXiv ID: 2602.08216

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.08742 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08586 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08786 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08859 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08696 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08214 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08387 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.09002 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08603 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08216 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.08742

arXiv ID: 2602.08586

arXiv ID: 2602.08786

arXiv ID: 2602.08859

arXiv ID: 2602.08696

arXiv ID: 2602.08214

arXiv ID: 2602.08387

arXiv ID: 2602.09002

arXiv ID: 2602.08603

arXiv ID: 2602.08216