arXiv最新AI论文速览速学

🔍

theory ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 166 72小时内新更新论文 72h更新 171 最新: More Test-Time Compute Can Hurt: Overestimation Bias in LLM Beam Search 03-17

arXiv ID: 2603.15001

arXiv 提交日期: 2026-03-16

reinforcement learning theory model training policy optimization exploration stochastic gradient bandit log-barrier regularization sample complexity

对数障碍函数如何助力策略优化中的探索 / How Log-Barrier Helps Exploration in Policy Optimization

1️⃣ 一句话总结

这篇论文提出了一种在对策略优化目标中加入对数障碍函数的新方法，它能在不增加样本复杂度的前提下，强制算法进行有效探索，从而在更现实的条件下保证收敛到最优策略。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15412

arXiv 提交日期: 2026-03-16

theory machine learning topological complexity classification sample complexity metric spaces vc dimension

局部乌雷松宽度：一种用于分类的拓扑复杂性度量 / Local Urysohn Width: A Topological Complexity Measure for Classification

1️⃣ 一句话总结

这篇论文提出了一种名为‘局部乌雷松宽度’的新指标，它从数据空间的拓扑几何结构本身来衡量分类问题的固有难度，并证明了这种难度与传统的VC维等指标有本质不同，且会直接影响学习所需的最小样本量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.12365

arXiv 提交日期: 2026-03-12

machine learning model training theory bayesian experimental design parameter identification constitutive models information gain surrogate modeling

面向历史相关本构模型可靠学习的最优实验设计 / Optimal Experimental Design for Reliable Learning of History-Dependent Constitutive Laws

1️⃣ 一句话总结

这篇论文提出了一种基于贝叶斯最优实验设计的框架，通过智能规划实验方案（如试样形状和加载路径），用更少的物理实验成本，更可靠地确定材料本构模型中的参数，特别是那些描述材料“记忆效应”的关键参数。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.12163

arXiv 提交日期: 2026-03-12

theory model training machine learning continual learning catastrophic forgetting mixture models kl divergence post-training

训练后遗忘的定量表征 / A Quantitative Characterization of Forgetting in Post-Training

1️⃣ 一句话总结

这篇论文通过理论分析，揭示了生成模型在持续训练后发生遗忘的根本原因，并精确量化了遗忘的程度，指出遗忘主要取决于训练目标函数的选择、新旧任务数据的重叠程度以及训练时的数据采样方式。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.12244

arXiv 提交日期: 2026-03-12

theory model training machine learning neural architecture tensor decomposition inductive bias generative modeling distributional modeling

可分离神经架构：作为统一预测与生成智能的基础组件 / Separable neural architectures as a primitive for unified predictive and generative intelligence

1️⃣ 一句话总结

这篇论文提出了一种名为‘可分离神经架构’的新模型，它通过将复杂系统分解为低维度的简单组件，统一了从物理混沌系统到语言生成等多种预测和生成任务，为解决高维问题提供了一个通用且高效的方法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.11472

arXiv 提交日期: 2026-03-12

systems theory machine learning point processes network centrality dynamic ranking hawkes processes influence quantification

霍克斯排名：基于事件驱动的实时重要性排序中心性度量 / HawkesRank: Event-Driven Centrality for Real-Time Importance Ranking

1️⃣ 一句话总结

这篇论文提出了一个名为HawkesRank的新方法，它通过实时分析网络中事件的相互激发模式来动态评估节点的重要性，比传统静态方法更能准确反映真实世界中的影响力变化。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.11565

arXiv 提交日期: 2026-03-12

medical machine learning theory causal inference counterfactual estimation time series representation learning adversarial training

CAETC：用于时序反事实估计的因果自编码与治疗条件化方法 / CAETC: Causal Autoencoding and Treatment Conditioning for Counterfactual Estimation over Time

1️⃣ 一句话总结

本文提出了一种名为CAETC的新方法，它通过结合因果自编码和治疗条件化技术，有效克服了时序观测数据中的混杂偏差，从而更准确地预测不同治疗方案下的潜在结果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.11142

arXiv 提交日期: 2026-03-11

computer vision model evaluation theory mechanistic interpretability vision transformer causal analysis attention mlp

注意力机制收集证据，MLP模块组合概念：对VideoViT中动作-结果回路的因果分析 / Attention Gathers, MLPs Compose: A Causal Analysis of an Action-Outcome Circuit in VideoViT

1️⃣ 一句话总结

这篇论文通过因果分析方法，揭示了视频分类模型内部存在一个专门处理动作“成功与否”的隐藏回路，其中注意力机制负责收集低层证据，而多层感知机则负责稳健地组合概念，这解释了模型为何能形成超越其训练任务的复杂“隐藏知识”，并凸显了构建可信AI系统时进行机制性监督的重要性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.10573

arXiv 提交日期: 2026-03-11

theory llm model evaluation in-context learning mechanistic interpretability statistical inference hypothesis testing transformer analysis

Transformer中的隐式统计推断：在上下文中逼近似然比检验 / Implicit Statistical Inference in Transformers: Approximating Likelihood-Ratio Tests In-Context

1️⃣ 一句话总结

这篇论文通过统计决策理论视角研究发现，Transformer模型在上下文学习时，并非简单地匹配相似性，而是能够自适应地构建接近最优统计推断的算法，以解决线性和非线性任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.10588

arXiv 提交日期: 2026-03-11

llm model training theory alignment reinforcement learning moral reasoning rlvr reward modeling

大语言模型对齐真的需要多样性吗？一项关于将RLVR方法应用于道德推理的实证研究 / Does LLM Alignment Really Need Diversity? An Empirical Study of Adapting RLVR Methods for Moral Reasoning

1️⃣ 一句话总结

这项研究发现，在训练大语言模型进行道德推理时，追求高回报的标准强化学习方法与刻意保持多样性的方法效果相当甚至更好，表明对齐任务并不必然需要专门的多样性算法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2603.15001

1️⃣ 一句话总结

arXiv ID: 2603.15412

1️⃣ 一句话总结

arXiv ID: 2603.12365

1️⃣ 一句话总结

arXiv ID: 2603.12163

1️⃣ 一句话总结

arXiv ID: 2603.12244

1️⃣ 一句话总结

arXiv ID: 2603.11472

1️⃣ 一句话总结

arXiv ID: 2603.11565

1️⃣ 一句话总结

arXiv ID: 2603.11142

1️⃣ 一句话总结

arXiv ID: 2603.10573

1️⃣ 一句话总结

arXiv ID: 2603.10588

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2603.15001 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15412 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.12365 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.12163 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.12244 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.11472 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.11565 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.11142 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.10573 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.10588 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2603.15001

arXiv ID: 2603.15412

arXiv ID: 2603.12365

arXiv ID: 2603.12163

arXiv ID: 2603.12244

arXiv ID: 2603.11472

arXiv ID: 2603.11565

arXiv ID: 2603.11142

arXiv ID: 2603.10573

arXiv ID: 2603.10588