arXiv最新AI论文速览速学

🔍

theory ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: Optimally Auditing Adversarial Agents 05-02

arXiv ID: 2604.18161

arXiv 提交日期: 2026-04-20

reinforcement learning theory model training policy gradients differentiable simulators variance reduction estimator switching robotics control

“可微分模拟器能提供更好的策略梯度吗？”真的能提供更好的策略梯度吗？ / Does "Do Differentiable Simulators Give Better Policy Gradients?'' Give Better Policy Gradients?

1️⃣ 一句话总结

这篇论文研究发现，在强化学习中，虽然利用可微分模型的一阶梯度估计能加速学习，但环境动态的不连续性会引入偏差；作者通过提出两种轻量级方法（DDCG和IVW-H）证明，相比复杂的间断检测，简单的估计器切换和精细的方差控制往往在实际任务中更为关键和有效。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18328

arXiv 提交日期: 2026-04-20

llm natural language processing theory neuro-symbolic syllogistic reasoning ensemble methods formal verification content robustness

FregeLogic在SemEval 2026任务11中的表现：一种用于内容鲁棒三段论有效性预测的混合神经符号架构 / FregeLogic at SemEval 2026 Task 11: A Hybrid Neuro-Symbolic Architecture for Content-Robust Syllogistic Validity Prediction

1️⃣ 一句话总结

这篇论文提出了一个名为FregeLogic的混合系统，它巧妙地结合了多个大语言模型和一个形式逻辑求解器，专门用来判断三段论推理是否有效，并且能有效降低推理内容本身对判断结果产生的误导性影响。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18569

arXiv 提交日期: 2026-04-20

machine learning model evaluation theory active learning sequential prediction mean estimation confidence intervals query strategy

重访主动序列预测驱动的均值估计 / Revisiting Active Sequential Prediction-Powered Mean Estimation

1️⃣ 一句话总结

这篇论文通过理论和实验发现，在一种结合机器学习预测和人工查询的主动学习框架中，让查询概率主要受一个固定常数（而非模型的不确定性）驱动，反而能获得更精确的估计结果，并对此给出了严格的理论分析。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18420

arXiv 提交日期: 2026-04-20

machine learning theory systems bandit algorithms graph-based learning recommendation systems regret analysis online learning

平滑图函数的光谱多臂老虎机 / Spectral bandits for smooth graph functions

1️⃣ 一句话总结

这篇论文提出了一种基于图结构的光谱多臂老虎机算法，用于解决像内容推荐这样的在线学习问题，其核心创新是引入了一个‘有效维度’的概念，并设计了两种算法，使得累计遗憾不会随图中节点数大幅增加，从而仅需评估少量节点就能有效学习用户对大量物品的偏好。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.17941

arXiv 提交日期: 2026-04-20

multi-modal model evaluation theory neuron interpretation causal attribution vision-language models model steering feed-forward networks

从注意力头到神经元：多任务视觉语言模型中的因果归因与调控 / From Heads to Neurons: Causal Attribution and Steering in Multi-Task Vision-Language Models

1️⃣ 一句话总结

这篇论文提出了一个名为HONES的新方法，它通过分析模型内部注意力头与神经元之间的关联，来更准确地找出并调控那些对完成不同视觉语言任务至关重要的神经元，从而提升模型在多任务场景下的性能和可解释性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18580

arXiv 提交日期: 2026-04-20

natural language processing model training theory sequence modeling state space models attention mechanisms long-range dependencies recurrent architectures

Sessa：选择性状态空间注意力机制 / Sessa: Selective State Space Attention

1️⃣ 一句话总结

这篇论文提出了一种名为Sessa的新型序列模型，它通过将注意力机制嵌入到反馈路径中，实现了比传统Transformer和Mamba模型更优的长程信息记忆能力，在长上下文任务中表现突出。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18481

arXiv 提交日期: 2026-04-20

theory model training physics-informed neural networks automatic differentiation gradient computation neural network training scientific machine learning

物理信息神经网络：完整训练周期的教学式推导 / Physics-Informed Neural Networks: A Didactic Derivation of the Complete Training Cycle

1️⃣ 一句话总结

这篇论文通过一个具体数值示例，手把手地推导了物理信息神经网络从正向传播、计算损失到反向传播梯度并更新参数的完整训练过程，旨在揭示通常被自动微分库隐藏的底层数学原理。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18242

arXiv 提交日期: 2026-04-20

theory machine learning statistical depth hadamard manifolds median estimation robust statistics geometric data analysis

哈达玛流形上的球面深度与Busemann中位数 / Horospherical Depth and Busemann Median on Hadamard Manifolds

1️⃣ 一句话总结

这篇论文为一种特殊的弯曲空间（哈达玛流形）提出了一种全新的、不依赖于特定参考点的数据深度概念（球面深度），并定义了相应的中位数（Busemann中位数），证明了其存在性、唯一性、鲁棒性以及统计估计的收敛性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.18555

arXiv 提交日期: 2026-04-20

model training theory machine learning quantization error analysis randomized algorithms compression

关于TurboQuant与早期DRIVE/EDEN系列工作的说明 / A Note on TurboQuant and the Earlier DRIVE/EDEN Line of Work

1️⃣ 一句话总结

这篇论文澄清了近期TurboQuant量化方法与早期EDEN系列工作的关系，指出TurboQuant是EDEN在特定参数下的子集或次优组合，并通过实验证明优化后的EDEN方法在精度上全面优于TurboQuant。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.14691

arXiv 提交日期: 2026-04-16

llm agents theory causal discovery agent simulations social emergence markov boundary counterfactual probing

CAMO：一个从微观行为到宏观涌现的自动化因果发现框架，用于大语言模型智能体模拟 / CAMO: An Agentic Framework for Automated Causal Discovery from Micro Behaviors to Macro Emergence in LLM Agent Simulations

1️⃣ 一句话总结

这篇论文提出了一个名为CAMO的自动化框架，它能从大语言模型智能体模拟的海量互动数据中，自动找出导致宏观群体现象（如合作或冲突）的关键微观行为和因果链条，帮助研究者理解复杂社会现象背后的生成机制。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.18161

1️⃣ 一句话总结

arXiv ID: 2604.18328

1️⃣ 一句话总结

arXiv ID: 2604.18569

1️⃣ 一句话总结

arXiv ID: 2604.18420

1️⃣ 一句话总结

arXiv ID: 2604.17941

1️⃣ 一句话总结

arXiv ID: 2604.18580

1️⃣ 一句话总结

arXiv ID: 2604.18481

1️⃣ 一句话总结

arXiv ID: 2604.18242

1️⃣ 一句话总结

arXiv ID: 2604.18555

1️⃣ 一句话总结

arXiv ID: 2604.14691

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.18161 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18328 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18569 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18420 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.17941 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18580 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18481 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18242 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.18555 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.14691 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.18161

arXiv ID: 2604.18328

arXiv ID: 2604.18569

arXiv ID: 2604.18420

arXiv ID: 2604.17941

arXiv ID: 2604.18580

arXiv ID: 2604.18481

arXiv ID: 2604.18242

arXiv ID: 2604.18555

arXiv ID: 2604.14691