arXiv最新AI论文速览速学

🔍

theory ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 99 72小时内新更新论文 72h更新 100 最新: Minimax Quantile Lower Bounds for Interactive Statistical Decision Making with Privacy 06-23

arXiv ID: 2606.02008

arXiv 提交日期: 2026-06-01

machine learning theory meta-learning data scaling complexity minimization pre-training theory sample complexity

基于复杂度最小化的可证明元学习数据扩展规律 / Provable Data Scaling Law for Meta Learning via Complexity Minimization

1️⃣ 一句话总结

本文提出了一种名为“复杂度最小化”的元表示学习框架，通过评估各领域最合适的下游模型复杂度并最小化跨领域的最坏情况复杂度，从理论上证明了随着预训练数据量增加，小样本学习的错误率会持续下降，从而合理解释了预训练数据规模扩大带来的性能提升现象。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.01560

arXiv 提交日期: 2026-06-01

machine learning theory adversarial robustness graph neural networks disentangled learning node classification

GJDNet：通过联合解缠学习实现鲁棒图神经网络的对抗攻击防御 / GJDNet: Robust Graph Neural Networks via Joint Disentangled Learning Against Adversarial Attacks

1️⃣ 一句话总结

该论文提出了一种名为GJDNet的图神经网络模型，通过将节点特征和决策空间进行分离学习，有效抵御针对图结构的对抗性攻击，在多类不同连接模式的图上均能保持高稳定性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.02490

arXiv 提交日期: 2026-06-01

machine learning theory neural architecture congruence layers positive-definite matrices expressivity riemannian classifiers

基于同余架构的深度神经网络在正定矩阵上的表达能力研究 / Expressivity of congruence-based architectures for DNNs on positive-definite matrices

1️⃣ 一句话总结

本文揭示了处理正定矩阵的神经网络中常用的一种层（同余层）在施加半正交约束后，会因损失特征值的多样性而导致网络表达能力大幅下降，甚至退化为单隐层网络，并探讨了不同分类器与这种特征提取方式的匹配问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.01532

arXiv 提交日期: 2026-06-01

llm machine learning theory positional encoding sliding-window transformers turing completeness expressiveness autoregressive model

重新思考位置编码的作用：无位置编码的滑动窗口Transformer仍具有图灵完备性 / Rethinking the Role of Positional Encoding: Sliding-Window Transformers without PE Remain Turing Complete

1️⃣ 一句话总结

本文挑战了位置编码是Transformer实现通用计算必不可少的传统观点，通过提出一个仅依赖窗口内词频统计的抽象模型HIST，并证明滑动窗口机制本身就能打破置换不变性，从而让无需位置编码的Transformer在有限滑动窗口下依然能够模拟任意计算，达到图灵完备。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.02115

arXiv 提交日期: 2026-06-01

machine learning theory diffusion models drift estimation error bounds stochastic differential equations score matching

基于扩散模型的漂移估计器的误差界 / Error Bounds for a Diffusion Model-Based Drift Estimator

1️⃣ 一句话总结

本文为一种利用扩散模型从多条离散轨迹中估计随机微分方程漂移项的新方法提供了严格的理论误差分析，将总误差分解为离散化、去噪近似、噪声初始化和采样方差四个部分，并给出了显式的风险界。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2606.01787

arXiv 提交日期: 2026-06-01

machine learning systems theory asynchronous optimization adaptive methods stochastic convergence non-convex optimization large-scale learning

并行异步自适应一阶方法的随机收敛性分析 / Stochastic convergence of parallel asynchronous adaptive first-order methods

1️⃣ 一句话总结

本文提出了一类新的并行异步自适应优化算法，涵盖了多种经典算法的异步版本，并在非凸函数的全随机环境下证明其收敛速度可达O(1/√t)，数值实验表明这类算法在异构大规模机器学习系统中非常实用。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28454

arXiv 提交日期: 2026-05-27

systems theory greedy best-first search memory efficiency heuristic search planning bloom filter

GONDOR救场：低内存下的满意规划 / GONDOR to the Rescue: Satisficing Planning with Low Memory

1️⃣ 一句话总结

本文提出了一种名为GONDOR的改进算法，它在传统贪心最佳优先搜索的基础上，通过定期压缩搜索树并保留关键状态，再在找到目标后利用这些关键状态重新搜索重建路径，从而在内存严格受限的设备（如边缘设备）上仍能有效地完成规划任务。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28300

arXiv 提交日期: 2026-05-27

machine learning theory tensor decomposition multilayer network graph representation learning generalized estimating equations statistical regularization

T-GINEE：基于张量的多层图表示学习 / T-GINEE: A Tensor-Based Multilayer Graph Representation Learning

1️⃣ 一句话总结

本文提出了一种名为T-GINEE的统计学习框架，通过张量分解巧妙地捕捉多层网络中不同层之间的依赖关系，从而更准确地分析现实世界中如社交或交通网络等多类型关系的复杂系统。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28131

arXiv 提交日期: 2026-05-27

natural language processing theory model evaluation constituency parsing tree binarization headedness punctuation negative result

更好的头部选择并不保证更好的二值化成分句法分析 / Better heads do not guarantee better binarized constituency parsing

1️⃣ 一句话总结

本文通过实验挑战了一个常见假设：在成分句法分析中，使用更准确的基于学习的句法头部（head）来指导树结构的二值化，并不比简单的基于规则的头部带来更一致的解析性能提升，甚至在标点符号敏感的评估指标上表现更差，表明语言学上合理的头部选择并非总是对解析器最优。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.28679

arXiv 提交日期: 2026-05-27

machine learning theory ridge regression regularization optimization generalization

最优岭回归正则化再探 / Optimal ridge regularization revisited

1️⃣ 一句话总结

本文提出了一种迭代算法，能够从数据生成参数中计算出岭回归的最优正则化强度，并在有限噪声下确保收敛，实验表明该算法结合样本估计可在不同样本量和噪声水平下达到接近最优的泛化性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2606.02008

1️⃣ 一句话总结

arXiv ID: 2606.01560

1️⃣ 一句话总结

arXiv ID: 2606.02490

1️⃣ 一句话总结

arXiv ID: 2606.01532

1️⃣ 一句话总结

arXiv ID: 2606.02115

1️⃣ 一句话总结

arXiv ID: 2606.01787

1️⃣ 一句话总结

arXiv ID: 2605.28454

1️⃣ 一句话总结

arXiv ID: 2605.28300

1️⃣ 一句话总结

arXiv ID: 2605.28131

1️⃣ 一句话总结

arXiv ID: 2605.28679

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2606.02008 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.01560 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.02490 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.01532 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.02115 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2606.01787 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28454 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28300 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28131 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.28679 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2606.02008

arXiv ID: 2606.01560

arXiv ID: 2606.02490

arXiv ID: 2606.01532

arXiv ID: 2606.02115

arXiv ID: 2606.01787

arXiv ID: 2605.28454

arXiv ID: 2605.28300

arXiv ID: 2605.28131

arXiv ID: 2605.28679