arXiv最新AI论文速览速学

🔍

标签: #convergence analysis ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 89 72小时内新更新论文 72h更新 189 最新: Algorithmic Analysis of Dense Associative Memory: Finite-Size Guarantees and Adversarial Robustness 04-20

arXiv ID: 2604.14017

arXiv 提交日期: 2026-04-15

model training machine learning theory stochastic optimization trust-region methods over-parameterized models constrained optimization convergence analysis

面向过参数化模型的随机信赖域方法 / Stochastic Trust-Region Methods for Over-parameterized Models

1️⃣ 一句话总结

本文提出了一种新的随机信赖域优化框架，能够自动调整学习步长，无需手动调参，并在过参数化模型（如深度神经网络）和带等式约束的优化问题上实现了稳定且高效的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.12811

arXiv 提交日期: 2026-04-14

theory machine learning systems associative memory convergence analysis adversarial robustness capacity scaling dynamical systems

稠密联想记忆的算法分析：有限规模保证与对抗鲁棒性 / Algorithmic Analysis of Dense Associative Memory: Finite-Size Guarantees and Adversarial Robustness

1️⃣ 一句话总结

这篇论文通过算法分析，为一种具有高阶交互的联想记忆模型提供了有限规模下的性能保证，证明了其在异步更新下能快速收敛、具备对抗攻击的容忍能力，并且其存储容量随网络规模呈多项式增长。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.06926

arXiv 提交日期: 2026-04-08

theory machine learning model training optimization difference-of-convex algorithm dynamical systems convergence analysis bregman geometry

凸差算法的连续时间动力学 / Continuous-Time Dynamics of the Difference-of-Convex Algorithm

1️⃣ 一句话总结

这篇论文通过将凸差算法（DCA）解释为一个连续时间动力系统的离散化，揭示了其内在的几何结构，并分析了不同算法变体的收敛性质，为选择更好的目标函数分解方式提供了理论依据。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.01606

arXiv 提交日期: 2026-04-02

machine learning theory model training wasserstein geometry coordinate descent optimization probability measures convergence analysis

概率测度Wasserstein空间上的随机坐标下降法 / Random Coordinate Descent on the Wasserstein Space of Probability Measures

1️⃣ 一句话总结

这篇论文提出了一种在概率分布空间上进行优化的新方法，通过随机选取优化方向来大幅提高计算效率，特别适用于处理高维或复杂数据分布的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.29128

arXiv 提交日期: 2026-03-31

theory machine learning model training variational inequalities optimization cyclic algorithms adaptive methods convergence analysis

变分不等式的自适应延迟更新循环算法 / Adaptive Delayed-Update Cyclic Algorithm for Variational Inequalities

1️⃣ 一句话总结

本文提出了一种名为ADUCA的自适应循环算法，用于求解一大类单调变分不等式问题，该算法无需手动调整参数或进行复杂的线搜索，通过利用延迟一个完整循环的算子信息，实现了接近最优的计算效率，并易于并行和分布式实现。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.19040

arXiv 提交日期: 2026-03-19

machine learning systems theory differential privacy federated learning wireless networks convergence analysis privacy-utility trade-off

当差分隐私遇见无线联邦学习：隐私与收敛性的改进分析 / When Differential Privacy Meets Wireless Federated Learning: An Improved Analysis for Privacy and Convergence

1️⃣ 一句话总结

这项研究为无线联邦学习中的差分隐私保护提供了更精确的分析框架，证明了在非凸优化和梯度裁剪等实际条件下，隐私损失不会无限累积，并明确了隐私保护与模型性能之间的权衡关系。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.18168

arXiv 提交日期: 2026-03-18

machine learning model training theory residual networks training dynamics scaling limits mean-field theory convergence analysis

任意形状与尺寸的残差网络：在大尺度极限下的训练动态收敛性 / ResNets of All Shapes and Sizes: Convergence of Training Dynamics in the Large-scale Limit

1️⃣ 一句话总结

这篇论文严格证明了当残差网络的深度、宽度和嵌入维度同时趋于无穷大时，其训练过程会收敛到一个确定的极限，并给出了收敛速度的定量估计，这一理论框架也适用于Transformer等主流架构。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.15059

arXiv 提交日期: 2026-03-16

machine learning model training theory optimization stochastic optimization heavy-tailed noise nonconvex optimization convergence analysis

Muon优化器在重尾噪声下的收敛性：非凸Hölder平滑经验风险最小化 / Muon Converges under Heavy-Tailed Noise: Nonconvex Hölder-Smooth Empirical Risk Minimization

1️⃣ 一句话总结

这篇论文证明了，即使在训练数据噪声呈现‘重尾分布’（即存在极端异常值）的严苛条件下，一种名为Muon的新型优化算法也能稳定地找到神经网络的有效解，并且其收敛速度比传统的小批量随机梯度下降法更快。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.10493

arXiv 提交日期: 2026-03-11

machine learning theory model evaluation intrinsic dimensionality nearest neighbor dimensionality estimation nonparametric estimation convergence analysis

一种通用的内在维度最近邻估计器 / A Universal Nearest-Neighbor Estimator for Intrinsic Dimensionality

1️⃣ 一句话总结

这篇论文提出了一种基于最近邻距离比率的全新方法，能够简单高效且无需依赖数据分布假设地准确估计出高维数据的真实内在维度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.02577

arXiv 提交日期: 2026-03-03

reinforcement learning theory model training temporal difference learning parameter-free convergence analysis step-size schedule markovian sampling

迈向无参数时间差分学习 / Towards Parameter-Free Temporal Difference Learning

1️⃣ 一句话总结

这篇论文提出了一种使用指数步长调度的新方法，让强化学习中的核心算法——时间差分学习——无需依赖难以获取的问题特定参数，就能在理论和实践中都实现高效稳定的收敛。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2604.14017

1️⃣ 一句话总结

arXiv ID: 2604.12811

1️⃣ 一句话总结

arXiv ID: 2604.06926

1️⃣ 一句话总结

arXiv ID: 2604.01606

1️⃣ 一句话总结

arXiv ID: 2603.29128

1️⃣ 一句话总结

arXiv ID: 2603.19040

1️⃣ 一句话总结

arXiv ID: 2603.18168

1️⃣ 一句话总结

arXiv ID: 2603.15059

1️⃣ 一句话总结

arXiv ID: 2603.10493

1️⃣ 一句话总结

arXiv ID: 2603.02577

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2604.14017 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.12811 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.06926 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.01606 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.29128 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.19040 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.18168 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.15059 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.10493 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.02577 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2604.14017

arXiv ID: 2604.12811

arXiv ID: 2604.06926

arXiv ID: 2604.01606

arXiv ID: 2603.29128

arXiv ID: 2603.19040

arXiv ID: 2603.18168

arXiv ID: 2603.15059

arXiv ID: 2603.10493

arXiv ID: 2603.02577