arXiv最新AI论文速览速学

🔍

标签: #optimization ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 39 72小时内新更新论文 72h更新 139 最新: FiLMMeD: Feature-wise Linear Modulation for Cross-Problem Multi-Depot Vehicle Routing 05-01

arXiv ID: 2602.21276

arXiv 提交日期: 2026-02-24

model training theory machine learning optimization loss landscape stochastic gradient descent quasi-newton generalization

神经网络优化策略与损失函数地形 / Neural network optimization strategies and the topography of the loss landscape

1️⃣ 一句话总结

这篇论文通过对比随机梯度下降和拟牛顿法两种优化算法，发现它们会在神经网络的损失函数地形中找到不同类型的解：随机梯度下降倾向于找到更平坦、泛化性更好的区域，而拟牛顿法则能找到更深但更孤立、泛化性较差的极小值点，从而揭示了优化策略的选择对模型鲁棒性和可迁移性的根本影响。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.19578

arXiv 提交日期: 2026-02-23

machine learning model training data active learning data acquisition influence functions optimization curvature

面向目标的影响力最大化数据采集用于学习与优化 / Goal-Oriented Influence-Maximizing Data Acquisition for Learning and Optimization

1️⃣ 一句话总结

这篇论文提出了一种名为GOIMDA的新型主动数据采集算法，它通过最大化所选数据对用户指定目标（如测试误差或优化器推荐值）的预期影响力来高效选择数据，无需复杂的概率推断，就能在多种学习和优化任务中用更少的样本达到目标性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.16340

arXiv 提交日期: 2026-02-18

theory model training machine learning implicit bias optimization homogeneous networks momentum margin maximization

Adam和Muon优化器在平滑齐次神经网络上的隐式偏好 / The Implicit Bias of Adam and Muon on Smooth Homogeneous Neural Networks

1️⃣ 一句话总结

这篇论文通过理论分析和实验证明，在训练结构特殊的神经网络时，不同的动量优化算法（如Adam、Muon）会隐式地引导模型朝着不同几何意义上的“最优解”收敛，从而影响最终模型的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.15617

arXiv 提交日期: 2026-02-17

systems machine learning model training beamforming wireless communications optimization transformer fairness

基于深度神经网络的可调公平性约束下多用户波束赋形吞吐量最大化研究 / DNN-Enabled Multi-User Beamforming for Throughput Maximization under Adjustable Fairness

1️⃣ 一句话总结

这项研究提出了一种基于无线变换器架构的智能方法，能够根据网络状况自动调整策略，在保证用户间公平性的同时，最大化无线通信系统的总传输速率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.15473

arXiv 提交日期: 2026-02-17

machine learning model training theory optimization meta-learning hyperparameter tuning gradient descent non-convex optimization

POP：基于先验拟合的优化器策略 / POP: Prior-fitted Optimizer Policies

1️⃣ 一句话总结

这篇论文提出了一种名为POP的元学习优化器，它通过从大量合成优化问题中学习，能够自动预测每一步的调整步长，从而在各种复杂函数优化任务中，无需手动调参就显著超越了传统梯度方法和其他先进优化算法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.15277

arXiv 提交日期: 2026-02-17

model training data machine learning dataset distillation optimization large-scale efficiency synthetic data

通过探索-利用优化加速大规模数据集蒸馏 / Accelerating Large-Scale Dataset Distillation via Exploration-Exploitation Optimization

1️⃣ 一句话总结

这篇论文提出了一种名为E^2D的新方法，它通过‘探索-利用’两阶段优化策略，在压缩大规模数据集时，既能保持模型的高精度，又能大幅提升计算效率，解决了现有方法在精度和速度之间难以兼顾的问题。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.11482

arXiv 提交日期: 2026-02-12

machine learning theory inverse problems poisson noise sparse recovery bregman divergence optimization

用于泊松逆问题的两个布雷格曼邻近算子的外分法 / External Division of Two Bregman Proximity Operators for Poisson Inverse Problems

1️⃣ 一句话总结

这篇论文提出了一种新方法，通过引入一种基于两个布雷格曼邻近算子外分的新算子，并将其嵌入现有算法，来更稳定、更准确地从泊松噪声污染的线性模型中恢复稀疏向量，有效减少了传统方法的估计偏差。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.10176

arXiv 提交日期: 2026-02-10

machine learning theory model evaluation performative prediction distribution shift optimization survey stability

剖析表演性预测：一项全面综述 / Dissecting Performative Prediction: A Comprehensive Survey

1️⃣ 一句话总结

这篇综述论文系统梳理了‘表演性预测’这一新兴机器学习领域，其核心是研究模型部署后如何因影响环境而导致数据分布变化，并总结了该领域五年来的关键概念、解决方案及其与其他学科的关联。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.08040

arXiv 提交日期: 2026-02-08

model training machine learning systems continual learning stability-plasticity tradeoff weight reinitialization optimization deep neural networks

FIRE：用于平衡稳定性-可塑性权衡的Frobenius等距重初始化方法 / FIRE: Frobenius-Isometry Reinitialization for Balancing the Stability-Plasticity Tradeoff

1️⃣ 一句话总结

这篇论文提出了一种名为FIRE的新方法，它通过一个数学优化问题来智能地调整神经网络权重，从而在持续学习任务中巧妙地平衡了‘记住旧知识’和‘学习新任务’之间的矛盾，并在图像、语言和强化学习等多个领域取得了更好的效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2602.05371

arXiv 提交日期: 2026-02-05

machine learning theory model training oblique decision trees optimization newton method regression trees universal approximation

铰链回归树：一种用于斜决策树分裂的牛顿方法 / Hinge Regression Tree: A Newton Method for Oblique Regression Tree Splitting

1️⃣ 一句话总结

这篇论文提出了一种名为‘铰链回归树’的新方法，它通过一种高效的牛顿优化算法来训练决策树，让树在保持可解释性的同时，能学习更复杂的斜向分类边界，从而用更小的树结构达到更好的预测效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2602.21276

1️⃣ 一句话总结

arXiv ID: 2602.19578

1️⃣ 一句话总结

arXiv ID: 2602.16340

1️⃣ 一句话总结

arXiv ID: 2602.15617

1️⃣ 一句话总结

arXiv ID: 2602.15473

1️⃣ 一句话总结

arXiv ID: 2602.15277

1️⃣ 一句话总结

arXiv ID: 2602.11482

1️⃣ 一句话总结

arXiv ID: 2602.10176

1️⃣ 一句话总结

arXiv ID: 2602.08040

1️⃣ 一句话总结

arXiv ID: 2602.05371

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2602.21276 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.19578 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.16340 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.15617 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.15473 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.15277 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.11482 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.10176 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.08040 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2602.05371 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2602.21276

arXiv ID: 2602.19578

arXiv ID: 2602.16340

arXiv ID: 2602.15617

arXiv ID: 2602.15473

arXiv ID: 2602.15277

arXiv ID: 2602.11482

arXiv ID: 2602.10176

arXiv ID: 2602.08040

arXiv ID: 2602.05371