arXiv最新AI论文速览速学

🔍

标签: #constrained optimization ✕ 清除筛选

搜索范围：

全部标题和内容仅标签

🏷️ 所有标签

24小时内新更新论文 24h更新 100 72小时内新更新论文 72h更新 100 最新: Constrained Bayesian Experimental Design via Online Planning 05-27

arXiv ID: 2605.26990

arXiv 提交日期: 2026-05-26

machine learning systems bayesian experimental design online planning constrained optimization offline pretraining

基于在线规划的约束贝叶斯实验设计 / Constrained Bayesian Experimental Design via Online Planning

1️⃣ 一句话总结

本文提出一种结合离线预训练与在线多步前瞻规划的新方法，能够在预算、成本或物理限制等动态约束下，高效地优化序列实验设计，相比现有方法能获得信息量更丰富的设计序列，且计算开销仅适度增加。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.20834

arXiv 提交日期: 2026-05-20

llm reinforcement learning dpo rlhf preference optimization alignment constrained optimization

DPO与RLHF的条件等价性：隐含假设、失败模式与可证明的对齐 / Conditional Equivalence of DPO and RLHF: Implicit Assumption, Failure Modes, and Provable Alignment

1️⃣ 一句话总结

本文发现，直接偏好优化（DPO）与基于人类反馈的强化学习（RLHF）并非总是等价的，当RLHF最优策略不偏好人类更喜欢的回答时，DPO会优化错误目标、导致模型选错答案，因此作者提出了带约束的偏好优化方法（CPO），在保持简单的同时实现了可靠的对齐效果。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2605.21107

arXiv 提交日期: 2026-05-20

theory machine learning online convex optimization constrained optimization regret bounds self-contraction strongly convex

通过自收缩性改进约束在线凸优化的性能保证 / Improved Guarantees for Constrained Online Convex Optimization via Self-Contraction

1️⃣ 一句话总结

本文提出了一种简单的基于投影的算法，能够显著降低在线决策问题中违反约束的累积次数，在强凸损失下将此指标从平方根级改进为对数级，同时保持最优的决策后悔度，从而解决了长期存在的性能瓶颈。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.14017

arXiv 提交日期: 2026-04-15

model training machine learning theory stochastic optimization trust-region methods over-parameterized models constrained optimization convergence analysis

面向过参数化模型的随机信赖域方法 / Stochastic Trust-Region Methods for Over-parameterized Models

1️⃣ 一句话总结

本文提出了一种新的随机信赖域优化框架，能够自动调整学习步长，无需手动调参，并在过参数化模型（如深度神经网络）和带等式约束的优化问题上实现了稳定且高效的性能。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.04334

arXiv 提交日期: 2026-04-06

reinforcement learning medical theory distributional rl healthcare optimization algorithm convergence multi-agent fairness constrained optimization

增强型分布强化学习：分析与医疗健康应用 / Boosted Distributional Reinforcement Learning: Analysis and Healthcare Applications

1️⃣ 一句话总结

本文提出了一种增强型分布强化学习算法，它不仅能优化每个个体的结果分布，还能确保相似个体之间的公平可比性，在高血压管理的模拟应用中，相比传统方法显著提升了患者生命质量与治疗一致性。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2604.04987

arXiv 提交日期: 2026-04-05

llm model training systems speculative sampling decoding acceleration constrained optimization auto-regressive models inference efficiency

Cactus：通过约束接受推测采样加速自回归解码 / Cactus: Accelerating Auto-Regressive Decoding with Constrained Acceptance Speculative Sampling

1️⃣ 一句话总结

这篇论文提出了一种名为Cactus的新方法，它通过一个受约束的优化框架来改进推测采样技术，在保证大模型输出质量基本不变的前提下，显著提升了文本生成的速度。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.28046

arXiv 提交日期: 2026-03-30

systems machine learning agents swarm optimization metaheuristic algorithm path planning benchmark evaluation constrained optimization

狗斗搜索：一种基于群体智能的优化算法，用于复杂工程优化与山地地形路径规划 / Dogfight Search: A Swarm-Based Optimization Algorithm for Complex Engineering Optimization and Mountainous Terrain Path Planning

1️⃣ 一句话总结

本文受战斗机协同战术启发，提出了一种名为‘狗斗搜索’的新型高效优化算法，该算法在多种标准测试、实际工程问题及复杂地形路径规划任务中，性能均显著优于其他先进算法。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.23004

arXiv 提交日期: 2026-03-24

llm model evaluation systems constrained optimization optimal power flow reasoning evaluation structured input arithmetic reasoning

大型语言模型能在约束条件下进行推理和优化吗？ / Can Large Language Models Reason and Optimize Under Constraints?

1️⃣ 一句话总结

这篇论文通过测试大型语言模型解决电力系统最优潮流这一复杂的约束优化问题，发现当前最先进的模型在结构化推理和约束处理方面存在显著不足，揭示了它们在应对现实世界工程优化任务时的能力缺陷。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2603.08283

arXiv 提交日期: 2026-03-09

machine learning systems theory physics-informed machine learning constrained optimization polytopic reformulation computational scalability prescriptive optimization

PolyFormer：学习复杂物理约束下可扩展优化的高效重构方法 / PolyFormer: learning efficient reformulations for scalable optimization under complex physical constraints

1️⃣ 一句话总结

这篇论文提出了一种名为PolyFormer的新方法，它能够自动学习并简化复杂物理约束优化问题的数学结构，从而让标准求解器能以前所未有的速度和极低的内存消耗找到高质量的解，极大地提升了解决大规模实际工程优化问题的效率。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv ID: 2601.20983

arXiv 提交日期: 2026-01-28

machine learning theory model training monotone optimization neural networks algorithm-aware learning projection prediction constrained optimization

基于学习投影的单调优化 / Monotone Optimisation with Learned Projections

1️⃣ 一句话总结

这篇论文提出了一种结合机器学习与经典优化算法的新方法，通过训练神经网络直接预测优化过程中的关键投影步骤，从而在函数形式未知、仅有数据的情况下，大幅提升了单调优化问题的求解速度，同时保证了求解质量。

👋 没兴趣 ☆ 感兴趣

📌 待读 PDF

arXiv最新AI论文速览速学

菜单

arXiv ID: 2605.26990

1️⃣ 一句话总结

arXiv ID: 2605.20834

1️⃣ 一句话总结

arXiv ID: 2605.21107

1️⃣ 一句话总结

arXiv ID: 2604.14017

1️⃣ 一句话总结

arXiv ID: 2604.04334

1️⃣ 一句话总结

arXiv ID: 2604.04987

1️⃣ 一句话总结

arXiv ID: 2603.28046

1️⃣ 一句话总结

arXiv ID: 2603.23004

1️⃣ 一句话总结

arXiv ID: 2603.08283

1️⃣ 一句话总结

arXiv ID: 2601.20983

1️⃣ 一句话总结

📄 提交新论文

提交新论文

密码管理

设置密码

修改密码

移除密码

菜单

热门趋势

arXiv ID: 2605.26990 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.20834 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2605.21107 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.14017 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.04334 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2604.04987 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.28046 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.23004 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2603.08283 👀 Abstract

1️⃣ 一句话总结

arXiv ID: 2601.20983 👀 Abstract

1️⃣ 一句话总结

获取最新论文摘要

📄 提交新论文

需要登录

提交新论文

需要登录

arXiv ID: 2605.26990

arXiv ID: 2605.20834

arXiv ID: 2605.21107

arXiv ID: 2604.14017

arXiv ID: 2604.04334

arXiv ID: 2604.04987

arXiv ID: 2603.28046

arXiv ID: 2603.23004

arXiv ID: 2603.08283

arXiv ID: 2601.20983