arXiv ID:
2606.25832
arXiv 提交日期: 2026-06-24
MiniOpt:在有限资源下推理建模并求解通用优化问题 / MiniOpt: Reasoning to Model and Solve General Optimization Problems with Limited Resources
1️⃣ 一句话总结
这篇论文提出了MiniOpt框架,通过强化学习让小型语言模型学会将优化问题先建模成标准形式再自动生成求解代码,并用一种新颖的分级奖励函数来评估建模和求解质量,从而在不依赖大量标注数据和昂贵计算资源的情况下,让仅3B参数的模型在多种优化任务上达到领先的求解准确率。