arXiv ID:
2605.20619
arXiv 提交日期: 2026-05-20
SURF:引导标量化权重以均匀遍历帕累托前沿 / SURF: Steering the Scalarization Weight to Uniformly Traverse the Pareto Front
1️⃣ 一句话总结
本文提出一种名为SURF的方法,通过分析权重变化时帕累托前沿遍历速度不均匀的原因,设计出能根据目标函数分布自动调整权重采样规则的算法,从而让多目标优化产生的解更均匀地覆盖整个最优解范围,并在多目标赌博机、强化学习和大模型对齐等任务中取得更好效果。