arXiv ID:
2604.20685
arXiv 提交日期: 2026-04-22
MGDA-Decoupled:基于DPF的大语言模型对齐中的几何感知多目标优化方法 / MGDA-Decoupled: Geometry-Aware Multi-Objective Optimisation for DPO-based LLM Alignment
1️⃣ 一句话总结
本文提出了一种名为MGDA-Decoupled的多目标优化算法,通过在轻量级DPO框架中引入几何信息,平衡大语言模型在有用性、真实性和无害性等多个目标上的对齐效果,从而避免传统固定权重方法对难以优化目标的忽视,实验表明该方法在整体和各目标上均取得了更高胜率。