arXiv ID:
2605.25850
arXiv 提交日期: 2026-05-25
基于轨迹信息优势重加权的LLM拒答学习 / TIAR: Trajectory-Informed Advantage Reweighting for LLM Abstention Learning
1️⃣ 一句话总结
本文提出了一种名为TIAR的新方法,利用模型生成回答过程中的多条候选轨迹作为置信度信号,动态调整奖励权重,从而更好地训练大语言模型学会在不确定时主动拒答,以有效减少幻觉现象。