arXiv ID:
2604.25895
RLHF标注的三种模型:扩展、证据与权威 / Three Models of RLHF Annotation: Extension, Evidence, and Authority
1️⃣ 一句话总结
本文梳理了基于人类反馈的强化学习(RLHF)中标注数据所扮演的三种不同角色——扩展设计者意图、提供客观证据、或赋予群体代表权威,并指出设计者应根据不同维度选择最合适的模型,而非试图用一个统一流程处理所有标注任务。