arXiv ID:
2605.13695
arXiv 提交日期: 2026-05-13
RTLC——研究、教学相长、批判:受费曼学习法启发的三阶段提示范式,无需微调即可提升LLM作为裁判的准确性 / RTLC -- Research, Teach-to-Learn, Critique: A three-stage prompting paradigm inspired by the Feynman Learning Technique that lifts LLM-as-judge accuracy on JudgeBench with no fine-tuning
1️⃣ 一句话总结
本文提出了一种名为RTLC的三阶段提示方法,模拟“先研究、再教自己、最后批判性反思”的学习流程,无需任何额外训练或工具,就能让大语言模型在裁判任务上的准确率大幅提升(如在JudgeBench上提升14个百分点),效果优于传统的多数投票方法。