arXiv ID:
2601.21471
arXiv 提交日期: 2026-01-29
利用LLM评审员和有限人工进行最优选项识别 / Best Arm Identification with LLM Judges and Limited Human
1️⃣ 一句话总结
这篇论文提出了一种新算法,在只能有限使用昂贵人工审核的情况下,通过智能结合有偏见的AI(如大语言模型)评分和少量人工反馈,高效且准确地从多个选项中找出最佳选择,解决了传统方法可能选错或资源浪费的问题。