arXiv ID:
2603.15189
arXiv 提交日期: 2026-03-16
对决赌博机中孔多塞胜者识别的采样复杂度 / The Sampling Complexity of Condorcet Winner Identification in Dueling Bandits
1️⃣ 一句话总结
这篇论文提出了一种新的识别方法,通过利用所有候选选项之间的两两比较信息,而非仅仅关注胜者与其他选项的比较,显著降低了在随机对决赌博机模型中准确找出最优选项所需的最小样本量,并首次给出了该问题的理论最优样本复杂度界限。