arXiv ID:
2603.19221
arXiv 提交日期: 2026-03-19
基于排序反馈的在线学习与均衡计算 / Online Learning and Equilibrium Computation with Ranking Feedback
1️⃣ 一句话总结
这篇论文研究了一种新的在线学习场景,其中学习者只能看到不同决策的排名顺序而非具体数值反馈,并设计了在特定条件下能有效学习并最终达成博弈均衡的新算法。