arXiv ID:
2601.21462
arXiv 提交日期: 2026-01-29
部分反馈在线学习 / Partial Feedback Online Learning
1️⃣ 一句话总结
这篇论文研究了在每次学习时只有一个正确答案被揭示、但多个答案都算对的学习场景,提出了新的理论框架来精确刻画在这种‘部分反馈’设定下,确定性和随机性学习算法能达到的最佳性能界限,并揭示了其与更宽松学习设定之间的根本性差异。