arXiv ID:
2606.09802
arXiv 提交日期: 2026-06-08
面向高效实验的赌博机算法:自适应控制组、用户偏好与上下文漂移 / Bandits for Efficient Experimentation: Adapting to Control Group, Preferences, and Context Drifts
1️⃣ 一句话总结
本文提出了一种名为Dri-MED的智能算法,能够在用户偏好随时间变化、且每次推荐都必须不低于某个基准策略的情况下,高效地为不同用户群体做出个性化推荐,同时显著减少总体决策失误和违规次数。