arXiv ID:
2604.25025
基于偏好反馈的贝叶斯优化中汤普森采样的有限时间分析 / A Finite Time Analysis of Thompson Sampling for Bayesian Optimization with Preferential Feedback
1️⃣ 一句话总结
本文提出了一种用于处理偏好反馈(如成对比较而非数值评分)的贝叶斯优化方法,通过结合汤普森采样和一种基于潜在效用差异的单调链接函数来建模比较,并在有限时间分析中证明其性能与标准标量反馈的贝叶斯优化相当,同时在合成数据和真实案例中验证了其有效性。