arXiv ID:
2603.03820
公平始于状态:为交互式推荐中的分层强化学习净化潜在偏好 / Fairness Begins with State: Purifying Latent Preferences for Hierarchical Reinforcement Learning in Interactive Recommendation
1️⃣ 一句话总结
这篇论文提出了一种新框架,通过去噪技术从有偏的交互数据中还原用户的真实偏好状态,并利用分层强化学习来同时优化推荐的准确性和公平性,从而打破热门物品越推越多的恶性循环。