arXiv ID:
2601.19585
arXiv 提交日期: 2026-01-27
LLM增强的强化学习在交互式推荐中提升长期用户满意度 / LLM-Enhanced Reinforcement Learning for Long-Term User Satisfaction in Interactive Recommendation
1️⃣ 一句话总结
这篇论文提出了一种结合大语言模型和强化学习的新方法,通过让大模型规划多样化的内容类别、强化学习负责具体推荐的分层设计,有效解决了传统交互推荐系统内容单一、忽视用户兴趣长期变化的问题,从而显著提升了用户的长期满意度。