arXiv ID:
2603.11901
FlexRec:通过强化学习使基于大语言模型的推荐系统适应灵活需求 / FlexRec: Adapting LLM-based Recommenders for Flexible Needs via Reinforcement Learning
1️⃣ 一句话总结
这篇论文提出了一个名为FlexRec的强化学习框架,它通过引入基于因果推理的细粒度奖励和考虑不确定性的奖励缩放机制,成功解决了传统推荐系统难以适应动态、多样化推荐目标的问题,显著提升了基于大语言模型的推荐系统在多种场景下的性能。