arXiv ID:
2602.19317
arXiv 提交日期: 2026-02-22
学习推理以实现个性化问答中个人上下文的多步骤检索 / Learning to Reason for Multi-Step Retrieval of Personal Context in Personalized Question Answering
1️⃣ 一句话总结
这篇论文提出了一个名为PR2的强化学习框架,它通过让AI学习在回答个性化问题时,智能地决定何时、如何从用户个人资料中检索信息并融入推理过程,从而生成更符合用户背景和偏好的答案,显著提升了问答系统的个性化效果。