arXiv ID:
2605.25749
arXiv 提交日期: 2026-05-25
密集监督生成式重排序方法在推荐系统中的应用 / DeGRe: Dense-supervised Generative Reranking for Recommendation
1️⃣ 一句话总结
本文提出了一种名为DeGRe的生成式重排序框架,通过离线阶段使用“前瞻评估器”探索高质量序列,并将密集的步骤级监督信号蒸馏到轻量级在线生成器中,从而在保持在线推理高效的同时,解决了现有方法中启发式标签偏差和稀疏奖励导致的优化方向模糊问题。