arXiv ID:
2603.22922
arXiv 提交日期: 2026-03-24
质量优于点击:面向冷启动电商查询建议的、基于内在质量的迭代强化学习 / Quality Over Clicks: Intrinsic Quality-Driven Iterative Reinforcement Learning for Cold-Start E-Commerce Query Suggestion
1️⃣ 一句话总结
这篇论文提出了一个名为Cold-EQS的新框架,它通过使用可回答性、事实性和信息增益等内在质量指标作为强化学习的奖励,来持续优化电商对话系统在冷启动场景下的查询建议质量,从而摆脱了对大量点击数据的依赖,并显著提升了在线用户参与度。