arXiv ID:
2606.27291
arXiv 提交日期: 2026-06-25
为便携式查询生成设计奖励信号:工业语义化职位搜索案例研究 / Designing Reward Signals for Portable Query Generation: A Case Study in Industrial Semantic Job Search
1️⃣ 一句话总结
本文提出了一种基于AI反馈的强化学习框架,用于在工业职位搜索中自动生成能屏蔽求职者身份信息、保留通用资格条件的搜索关键词,并通过引入规则化的奖励下限来防止AI奖励模型被利用(如直接复制原文),从而显著提升查询质量。