arXiv ID:
2603.10473
基于搜索者偏好对齐大语言模型 / Aligning Large Language Models with Searcher Preferences
1️⃣ 一句话总结
这篇论文提出了首个用于开放式生成式搜索的大语言模型SearchLLM,它通过一个分层的多维奖励系统来确保回答的准确性、安全性和对用户需求的匹配,并在实际部署中显著提升了搜索质量和用户参与度。