arXiv ID:
2604.21209
arXiv 提交日期: 2026-04-23
将生成式人工智能与人类偏好对齐:一种用于在线评论管理的大型语言模型微调新方法 / Align Generative Artificial Intelligence with Human Preferences: A Novel Large Language Model Fine-Tuning Method for Online Review Management
1️⃣ 一句话总结
本文提出了一种新的偏好微调方法,通过减少模型幻觉、自动构建人类偏好对以及创新性地放松离线策略的过度保守性,使通用大语言模型能更精准地根据领域内人类偏好生成在线评论回复。