arXiv ID:
2602.10467
arXiv 提交日期: 2026-02-11
基于效用反馈的机制提升大语言模型谈判者的议价能力 / MERIT Feedback Elicits Better Bargaining in LLM Negotiators
1️⃣ 一句话总结
这篇论文提出了一个结合新基准、经济指标和人类偏好数据集的框架,通过提供基于效用的反馈,有效提升了大语言模型在复杂谈判中的策略深度和对手适应性,使其行为更贴近人类偏好。