arXiv ID:
2605.04507
arXiv 提交日期: 2026-05-06
将贝叶斯信念状态蒸馏到语言模型中用于可审计的谈判 / Distilling Bayesian Belief States into Language Models for Auditable Negotiation
1️⃣ 一句话总结
本文提出了一种名为BOND的方法,通过让一个大型语言模型充当贝叶斯教师,实时更新对对手偏好的信念,并将这些信念蒸馏到一个更小的学生模型中,使得谈判AI既能高效决策,又能输出清晰、可检查的信念报告,从而解决了大模型在谈判中信念不透明、难以审计的问题。