📄 论文总结
大语言模型中的说服动态:基于DuET-PD框架探究知识与安全维度的鲁棒性与适应性 / Persuasion Dynamics in LLMs: Investigating Robustness and Adaptability in Knowledge and Safety with DuET-PD
1️⃣ 一句话总结
本研究提出DuET-PD评估框架,揭示大语言模型在对话中易受误导信息影响且难以接受正确修正的问题,并通过新型训练方法显著提升了模型对错误信息的抵抗力和对正确信息的接受度。