arXiv ID:
2606.18624
arXiv 提交日期: 2026-06-17
PragReST:面向语用语言理解的自我增强反事实推理框架 / PragReST: Self-Reinforcing Counterfactual Reasoning for Pragmatic Language Understanding
1️⃣ 一句话总结
该论文提出了一种名为PragReST的无监督训练方法,通过自动生成反事实推理数据,让大语言模型学会理解对话中的言外之意,从而在不依赖人工标注或更强模型的情况下,显著提升模型在语用推理任务上的表现,且不影响其通用知识能力。