arXiv ID:
2605.25459
arXiv 提交日期: 2026-05-25
从模拟到行动:后训练语言模型能够识别并回应自己的生成内容 / From Simulation to Enaction: Post-trained language models recognize and react to their own generations
1️⃣ 一句话总结
这篇论文发现,经过微调等后训练的语言模型(如对话机器人)能够从内部信号中识别出自己生成的文本,并在生成后续内容时表现得更加自信、不确定度更低,而这一能力在预训练模型中并不存在。