arXiv ID:
2510.15804
arXiv 提交日期: 2025-10-17
语言模型中线性真值编码的涌现 / Emergence of Linear Truth Encodings in Language Models
1️⃣ 一句话总结
这项研究通过一个简化的模型揭示了语言模型如何通过两阶段学习过程,从数据中自然地形成能够线性区分真假语句的内部表示,从而提升语言建模的准确性。