arXiv ID:
2604.07382
arXiv 提交日期: 2026-04-08
大语言模型中情感表征的潜在结构 / Latent Structure of Affective Representations in Large Language Models
1️⃣ 一句话总结
这项研究通过几何数据分析发现,大语言模型学习到的情感表征在潜在空间中具有与心理学中经典情感模型(如效价-唤醒度)一致的结构,并且这种结构虽然非线性但能被线性近似,这为提升模型的可解释性和安全性提供了实证基础。