arXiv ID:
2602.08216
arXiv 提交日期: 2026-02-09
Transformer的热力学同构:一种基于拉格朗日方法的注意力动力学研究 / Thermodynamic Isomorphism of Transformers: A Lagrangian Approach to Attention Dynamics
1️⃣ 一句话总结
这篇论文首次从物理学的“最小作用量原理”出发,将Transformer模型中的注意力机制视为一个遵循热力学和信息动力学规律的系统,从而为人工智能的底层机制提供了一个统一的理论框架,并解释了模型训练中的涌现现象。