🤖 系统
11-30 17:41
📄 论文总结
通过递归潜在空间推理解锁Transformer模型的分布外泛化能力 / Unlocking Out-of-Distribution Generalization in Transformers via Recursive Latent Space Reasoning
1️⃣ 一句话总结
这篇论文提出了一种结合四种新机制的Transformer架构,通过递归推理和潜在空间优化,显著提升了模型在未见数据上的数学推理和泛化能力。