arXiv ID:
2510.14095
arXiv 提交日期: 2025-10-15
通过递归潜在空间推理解锁Transformer模型的分布外泛化能力 / Unlocking Out-of-Distribution Generalization in Transformers via Recursive Latent Space Reasoning
1️⃣ 一句话总结
这篇论文提出了一种结合四种新机制的Transformer架构,通过递归推理和潜在空间优化,显著提升了模型在未见数据上的数学推理和泛化能力。