arXiv ID:
2603.03084
arXiv 提交日期: 2026-03-03
关于Transformer网络对Maxout网络和连续分段线性函数的表达能力研究 / On the Expressive Power of Transformers for Maxout Networks and Continuous Piecewise Linear Functions
1️⃣ 一句话总结
这篇论文证明了Transformer网络在模型复杂度相近的情况下,能够有效逼近Maxout网络和连续分段线性函数,从而继承了ReLU网络的通用逼近能力,并通过分析线性区域的数量定量刻画了其表达能力随深度指数增长的特性。