arXiv ID:
2512.16615
arXiv 提交日期: 2025-12-18
用于高效扩散变换器的可训练对数线性稀疏注意力机制 / Trainable Log-linear Sparse Attention for Efficient Diffusion Transformers
1️⃣ 一句话总结
这篇论文提出了一种名为LLSA的新型可训练稀疏注意力机制,它通过分层结构将计算复杂度从平方级降低到对数线性级,从而在保持图像生成质量的同时,大幅提升了扩散变换器在处理长序列时的训练和推理效率。