arXiv ID:
2603.01960
arXiv 提交日期: 2026-03-02
TiledAttention:一个用于PyTorch的CUDA分块SDPA内核 / TiledAttention: a CUDA Tile SDPA Kernel for PyTorch
1️⃣ 一句话总结
这篇论文介绍了一个名为TiledAttention的、易于修改且性能良好的注意力计算内核,它通过高级Python接口实现了对GPU计算过程的灵活控制,为快速研究和定制化优化提供了便利。