arXiv ID:
2604.04599
arXiv 提交日期: 2026-04-06
LP-GEMM:将布局传播集成到GEMM运算中 / LP-GEMM: Integrating Layout Propagation into GEMM Operations
1️⃣ 一句话总结
这篇论文提出了一种名为LP-GEMM的新方法,通过让连续矩阵乘法运算共享数据的内存排列格式,避免了重复的数据格式转换开销,从而在科学计算和机器学习任务中显著提升了运算速度。